一文看懂 2025 大模型最新排名,谁才是真正的 “潜力股”?
2025 年,大模型领域发展迅猛,各模型不断推陈出新。全球知名的 AI 模型评测平台 Chatbot Arena 公布的最新榜单,为我们了解大模型实力提供了重要参考。
从榜单来看,阿里的 Qwen2.5-Max 表现十分亮眼,以 1332 分排在全球第七名 。它采用超大规模 MoE 架构,基于超过 20 万亿 token 的预训练数据训练,在数学和编程等单项能力排名第一,硬提示方面位居第二。这意味着它在处理复杂技术问题时有着强大的实力,在技术领域的应用潜力巨大。
DeepSeek 也不容小觑,旗下的 DeepSeek-V3 和 DeepSeek-R1 引发广泛关注。DeepSeek-V3 采用 6710 亿参数的 MoE 架构,每秒能处理 60 个 token ,速度优势明显。DeepSeek-R1 是通过强化学习训练的推理模型,训练成本仅 557.6 万美元,且使用 H800 GPU ,在成本控制上表现出色。其在推理能力上有独特之处,在 AIME 2024 中通过率达 79.8% ,MATH-500 中获 97.3% 高分 ,在推理相关的应用场景中,有着很大的发展空间。
除了上述模型,智谱 AI 的 GLM-4-Plus-0111 等也跻身前十。那么谁才是真正的潜力股呢?从目前趋势看,Qwen2.5-Max 凭借其在技术领域的领先能力,若能进一步拓展应用场景,有望持续突破。DeepSeek-R1 凭借低成本和高推理能力,若能完善商业生态,加强与各行业合作,也将在市场上占据更大份额。而其他上榜模型,也都在各自优势领域不断深耕,未来大模型领域的竞争依旧充满变数,究竟谁能脱颖而出,成为真正的潜力股,还需持续关注各模型在技术创新、应用拓展和商业落地等方面的表现。