一文看懂 2025 大模型最新排名，谁才是真正的 “潜力股”？

Posted by runca

On 2025年2月10日

已关闭评论

2025 年，大模型领域发展迅猛，各模型不断推陈出新。全球知名的 AI 模型评测平台 Chatbot Arena 公布的最新榜单，为我们了解大模型实力提供了重要参考。

从榜单来看，阿里的 Qwen2.5-Max 表现十分亮眼，以 1332 分排在全球第七名。它采用超大规模 MoE 架构，基于超过 20 万亿 token 的预训练数据训练，在数学和编程等单项能力排名第一，硬提示方面位居第二。这意味着它在处理复杂技术问题时有着强大的实力，在技术领域的应用潜力巨大。

DeepSeek 也不容小觑，旗下的 DeepSeek-V3 和 DeepSeek-R1 引发广泛关注。DeepSeek-V3 采用 6710 亿参数的 MoE 架构，每秒能处理 60 个 token ，速度优势明显。DeepSeek-R1 是通过强化学习训练的推理模型，训练成本仅 557.6 万美元，且使用 H800 GPU ，在成本控制上表现出色。其在推理能力上有独特之处，在 AIME 2024 中通过率达 79.8% ，MATH-500 中获 97.3% 高分，在推理相关的应用场景中，有着很大的发展空间。

除了上述模型，智谱 AI 的 GLM-4-Plus-0111 等也跻身前十。那么谁才是真正的潜力股呢？从目前趋势看，Qwen2.5-Max 凭借其在技术领域的领先能力，若能进一步拓展应用场景，有望持续突破。DeepSeek-R1 凭借低成本和高推理能力，若能完善商业生态，加强与各行业合作，也将在市场上占据更大份额。而其他上榜模型，也都在各自优势领域不断深耕，未来大模型领域的竞争依旧充满变数，究竟谁能脱颖而出，成为真正的潜力股，还需持续关注各模型在技术创新、应用拓展和商业落地等方面的表现。

一文看懂 2025 大模型最新排名，谁才是真正的 “潜力股”？

咨询服务热线

支付与服务

阿里云折扣获取

支付与服务