DeepSeek：低成本、高性能的 AI 新突破

Posted by runca

On 2025年2月7日

已关闭评论

在科技飞速发展的当下，AI 领域备受关注。2025 年 1 月，中国 AI 初创公司 DeepSeek 发布推理模型 DeepSeek-R1，以低成本、高性能特性，为 AI 发展带来新变化。

DeepSeek-R1 仅花费 600 万美元，使用约 2000 块英伟达 H800 芯片完成训练，成本远低于 OpenAI 等巨头。性能上，它在数学、代码和自然语言推理任务中，与 OpenAI 的 o1 模型相当，部分基准测试更实现超越。这得益于其创新的训练方法，R1 采用强化学习技术，通过多阶段循环训练提升推理能力，且只需少量标注数据就能高效训练，大大降低成本。

DeepSeek-R1 遵循 MIT 协议开源，开发者可自由使用、修改和商用。同时发布的多个蒸馏小模型，推理能力超越原始的 Qwen 和 Llama 模型，展示了 R1 推理模式的高效迁移性。这不仅降低技术门槛，促进全球开发者协作，也为中小企业和开发者提供更多发展机会。

DeepSeek-R1 的发布在科技领域引发震动。英伟达、ASML 等芯片巨头股价下跌，市场重新审视 AI 芯片需求的高估值。微软、谷歌等对 DeepSeek 高度评价，也引发全球对美国 AI 主导地位的反思。

DeepSeek-R1 的成功表明，即使资源有限，依靠技术创新和开源协作，也能开发出高性能 AI 模型。未来，DeepSeek 计划优化模型通用能力，探索多模态、长文本处理等领域应用，持续推动全球 AI 生态发展。我们相信，DeepSeek 将引领 AI 领域变革，推动全球 AI 技术迈向新高度。

DeepSeek：低成本、高性能的 AI 新突破

咨询服务热线

支付与服务

阿里云折扣获取

支付与服务