DeepSeek:低成本、高性能的 AI 新突破
在科技飞速发展的当下,AI 领域备受关注。2025 年 1 月,中国 AI 初创公司 DeepSeek 发布推理模型 DeepSeek-R1,以低成本、高性能特性,为 AI 发展带来新变化。
DeepSeek-R1 仅花费 600 万美元,使用约 2000 块英伟达 H800 芯片完成训练,成本远低于 OpenAI 等巨头。性能上,它在数学、代码和自然语言推理任务中,与 OpenAI 的 o1 模型相当,部分基准测试更实现超越。这得益于其创新的训练方法,R1 采用强化学习技术,通过多阶段循环训练提升推理能力,且只需少量标注数据就能高效训练,大大降低成本。
DeepSeek-R1 遵循 MIT 协议开源,开发者可自由使用、修改和商用。同时发布的多个蒸馏小模型,推理能力超越原始的 Qwen 和 Llama 模型,展示了 R1 推理模式的高效迁移性。这不仅降低技术门槛,促进全球开发者协作,也为中小企业和开发者提供更多发展机会。
DeepSeek-R1 的发布在科技领域引发震动。英伟达、ASML 等芯片巨头股价下跌,市场重新审视 AI 芯片需求的高估值。微软、谷歌等对 DeepSeek 高度评价,也引发全球对美国 AI 主导地位的反思。
DeepSeek-R1 的成功表明,即使资源有限,依靠技术创新和开源协作,也能开发出高性能 AI 模型。未来,DeepSeek 计划优化模型通用能力,探索多模态、长文本处理等领域应用,持续推动全球 AI 生态发展。我们相信,DeepSeek 将引领 AI 领域变革,推动全球 AI 技术迈向新高度。