数字化转型网(Professionalism Achieves Leadership 专业造就领导者)人工智能专题
与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入!

本文围绕 DeepSeek 的大模型 R1 展开讨论,驳斥了关于 DeepSeek 的一系列误解。重要亮点
- DeepSeek 的影响力与发展历程:2025 年 1 月,DeepSeek 的 R1 模型引发全球大讨论。DeepSeek 并非突然出现,其个开源模型于 2023 年 11 月发布,一年来持续推出新产品。罗马不是一天建成的,DeepSeek 在人工智能领域发展迅速,拥有出色的团队。
- 训练成本的争议:有人质疑 DeepSeek 训练 R1 的成本,认为其隐瞒真实成本并通过非法途径获取算力。但实际上,550 万美元的成本估算有依据,且未计入强化学习训练的额外成本、小规模实验和研究人员薪资等成本。与其他 AI 前沿实验室相比,这种比较是不公平的。
- 对英伟达的影响:有人认为 DeepSeek 价格便宜,使所有美国 AGI 公司浪费钱且对英伟达不利。但 DeepSeek 在训练效率上高,不意味着拥有更多计算资源是坏事。所有大的 AGI 公司都在押注扩展律,获取更多计算资源是合理举措,且 DeepSeek 的成功与英伟达的地位无关。
- 创新之处:DeepSeek 在语言模型的设计及其训练方式上有许多创新,如 Multi-latent 注意力(MHA)、GRPO 与可验证奖励、DualPipe 等。DeepSeek 完全开源并详细记录了这些创新,让每个人都能受益。
- 是否从 ChatGPT 吸取知识的争议:OpenAI 声称 DeepSeek 从 ChatGPT 吸取知识,但缺乏证据。如果 DeepSeek 使用了来自其他来源的数据,这种形式的训练不违反服务条款。DeepSeek 的成就不应被忽视,其在工程、效率和架构创新方面有实际成果。
- 中美 AI 竞争态势:在 AI 领域一直有竞争力,DeepSeek 的出现让不容忽视。封闭技术是否能带来显著优势尚不明确,美国的前沿 AI 实验室和都将在 AI 上投入大量资金,竞争正在加剧。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导
