数智化转型网szhzxw.cn 数字化转型网专题栏目 人工智能资讯|DeepSeek国产ai大模型崛起,一文带你看懂!

人工智能资讯|DeepSeek国产ai大模型崛起,一文带你看懂!

数字化转型网(Professionalism Achieves Leadership 专业造就领导者)人工智能专题

与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入!

这个春节,中国人工智能大模型DeepSeek引发巨大关注。

DeepSeek是一款由中国深度求索人工智能公司研发的大型语言模型,这家鲜为人知的创新型公司2023年7月17日才正式成立,2024年开始陆续发布DeepSeek系列模型。

2025年1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

同日,1月27日,受到DeepSeek冲击,导致美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。    DeepSeek为什么影响如此巨大!

一、 DeepSeek国产ai大模型崛起     

    DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。

    我们都知道“国产”的魅力真的足以让每一个中国人骄傲。

    首先DeepSeek的员工规模不及OpenAI的1/5,不足百人出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,团队成员都是中国人,甚至有应届生等。真正的国产!

    它的崛起也引起了国外的恐慌,DeepSeek登顶下载排行榜第二天,就遭遇了来自美国IP地址的持续网络攻击,并且在随后几天,攻击量暴增百倍。这便有了春节期间“红客”们的逆向狩猎,打响网络保卫战第一枪! 

    (图片来源于网络)

    当14亿中国人沉浸在年夜饭的温馨时刻,一场每秒2.3亿次量子暴击的”数字核战争”在杭州悄然爆发!在大年初二凌晨,苏州某民居地下室内,中国红客联盟代号“青龙”的成员构建了镜像系统,设置了伪装成核心数据库的“蜜罐”,成功捕获了12批攻击者。这些攻击者来自立陶宛和巴西,他们试图窃取DeepSeek即将发布的“意识流”代码框架,这项技术被西方视为打破ChatGPT垄断的关键‌。

    他们害怕的从来不是某个模型,而是中国即将构建的智能生态。

    二、 DeepSeek的横空出世冲破美西方对华技术的围堵     

    与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其R1模型训练成本仅560万美元,远低于美国科技巨头动辄数亿乃至数十亿美元的投入。

    相比于堆砌芯片的传统做法,这是DeepSeek对于人工智能最重要的创新性贡献之一,也是在美国芯片封锁的大背景下取得的重大突破,是我国在AI人工智能科技领域的重大进步。成本价格低廉,性能与OpenAI相当,围堵不但没能压制中国智造,反而加速了中国科技的突破,让硅谷震惊。

    DeepSeek的技术特点包括使用数据蒸馏技术,能够提取出更为精炼、有用的数据。

    从整个AI大模型产业来看,DeepSeek的成功或许代表了一种全新的发展方向,就是通过算法优化而非单纯依赖算力和数据量来提升模型性能

    三、 开源:未来的发展方向 

不到2年时间,DeepSeek发布的模型从V2、V2.5、V3到R1

  • 2024年5月7日,DeepSeek发布了MoE架构的DeepSeek V2。
  • 2024年9月5日,DeepSeek 官方更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型
  • 2024年12月26日晚,正式上线DeepSeek-V3首个版本并同步开源。
  • 2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。
  • 2025年1月20日,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

我们来看下DeepSeek v3横向的对比:

根据官方的介绍,训练成本为 557.6万美元,远低于 GPT-4o 、Claude等闭源模型的 1亿美元。该模型在多项评测中超越对手,例如如 Qwen 和 Llama 等顶尖开源模型。不仅如此,相较于GPT-4o、Claude等闭源模型,DeepSeek的成本和开源特性让开发者们更容易接触并使用。

    综合评估结果显示,DeepSeek V3的表现超越了其他开源模型,并达到了与领先闭源模型相媲美的水平。

    而R1的成功更是削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。原来不需要烧钱购置大量芯片也能训练出强大的模型。这一方向也为AI大模型产业的发展提供了新的思路。    DeepSeek采用了完全开源策略,不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,推动了AI技术的发展。    DeepSeek是中国科技界带给美国的苦涩教训。中国(科技界)在以更低的成本、更快的速度和更强的实力赶上。一起期待它的发展吧!

声明:本文来自一只IT攻城狮,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于一只IT攻城狮;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然。

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/76369.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部