印度人工智能领域出现了一颗冉冉升起的新星。由169PI公司发布的大型模型Alpie在多个国际主流AI排名中表现出色,甚至在某些数学和软件工程指标上超过了GPT-4o和Claude3.5,因此在业内被誉为“印度的DeepSeek”。
尽管阿尔皮是一个只有320亿参数的小尺度模型,但其实际测试数据令人震惊。在衡量数学能力的GSM8K排名中,其性能不仅超过了DeepSeek V3,还与GPT-4o持平。在评估软件工程能力的SWE排名中,它表现优于Claude3.5等顶级模型,展现了强大的逻辑处理能力。
然而,这份令人印象深刻的成绩表也引发了不少争议。技术分析显示,Alpie并非完全由印度团队从零开始训练,而是基于中国开源模型DeepSeek-R1-Distill-Qwen-32B的次级开发。换句话说,它是将“提纯与量化”应用于中国开源基模型的产物。
尽管它被批评为“空壳”,但阿尔皮具有显著的商业价值。通过4位量化技术,该型号显著降低了入门门槛,显存使用率降低了75%,并且可以在配备16-24GB内存的消费级GPU上流畅运行。这种“高性价比”方法使其推理成本仅为GPT-4o的十分之一,为中小型开发者提供了极具竞争力的选择。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
