在全球人工智能芯片竞争日益激烈的背景下,初创芯片公司Positron正式发布了其新的人工智能推理芯片Asimov。公司声称,这款深度优化用于大型模型(LLM)推理的芯片,预计将实现英伟达下一代Rubin架构的五倍能效(每瓦代币数)和性价比(每美元代币数)的五倍。这一大胆数据立即引起了业界广泛关注。
Positron的核心逻辑在于对传统GPU架构的“减法”重新定义。Asimov芯片摒弃了传统计算卡中复杂的控制电路,转而采用更纯粹的张量处理架构,旨在最小化非计算阶段的能量损失。这种设计不仅让Asimov在运行同比例模型时能更省电,还显著降低了芯片的制造和封装成本。Positron团队强调,鉴于当前数据中心严格的功率限制,这种极高的能效将成为企业部署AI服务的关键因素。
尽管阿西莫夫展现了令人印象深刻的理论数据,但挑战英伟达的市场地位并非易事。目前,Positron 正在构建一个支持的编译器和开发生态系统,以确保开发者能够无缝迁移现有的 PyTorch 或 TensorFlow 模型。Asimov芯片计划采用先进的工艺技术,并针对当前主流变压器架构进行了硬件优化,确保处理万亿参数模型时实现高吞吐量和低延迟。
Positron的加入代表了AI芯片领域从“通用计算能力”向“专门推理”转变的趋势。如果阿西莫夫能够兑现其性能提升五倍的承诺,它有望彻底重塑大型模型推理市场的成本格局。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
