最近,IBM推出了四款新的Granite4.0Nano型号,其参数大小从350万到15亿不等,展示了该公司在人工智能领域对效率和可访问性的重视。与业内一般依赖云计算的大模型不同,Granite4.0Nano 模型可以在普通笔记本电脑上运行,甚至可以在浏览器中本地运行。这允许开发人员在不依赖云服务的情况下为消费类硬件或边缘设备构建应用程序。
所有 Granite4.0Nano 模型均在 Apache 2.0 许可下发布,适用于研究人员、企业和独立开发者,并支持商业使用。这些模型与 llama.cpp、vLLM 和 MLX 等各种工具兼容,并已通过 ISO42001 负责任的 AI 开发认证。
Granite4.0Nano 系列包括四个型号:Granite-4.0-H-1B(约 1.5 亿个参数)、Granite-4.0-H-350M(约 350 万个参数)、Granite-4.0-1B(具有近 2 亿个参数的变体)和 Granite-4.0-350M(一个变体)。H 系列型号采用混合状态空间架构,适用于低延迟边缘环境,而标准 Transformer 型号则提供更广泛的兼容性。
尽管市场上有许多小型语言模型,但 IBM 的 Nano 系列因其卓越的性能而脱颖而出。最近的基准测试表明,Granite4.0 型号在多个领域的表现优于竞争对手。IBM的研究团队表示,这些模型在指令跟随和函数调用任务方面表现出色,在内存需求和运行时速度方面具有优势,使其能够在移动设备或CPU上流畅运行。
值得注意的是,IBM 不仅发布了这些模型,还积极与开发者社区互动,收集反馈,并讨论未来的开发计划。Granite 团队在 Reddit 上与用户进行了交流,展示了该公司在推动开源人工智能开发方面所做的努力。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
