数字化转型网人工智能专题
与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入!


Meta Platforms公司(META.O)周二发布了最大版本的Llama 3人工智能模型,该模型大部分免费,拥有多语言技能和一般性能指标,与OpenAI等竞争对手的付费模型相比毫不逊色。
Facebook 母公司在博客文章和一份研究论文中宣布,新的 Llama 3 模型可以用八种语言对话,编写更高质量的计算机代码,并能解决比以前版本更复杂的数学问题。
它拥有 4050 亿个参数(即算法在生成对用户查询的回复时所考虑的变量),与去年发布的前一版本相比相差甚远,但仍小于竞争对手提供的领先模型。
相比之下,OpenAI 的 GPT-4 模型据说有一万亿个参数。亚马逊也正在准备一个有两万亿个参数的模型。
首席执行官马克·扎克伯格(Mark Zuckerberg)在多个渠道推广 Llama 3 时说道,他预计未来的 Llama 模型将在明年超越竞争对手的专有模型。他说,由这些模型驱动的Meta人工智能聊天机器人有望在今年年底前成为最受欢迎的人工智能助手,目前已有数亿人在使用它。
在这一消息发布之际,科技公司正在竞相证明,它们不断增长的资源消耗型大型语言模型组合,能够在高级推理等已知问题领域带来足够显著的收益,从而证明在这些模型上投入的巨额资金是值得的。
Meta 的顶级人工智能科学家曾表示,他认为这些模型在推理方面会遇到限制,需要其他类型的人工智能系统才能取得突破。 数字化转型网www.szhzxw.cn
除了其旗舰产品 4050 亿参数模型外,Meta 还发布了最初于春季推出的重量更轻的 80 亿参数和 700 亿参数 Llama 3 模型的更新版本。
Meta 的生成式人工智能主管 Ahmad Al-Dahle 说道:“所有三个新模型都是多语种的,可以通过扩大的 “上下文窗口 ”处理更大的用户请求,这将特别改善生成计算机代码的体验。”
Ahmad Al-Dahle 在接受路透社采访时说:“这是我们从社区得到的首要反馈。” 他指出,更大的上下文窗口为模型提供了类似于更长的内存,有助于处理多步骤请求。
另外,Ahmad Al-Dahle 还表示,他的团队已经能够通过使用人工智能生成一些数据来提高 Llama 3 模型在解决数学问题等任务上的性能。
扎克伯格表示,这一战略将带来创新产品、减少对潜在竞争对手的依赖以及提高公司核心社交网络的参与度。不过,一些投资者对由此产生的成本表示担忧。
如果开发者选择使用其免费模式而非付费模式,公司也将从中受益,这将削弱竞争对手的商业模式。Meta公司在发布公告时强调了其在关键数学和知识测试中取得的成果,这可能会使这一前景更具吸引力。
虽然衡量人工智能发展的进展非常困难,但 Meta 提供的测试结果似乎表明,其最大的 Llama 3 模型几乎与 Anthropic 的 Claude 3.5 Sonnet 和 OpenAI 的 GPT-4o 不相上下,而后者被广泛认为是市场上最强大的两个前沿模型。 数字化转型网www.szhzxw.cn
例如,在竞赛级数学单词问题的 MATH 基准测试中,Meta 的模型获得了 73.8 分,而 GPT-4o 为 76.6 分,Claude 3.5 Sonnet 为 71.1 分。
该模型在 MMLU(涵盖数学、科学和人文社科等数十个学科的基准测试)中的得分是 88.6,而 GPT-4o 的得分是 88.7,Claude 3.5 Sonnet 的得分是 88.3。
在论文中,Meta 的研究人员还预告了即将于今年晚些时候推出的 “多模态 ”模型版本,该版本在核心 Llama 3 文本模型的基础上增加了图像、视频和语音功能。
他们说,早期实验表明,这些模型的性能可以与谷歌的 Gemini 1.5 和 Anthropic 的 Claude 3.5 Sonnet 等其他多模态模型相媲美。 数字化转型网www.szhzxw.cn
数字化转型网人工智能专题
与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入! 数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于PTG品牌顾问咨询;编辑/翻译:数字化转型网宁檬树。




