数智化转型网szhzxw.cn 人工智能资讯 ​人工智能资讯|苹果推出全新 FS-DFM 模型,AI 长文本写作效率提升128倍!

​人工智能资讯|苹果推出全新 FS-DFM 模型,AI 长文本写作效率提升128倍!

苹果公司与俄亥俄州立大学研究团队联合发布的 FS-DFM(Few-Step Discrete Flow-Matching)模型。这一创新的语言模型在长文本生成方面表现出色,仅需8轮快速迭代,便可生成与传统模型上千轮迭代相媲美的文本质量。同时,它的写入速度可提高最多128倍,打破了以往长文本生成的效率瓶颈。

FS-DFM 模型的设计理念与主流的语言模型有所不同。以 ChatGPT 为代表的自回归模型是逐字生成文本,每个字的生成都依赖于前面的内容。而扩散模型则采用并行策略,一次性生成多个字,通过多轮迭代逐步优化最终结果。FS-DFM 在扩散模型的基础上进行了进一步简化,目标是用更少的步骤实现高质量文本的生成。数字化转型网(www.szhzxw.cn)

为了实现这一突破,苹果研究团队提出了一套精妙的三步法。首先,模型经过专门训练,可以灵活适应不同的精炼迭代次数。其次,他们引入了一个 “教师” 模型进行引导,确保每轮迭代中的更新既大幅又精准,从而避免过度调整的问题。最后,团队优化了迭代机制,使得模型能够以更少且更加稳健的步骤生成最终文本。数字化转型网(www.szhzxw.cn)

在性能评估中,FS-DFM 还对比了参数量为70亿的 Dream 模型和80亿的 LLaDA 模型。测试结果显示,即使 FS-DFM 的参数量仅为1.7亿至17亿,其在文本生成的困惑度(越低越好,衡量文本的准确与流畅性)和熵(衡量模型选词信心的指标)上,表现出更低的困惑度和更稳定的熵。这一成绩证明了 FS-DFM 模型在 AI 长文本写作领域的潜力。数字化转型网(www.szhzxw.cn)

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)Nick

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/98043.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部