数智化转型网szhzxw.cn 人工智能资讯 人工智能资讯|AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注

人工智能资讯|AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注

随着人工智能(AI)行业面临日益严峻的版权问题,尤其是在 Anthropic 与版权方达成15亿美元和解后,许多企业开始重视其训练数据的合法性。目前,有多达40起未授权数据使用的诉讼案正在进行中,其中包括一起因 Midjourney 制作超人形象而被起诉的案件。

在没有有效的授权体系的情况下,AI 公司可能面临大规模的版权诉讼,这让行业前景堪忧。为了应对这一挑战,一群技术专家和网络出版商联合推出了一项名为 Real Simple Licensing(RSL)的新系统,旨在实现大规模的数据授权。该系统已经得到了 Reddit、Quora 和 Yahoo 等大型网络出版商的支持,但行业内能否形成合力,吸引主要的 AI 实验室参与仍然是个未知数。

RSL 的联合创始人 Eckart Walther 表示,他们的目标是创建一个可以在互联网上广泛应用的训练数据授权体系。他指出,“我们需要为互联网提供机器可读的许可协议,而 RSL 正是解决这一问题的工具。”

多年来,诸如数据提供者联盟等组织一直在推动更清晰的数据采集实践,但 RSL 是第一个旨在提供实际技术和法律基础设施的尝试。技术上,RSL 协议定义了出版商可以为其内容设定的具体许可条款,这包括 AI 公司是否需要定制许可或采用知识共享(Creative Commons)条款。参与的网页将把条款纳入其 “robots.txt” 文件,以便轻松识别哪些数据受哪些条款保护。

在法律层面,RSL 团队建立了一个名为 RSL Collective 的集体许可组织,旨在为出版商谈判条款并收取版税,类似于音乐行业的 ASCAP 或电影行业的 MPLC。目前,已经有许多知名出版商加入了这一集体,包括 Yahoo、Reddit 和 Medium 等。

尽管如此,确定 AI 模型具体使用哪些训练数据以计算版税的挑战依然存在。对于实时获取网络数据的产品,如谷歌的 AI 搜索摘要,数据使用的追踪相对简单,但如果训练过程未被记录,确认特定文档是否被某个大语言模型(LLM)使用就变得困难重重。

尽管存在这些挑战,RSL 的创建者们相信 AI 公司能够应对。“他们在之前的某些授权协议中已经需要能够报告数据使用情况,因此这并不是不可能的,”RSL 的另一位联合创始人 Doug Leeds 表示。“只要足够好,就能让人们得到应有的报酬。”

最后,RSL 的未来能否成功,关键在于 AI 公司是否愿意接受这一新体系。随着越来越多的 AI 行业领袖呼吁建立这样的系统,RSL 团队希望他们能够信守承诺。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)萍水

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/93387.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部