为了满足对数据的需求,各大模型公司采用了多种 “创意” 方式来获取数据,有的甚至游走在法律边缘。例如,OpenAI 利用网络爬虫广泛抓取网络内容,甚至在抓取过程中清除版权信息;而在高质量文本资源逐渐枯竭后,AI 公司又转向视频和纸书等其他格式的数据,利用技术手段进行提取。数字化转型网www.szhzxw.cn
此外,有些公司甚至选择了直接使用盗版书籍。例如,Meta 在训练 Llama 模型时,就被指控使用来自 “影子图书馆” 的盗版书籍。与此相反,苹果等保守派企业则选择通过合法授权和自有数据来规避法律风险。
在法律诉讼的推进中,版权方的策略逐渐转变,焦点不再是 AI 如何使用数据,而是数据的获取是否合法。法院的裁决表明,虽然 AI 的训练行为可能不构成直接侵权,但盗版资源的使用将受到严厉打击。数字化转型网www.szhzxw.cn
如今,AI 行业面临着一场前所未有的版权战争,如何在法律边缘游走并实现创新,成为了科技巨头们亟需解决的问题。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)鲍勃
