逃避图书版权, OpenAI为省钱删掉10万本书数据

Android社区 收藏文章

5月8日,最新解封的法庭文件显示,OpenAI删除了两个名为“图书1”(books1)和“图书2”(books2)的庞大数据集,这些数据集曾用于训练其GPT-3人工智能(AI)模型。

这些文件来自美国作家协会对OpenAI提起的集体诉讼。美国作家协会的律师在法庭文件中表示,这些数据集很可能包含“10万多本已出版书籍”,是该协会指控OpenAI使用受版权保护的材料来训练AI模型的关键。

几个月来,美国作家协会一直寻求从OpenAI获得有关这些数据集的信息。法律文件显示,OpenAI最初以保密为由拒绝提供这些数据集的下落,但最终披露已删除所有数据副本。

高质量的训练数据是强大AI模型的重要组成部分。目前,这些AI模型正在席卷科技界。OpenAI和其他公司使用互联网数据来建立这些模型,其中包括许多书籍。许多创造这些数据的公司认为,他们为新的AI产品提供了训练数据,需要获得报酬。但是,科技公司不想被迫付费。这一争执已经引发了多起官司。

相关标签
 相关文章
王慧文病休53天,旗下OneFlow团队重新创业 9月以前  |  1次阅读
智己CEO现场怒怼!不满LS6和小鹏G6当对手 9月以前  |  1次阅读
董明珠回应落榜世界500强:总比爆雷的世界500强好 9月以前  |  1次阅读
阿里云上线 AI 视频生成工具 Live Portait:可一键让照片开口说话 9月以前  |  78次阅读
妙鸭相机将并入神力视界,阿里大文娱CTO郑勇:不是“搬家”是“回家” 9月以前  |  85次阅读
特斯拉上海超级工厂约40秒下线一台车,零部件本土化率超95% 9月以前  |  69次阅读
宁德时代发布神行超充电池,可实现充电10分钟行驶800里 9月以前  |  71次阅读
中科院博士被骗到缅甸已一年!女友:他负债几万,家里条件一般,以为去当翻译 9月以前  |  85次阅读
小鹏汽车否认收购玛莎拉蒂传闻:系谣言 9月以前  |  63次阅读
联想二季度净利润猛降66%,股价应声跳水 9月以前  |  80次阅读
业内人士:视觉中国对不同侵权主体采用差异化策略,老客由销售沟通新客发律师函 9月以前  |  70次阅读
恒大集团在美国申请破产保护 9月以前  |  56次阅读
劳斯莱斯首款纯电轿跑将在北美亮相 9月以前  |  89次阅读
realme印度前CEO确认加盟荣耀,即将推出手机新品 9月以前  |  88次阅读
OpenAI正在测试内容审核系统,一天可以完成六个月的工作 9月以前  |  80次阅读
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出 9月以前  |  77次阅读
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购 9月以前  |  80次阅读
海口规定:电动汽车充电服务费不得超过0.65元每度 9月以前  |  80次阅读
波音任命柳青为波音中国总裁 9月以前  |  88次阅读
业内人士谈图片复杂代理链:图片代理商越多摄影师分成越少 9月以前  |  67次阅读

扫一扫

在手机上阅读