哈佛大学、谷歌发布100万本公共领域书籍,为ai训练提供合法数据

品玩12月13日讯,据 TechCrunch 报道,哈佛大学与谷歌宣布,联合发布100 万本公共领域书籍作为 AI 训练数据集。

AI 训练所需的数据成本高昂,但却更适合资金充裕的科技公司。因此,哈佛大学计划发布一个包含约 100 万本公共领域书籍的数据集,这些书籍覆盖多种类型、语言和作者,包括已不再受版权保护的经典作家如狄更斯、但丁和莎士比亚等,因这些作品的版权已随时间过期。

新数据集尚未公开,也不公布具体的发布方式和时间。

打开APP阅读更多精彩内容