【#OpenAI采集超百万小时视频训练GPT4#，视频来自YouTu_

【#OpenAI采集超百万小时视频训练GPT4#，视频来自YouTube】据IT之家消息，《纽约时报》在当地时间4月6日的一篇报道中，详细介绍了一些AI公司在收集高质量数据训练大模型的办法。

报道中提到，OpenAI开发了Whisper音频转录模型来收集训练数据，转录了超过100万小时的YouTube视频来训练其大型语言模型GPT-4。

尽管OpenAI知道这一行为可能在法律上存在问题，但认为这是合理使用。近日，YouTube首席执行官Neal Mohan在采访中表示，虽然没有直接证据表明OpenAI采集YouTube视频来训练Sora，但他警告OpenAI的行为违反了YouTube现行的平台服务条款。

打开凤凰新闻客户端提升3倍流畅度