业界人士称百度画图AI训练素材非套壳,采用英文开源图片素材

站长之家 3月23日 消息:今日,针对部分网友有关“文心一言文生图功能”的反馈,百度官方回应称,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。“在大模型训练中,我们使用的是互联网公开数据,符合行业惯例。大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。”

对此,亚洲视觉科技研发总监陈经表示,对于百度文心一言的文生图功能是套壳的质疑,百度的画图AI采用了英文标注的开源图片素材进行训练,因此需要中翻英来当prompt(提示词)。

百度,搜索 (3)

目前,全球AI研发有开源的传统,特别是训练数据库,不然收集图片效率太低了。而且图片是要标注的,这更加大了收集整理图片的难度。当前也有中文标准的训练数据,但是少很多。

陈经分析称,“由于发布时间仓促,百度对于画图AI的中文输入词还没完全搞定,后续应该会根据用户反馈,把中文的提示词与英文的训练素材更好对应上。”

打开APP阅读更多精彩内容