今年以来,国内外各家科技厂商动作很快啊,纷纷推出 AI “小玩具”。
其中,百度搞的文心一言,昨天推出内测专用 App(安卓版),今天又马不停蹄,交了份「满月成绩单」。
犹记起,它刚开放内测时,机哥截了个图:等待预约体验的已经超过百万人。
在这一个月中,大家有去 调戏 试玩一下这个模型吗?玩起来感觉怎么样?
至于怎么玩,就类似于跟 AI 人机互动。
你可以向它发出指令,或者提出问题,让文心一言给你交份答卷。
在文心一言上线后的这个月里,机哥确实有种看孩子长大的心情。
从刚开始被众人发现 AI 回答出啼笑皆非的结果,到现在号称“已完成 4 次技术迭代”,文心一言有肉眼可见进步。
在发布会中,百度提到,人工智能时代,在技术层面,发生了「根本性变化」。
但网友们试用过它的 AI 绘画功能后,根本就是笑喷了。。
还好,一个个问题被揪出来之后,文心一言迅速做出了改变。
下面来看看前后对比:
跟美食相爱相杀
文心一言刚上线时,被广为吐槽的是它对美食的理解程度。
果然,网友人均吃货啊。
举个例子,红烧狮子头,作为淮扬名菜,色香味俱全,看着都馋。
就馋这口的网友,让 AI 画名菜时,却出现了......
红,是红了;狮子头,确实也是个狮子头。
可惜,就不是红烧狮子头。。
下一道,驴肉火烧。
饼皮酥脆,肉质鲜美。啊~真香。
在当时 AI 的理解中,驴肉火烧长这样。
驴有了,火有了,难道驴看着火在烧自己吗??
细思恐极。。
我们再来尝一道酸甜口的吧,松鼠鲫鱼,以独特造型闻名。
可到了 AI 那儿,变得有点辣眼睛。
其实 AI 是很听话了,把「盘」都画了出来,不漏一个细节,我哭死。
真正让机哥破防的,是广府名菜的诞生。
干炒牛河跟烧麦,早茶常客,被搞成什么奇幻画风,救命。
AI 不知道怎么理解干炒两个字的,虽说画面里是完整一头牛,但却把肉的纹理都画了出来,多少有点诡异。
如果硬要按照 AI 前面的逻辑,那你干炒牛河的「河」,也没画出来呀。
唉,还是点一碟现实中的干炒牛河,用热腾腾的镬气来抚慰机哥受伤的双眼吧。
无鸡不成宴,AI 终于是对包含鸡肉的名菜下手了。。
隔壁孩子不会想到,自己有一天不会为了可乐鸡翅而嘴馋,原因是 AI 画得太离谱。
再试试叫花鸡、三杯鸡,通通翻车。
国画讲究写意,西洋画讲究写形,而百度 AI 作画讲的是抠字眼?
最经典案例来了:
世间 N 大未解之谜中,老婆饼究竟有没有老婆的问题,AI 给出了答案。
老婆,和老婆婆,一字之差,给我整不会了。
要是嫌上图中老婆婆表情太严肃,还有网友被随机到了和蔼可亲版的。
美中不足是,画中背景不能细看,看了会发怵。
事已至此,网友们顺势而为,尝试输入:
美丽的老婆饼。
嗯,是美了,美出新高度。
接下来这道菜,大家稍微做下心理准备,有点恶心心。
而鱼香肉丝也很快败下阵来,在中式恐怖面前,一切视觉冲击都是纸老虎。
关于「夫妻肾片」这菜名的迷思,很多人小时候脑补过可怕画面,竟然被 AI 重现了。。
一家人就要整整齐齐系列。
救救孩子。。
以上这些沙雕图,目前机哥再重新测试,基本上都能正常发挥了。
最吓人的老婆饼,虽然跟机哥平时吃的老婆饼不太像,但好歹不再是老婆婆+饼了。
视觉冲击的鱼香肉丝,目前也改正过来。
只可惜。。夫妻肾片还是走的鬼片风格?
再换个指令,对面 AI 依旧是自行「画」出来,而不是进行信息整合工作。
Emmmm,好吧,有进步,下一题。
对四字成语、名言典故的理解不完善
不仅对菜名理解较为机械,对于四字成语,刚上线的时候,AI 的表现能令语文老师气得两眼一黑。
从「青梅竹马」一词开始,网友们开始疯狂测试成语,几乎每个都有惊喜。
你说它错吧,又没完全错。
你说对吧,是跟对压根不沾边。
经过一个月的成长,现在它会画了。
也懂得用眼神表达胸有成竹,而不是真画竹子在胸前。
再来个好玩的:
至少,它现在能正确理解“熊熊烈火”咯。
以前记单词时候瞎起哄,「人山人海」叫做 people mountain people sea,原来是跟 AI 想一块去了。
现在再用同样的语句测试,文心一言仿佛变聪明了。
对于成语的理解如此灵性,那么同理,对著名典故,AI 也有自己的想法。
关二哥怎么都没想到,千百年后,赤兔马成了大摩托。
唐伯虎做梦都梦不到,自己的典故被 AI 画成动物世界+修炼黑魔法现场。
还是老虎的问题,AI 是真过不去。
仔细看上图,测试者已经尽量描述清晰了,强调画面中需要有松树,为 AI 指明道路。
理论上,人类把自己需求描述越精准,AI 整出的活质量也就越高。
今天机哥再次尝试同一个命令语句,好吧。。还是看不到武松的影子。
反而如果直接要求它画张武松打虎图,武松就神奇地现身啦~
正想夸夸百度的 AI,它又来个不稳定发挥打脸。
只能说,中华文化博大精深,词义理解千变万化,任你什么 AI 杀过来,都得老老实实学。
多给 AI 些时间,也是多给我们自己些时间,对吧。
任何新生事物成长起来,都有个过程。
去年机哥给大家介绍过,AI 生成二次元风格图片,也是经历过各种翻车。
去年的情况是,在有原照片的基础上,用 AI 生成新风格,都难免出错,更何况现在这个,光凭几个字形容,就自主作画的 AI 呢?
包括像单纯的文字对话,AI 都随时可能抽风。
前段时间,微软就紧急限制了自家 ChatGPT。
更别提其他大大小小的 bug 了。
每次有什么 AI 表现惊艳世人时,背后都有无数错误在堆积过来。
随着各家都在推出 AI 模型,也正好给我们一个很好的观察机会:到底哪个 AI 会更惊人/吓人呢?