最近百度推出的人工智能机器人文心一言应该有不少用户已经体验,文心一言支持通过提示词快速生成图片。不过从网友测试以及蓝点网的测试来看,文心一言生成的图片都比较诡异,甚至可以拿来当我画你猜的素材。
随着时间的推移有网友发现文心一言的图片生成功能似乎有鬼,百度很有可能是将提示词翻译为英语再生成。这导致中文的成语、古诗词和一些非常见词生成的图片非常诡异,有网友质疑百度是基于其他出图服务套皮。
哪些提示词生成的图片可以看出来是套皮呢?其实还挺多,比如之前文心一格创作的爱国的猫披着美国国旗。
文心一格是百度推出的图片生成服务,这个和文心一言属于类似服务,背后使用的图片生成引擎应该很相似。而文心一言也存在类似问题,例如要求文心一言生成「总线和鼠标」图片,生成的图片是大巴车和一只老鼠。总线和鼠标都是计算机术语,在英文里计总线就是BUS,因此文心一言生成的图片是大巴车符合英语中词义。还有个提示词更有趣:一可以豆,这个词在中文里没有实际意义,但是如果翻译为英语则是 one can bean。在英语翻译中可以对应着 Can,但 Can 在英语里也有罐头的意思,所以文心一言生成的图片是 一个豆子罐头。所以从这个提示词里就可以看出来文心一言的图片生成功能是基于英语的,将中文提示词翻译为英语再生成。很难说,如果是中文直接出图的话百度还可以说是自己的原创,但为什么百度要先翻译为英语再去生成图片?目前已经有开源项目可以生成图片,这些开源项目都是基于英语的,这也是网友质疑百度可能是套皮的原因。百度也没有解释过文心一言图片生成功能背后的技术原理,或者开源相关技术,所有有套皮的猜测也能理解。而且百度文心一言生成的图片风格也确实不太符合中文词意境,尤其是成语、中国菜这类词生成的一言难尽。百度在回应中是这么说的:文心一言是百度自研大语言模型,文生图能力来自文心跨模态模型 ERNIE-ViLG。在模型训练中百度使用全球互联网公开数据符合行业惯例,后续百度也会继续迭代优化让大家看到百度实力。从上面百度的回应可以看到,百度似乎并没有否认相关质疑,强调文心一言是自研没说文生图也是完全自研。当然使用开源技术本身没有太大问题,使用国外的数据训练集也没问题,毕竟紧急上线嘛拼凑拼凑在所难免。