不会中英互译，百度文心一言变“中文差生”

作者：橡果商业评论发布时间：2023-03-25

百度文心一言

作者赵翔姜睿盈

编辑覃拓

近期，文心一言“套皮”争议愈演愈烈。

一名业内人士告诉《橡果商业评论》，所谓“套皮”，应该是指文心一言采用中英互译方式套用开源模型、采用开源数据加入训练的行为。

据百度发布的相关论文显示，文心一言“文生图”功能在训练时，使用百度翻译进行中英互译。

事实上，百度翻译目前在行业早已掉队，机器翻译效果相比其他人工智能公司差距很大。

《橡果商业评论》将百度翻译与讯飞翻译、腾讯翻译、网易翻译对比发现，百度翻译对名词短语的翻译，存在多义、歧义等问题。

上述业内人士表示：

如果翻译错误，也会直接影响生成模型的效果。

但翻译是中国AI的必经之路。

截至2021年，全球排名前1000万个网站中，英文内容占比60.4%，中文内容占比仅为1.4%。

中国AI需要依赖大量的英文数据集训练。

翻译成为文心一言面前的一座“大山”。

面对技术问题，百度不仅从未正面回应，还不断公开强调“国货”需要时间。

如此发言，似乎是在维护李彦宏“文心一言中文优等生”的自尊心。

文心一言受困于中英互译，中国AI未来在哪里？

一：文心一言“套皮”疑云，自画像竟是“白种男性”？

3月22日，博主@刘大可先生爆料，文心一言“套皮、画皮、造假”。

@刘大可先生表示，若使用文心一言做图，它会将中文翻译为英文，再使用国外开源的AI文生图模型Stable Diffusion生成图画。

Stable Diffusion与OpenAI的Dall-E 2相似，都是AI文生图模型，由英国公司Stability AI在2022年8月发布。

以“一可以豆子”为例，这句话在汉语中不是完整语言；若使用“百度翻译”直翻英语，结果为“One can beans”。

“可以”被翻译成“can”，根据上下文，“can”被理解为量词，整句意为“一罐豆子”。

所以，让文心一言制图“一可以豆子”，就会得到“一罐豆子”的图片。

这并非个例：

1. “牛肉可以”使用“百度翻译”会得到“Beef can”;

2. “一冰箱可以”为“A refrigerator can ”。

3. “牛奶路”对应翻译“Milk Road”；

相应的，文心一言也会分别生成“一罐牛肉”“装满罐头的冰箱”“银河”的图片。

“直翻”导致错误之外，一词多义的单词们也会让文心一言制图“抓瞎”：

1.“起重机”“百度翻译”为“Crane”；

2.“土耳其”为“Turkey”。

“Crane”更常用的意思为“鹤”，“Turkey”也有“火鸡”之意，所以文心一言会生成“鹤头”“火鸡”的图片。

此外，若让文心一言生成“人像”，不加“中国”关键字，画出的都是“白种人”。

3月16日，《橡果商业评论》让文心一言画“自画像”，却得到一个“白人男性”的图片。

3月23日，百度发声明称“不传谣不信谣”，文心一言“文生图”能力来自文心跨模态大模型ERNIE-ViLG。

二：“猪队友”百度翻译，让文心一言卷入“套皮”风波

文心一言有不一样的答案。

3月23日，据《澎湃新闻》报道，在对话文心一言，询问其是否采用Stable Diffusion时，文心一言不仅承认使用Stable Diffusion，还承认使用Transformer、GRU等深度学习模型来生成图像。

事实上，这并不代表文心一言“文生图”存在所谓“套皮”。

百度官方介绍，文心一言“文生图”功能来自ERNIE-ViLG 2.0。

据百度发布论文《ERNIE-ViLG 2.0：用知识增强型混合去噪专家改进文本到图像的扩散模型》显示，ERNIE-ViLG 2.0的训练数据由1.7亿图文对组成，包括网络公开的英文数据集和百度内部中文数据集。

然而，ERNIE-ViLG 2.0训练阶段，部分训练数据里的中、英文翻译由百度翻译自动翻译。

业内人士唐喆（化名）告诉《橡果商业评论》，百度翻译目前已经掉队，机器翻译效果相比其他人工智能公司存在很大差距。

特别是名词短语翻译，存在多义、歧义等问题，如果翻译错误，也会直接影响生成模型的结果。

以上述“牛肉可以”为例。

《橡果商业评论》用百度翻译结果为“Beef can”（牛肉罐头）；腾讯翻译为“Beef is fine”（牛肉不错）；网易翻译为“Beef can”（牛肉罐头）；讯飞翻译结果为“Beef is OK”（牛肉不错）。

不同翻译软件中，只有腾讯翻译、讯飞翻译回答正确。

唐喆则举例近期最火的“虎头虎脑的胖小子”。

百度翻译为“Big fat kid with a tiger's head and brain”（长虎头的胖子），网易翻译、腾讯翻译也类似。

讯飞翻译结果相对接近，为“A tiger-headed fat boy”（虎头虎脑胖小子）；

唐喆解释，文心一言作画能力强调输入文本内容的实体信息，例如“虎头虎脑的胖小子”，会把“虎头”当做单独的实体。

这不仅忽略了整体句子级别的语义理解，也与文心一言发布时提到“中文理解能力强”完全不符。

三：“差生”伪装“优等生”，李彦宏的自尊心游戏？

在3月16日的文心一言发布会上，百度CEO李彦宏用提前录制好的文心一言演示视频，解释其中文理解能力。

例如向文心一言提出“洛阳纸贵”“藏头诗”等问题。

最终李彦宏的结论是，文心一言是扎根中国市场的大语言模型，具备中文领域最先进的自然语言处理能力。

目前看来，文心一言距离李彦宏所言“中文优等生”相差甚远。

唐喆认为，百度采用中英互译方式，无论是套用开源模型还是采用开源数据加入训练，都应该在中文语言理解和中英互译上多加注意。

令人遗憾的是，文心一言技术出现问题，面对质疑，百度并未就此问题进行公开的专业解答。

还以“需要时间学习和成长”“给自研产品信息、时间”为由，消耗着国内用户的耐心与信心。

另一方面，当文心一言答案被指出现问题，答案就会“消失”。

3月23日下午，《橡果商业评论》使用文心一言发现，与“牛肉可以”类似的“XX可以”问题，文心一言答案疑被“屏蔽”。

直到当日晚间，答案才再次恢复，面对“牛肉可以”的指令，文心一言画出的不再是“牛肉罐头”，而是“一盘牛肉”。

这似乎是“升级迭代”？

但继续提问“牛奶路”（Milk Road），生成的图片依然是“银河”（the Milky Way）。

如此操作，并不像是百度口中“学习能力提升”，更像是真人进行的屏蔽、修正。

即便如此，李彦宏在媒体专访时也认为，文心一言能在两个月后追赶到今年一月份的ChatGPT。

唐喆认为，从用户视角来看，文心一言和ChatGPT差距不小。

ChatGPT基本可以满足用户的诉求，反观文心一言，作图能力理解能力双双“丧失”，“从画图结果来看，文心一言更适合玩看图猜成语的游戏。”

四：文心一言受困于中英互译，中国难有ChatGPT？

文心一言距离ChatGPT还有多远？

唐喆认为，文心一言在知识问答、词典、文献检索等方面回答基本过关，这是发挥百度自有搜索引擎的优势。

但在数学、代码、归纳推理、翻译等方面，被ChatGPT甩在身后。

唐喆曾多次询问中国特有的农历，即便百度对文心一言进行过多次修正，文心一言也依然没有给出正确答案。

对于一些常见的亲属关系、推理选择，文心一言展示的推理逻辑看似很有道理，实际是在一本正经地胡说。

唐喆总结:

1.文心一言在中文写作、语法分析上，分析精度和准确性均不高；

2.文本生成、改写、作文等，虽然会有基本格式框架在，但不能仔细阅读内容，内容精细度不如GPT详实和细腻。

3.文心一言在海量信息的参数化全量记忆类型问题，及一些复杂的逻辑思维推理类问题的回复上，不符合用户原始意图的表现居多。

其次，对于安全类敏感类话题，文心一言控制的十分谨慎。

唐喆表示，文心一言的敏感词范围较宽泛，处理逻辑也略显粗暴。

例如，若用户A问出带有敏感词的问题，文心一言为防止A继续发文，会强制关闭A的对话框。

在此类问题上，ChatGPT相对更加客观，会增加正向引导和安抚。

唐喆认为，通过上述例子可见，百度内部细化、分层不够，处理不灵活。

事实上，对文心一言来说，现阶段最重要的事，是寻找百度翻译替代品。

有业内人士表示，虽然简体中文互联网用户和英文互联网用户规模相当，但截至2021年，全球排名前1000万的网站中，英文内容占比60.4%，中文内容占比仅为1.4%。

中国AI需要依赖大量的英文数据集训练，否则会吃亏。

文心一言若想成为“中国版”ChatGPT，需做好第一步中英互译。

在文心一言“文生图”还在“看图猜成语”之时，据最新消息，OpenAI宣布ChatGPT支持接入第三方插件，并上架11个插件。

其中Browsing插件支持ChatGPT实时搜索互联网内容。

解除“封印”的ChatGPT将涌现无数可能性。

毫无疑问，全能AI助理时代即将到来。

但时至今日，中国依然被ChatGPT“封区锁服”。

不会中英互译，百度文心一言变“中文差生”

推荐体验

相关资讯

谷歌Gemini中文疑似套壳百度文心一言

Gemini自曝中文用百度文心一言训练

“百度”的文心一言，不会让你失业了哈哈

百度文心一言来了

百度推出【文心一言】

近期资讯

免费喝1两：江西老字号春蕾茉莉超特茶5两29元半价大促

1000nits亮度显示器标准来了！专门针对OLED HDR

爱奇艺副总裁陈伟再被曝离职：曾成功打造《中国有嘻哈》

Windows本地AI开发神器！微软推出并开源AI Dev Gallery

《GTA6》B站预告对比油管女人汗毛妊娠纹细节清晰

我国开建全球最大万吨级纯电动运输船：续航可达500公里

泪奔！韩国客机失事最惨一幕：1家9口空难离世家仅剩狗

创维新款23.8寸显示器上市：2K 180Hz屏仅899元

马斯克评论文章激怒德国：炮轰世界首富干预大选

我国新规：司机驾年龄延长至63岁摩托车放宽至70岁！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响