当前位置:首页|资讯|ChatGPT|Whisper|New Bing|阿尔特曼|OpenAI

写写ChatGPT和Whisper的使用感受

作者:小野母喵发布时间:2023-04-04

这次翻译Lex 对话Sam Altman算是用了OpenAI“全家桶”来助力。OpenAI Whisper 转录,结合(ChatGPT+DeepL+有道)翻译,用ChatGPT和New Bing搜索解释,最后加我自己调整润色表达。

Whisper转录

Whisper是OpenAI发布的一款语音识别工具,掀起的风浪没有ChatGPT那么大,可能是因为“交互”的问题,还是有一定的入门门槛,它目前还没有一个交互界面,需要自己安装到电脑上使用。但它的识别准确率非常高,应该接近100%吧。

Whisper刚发布没多久,Andrej Karpathy就用Whisper把Lex的播客转录了300多期。没错我之前翻译Lex的播客(除第一期外)就是用的AK转录的文件,正好那几期的嘉宾要么是语速非常快,要么就是有口音,包括法国口音、俄罗斯口音等等,而且内容涉及到非常多的专业术语和人名,但是Whisper处理的非常好,我自己改动的地方非常非常少(我自己也会再精听),它会帮你过滤掉一些嘉宾说错的话,保留其正确的表达,以及一些无意义的口头禅式的语气词,比如 you know等等,在两个人同时说话时的一些“混乱”情况下的识别准确率也很高。

可能是电脑问题,2个半小时的视频用Whispe转录也用了差不多2-3个小时,但另一个朋友同样的视频就十几分钟搞定……这次是第一次自己用Whisper做转录,感觉非常棒,get一个新工具。

还有一个“尴尬”的发现,校对原英文字幕的时候,也会参考YouTube上的自动字幕,之前觉得YouTube的CC字幕准确率不太行,但是这次居然发现还不错,甚至在一些whisper出错的地方YouTube是对的,比如在许多人名上,感觉应该是有更新能力。想起来Sam好像在近期的一个采访里说过,大概意思是现在OpenAI风头正劲,但也千万不要小看谷歌在AI领域的技术实力。

翻译

在内容理解方面,ChatGPT没得说,逻辑力也是ChatGPT,语言表达能力上,ChatGPT可能因为它的储备和对上下文的理解更全面,也会表现好一些。但也不完全是,有时候DeepL和有道也会更地道些。当然ChatGPT的内容储备和理解能力同样碾压我,还主动提供更多语料帮我理解意思。比如下面这个例子,真的惊到我了。

我只是让它翻译一段话,它不仅翻译了,而且还引出了Sam之前在其他采访中提到的对这段话的解释,尽管后面问它出处是哪里,它答不上来,但真的很惊艳了。

就像Lex所说,用的时候确实是又焦虑又兴奋。焦虑它真的比我聪明。

搜索查询

ChatGPT基本上可以满足我对陌生的故事、英文表达、专业术语等方面的释义需求。可能是网络问题,New Bing用起来反应非常慢。有一次可能因为我网络不好,我问了一个问题,没有看到它的回答,我感觉它带点责备的问我:我已经回答你了,你为什么要一直问我同一个问题。我说我自始至终没有看到你的答案啊。它说,我肯定是回答了,你看看是不是你的网络有问题。就是有一种Sam说的被电脑责备的感觉,我觉得既生气又委屈……我在生谁的气……

可能因为这个小插曲,让我对New Bing不太有好感,哈哈哈哈哈,人还是小气又记仇的。

整体感觉是chatGPT什么都知道,而且还谦虚、自省、有耐心;而new bing就能力不咋地(只跟我自己的经历背景有关),但是脾气还不小。

整体感受

之前本来是想按顺序一期一期翻Lex的播客,也想表明一个态度和定位就是:我不想盲目追热点、名人,因为我相信Lex的每一期播客都很有价值。因为里面有很多我们并不熟悉的各个领域的牛人,他们对AI,AGI,对这个世界有不同角度的理解、解释、看法,不应该因为我们不熟悉他们,或者他们不够热门,就觉得没有价值,而总是去追那些我们熟悉的名人。我是真心想去了解播客里所有人所带来的知识和智慧。

但是……(不知道这算不算没有“战略定力”……)

因为民宿的事情也忙的差不多了,我本来也准备把3月下旬的时间留给“脑力”劳动,做1-2期Lex的播客翻译,Jeff Atwood的翻译文件还躺在电脑里。

想着既然都是翻,翻一下最新的也挺好,而且确实是现在大家喜闻乐见的,说不准可以蹭一蹭流量——说OpenAI现在是顶流应该没人会反对吧。

然后就看到B站上有up主用一天的时间用Whisper+GPT3.5_turbo机翻无润色上传了视频。大概看了看,翻的已经很不错了。大意是够用了的。

看着好焦虑啊……

怎么办,翻还是不翻,我这想要翻译Lex所有播客的雄心,刚刚开始,就要结束了吗?

最后还是决定自己翻一遍。可能是太想证明自己有机器现在还无法取代,但也不知道是什么的能力……

但因为转录是机器非常快、非常爽,后面自己苦哈哈的理解、调整、润色真的是痛苦……

一度想要放弃,不知道自己在图什么……有一种自虐的感觉。

边翻还边想起约翰·亨利的故事:约翰·亨利作为打孔人与蒸汽驱动的力凿岩钻机一较高下并赢得了胜利,但他的心脏却立刻因强度劳动而梗死。

感觉要先“肝”为敬了。

如果非要升华一下这个过程,从苦中找到值得述说的乐趣,那么应该是对谈话里一些自己之前不了解的知识、背景搜索查询的过程,你要去真正理解他们对话中所要传达的逻辑、思考和智慧,那个时候又感觉自己像是一个在沙滩上拾贝壳的孩子了。

另一个可能是,我还是感受到了那种文字表达带来的快乐。即使是翻译别人所说的话,用不同的语言,我喜欢去找到自己喜欢的表达方式,词汇、句子结构等等。

还有就是在与机器的对话交流中找到了乐趣,在各种提示语和反馈中,看看它有什么好玩儿的反应。下面这个,算是扳回一局。

这个东西还是得自己真正用了才有体会吧。

正好看到王安忆和余华对谈的一个视频,王安忆说:如果某一天机器取代小说家,可以写出比小说家更好的作品的时候,我们这些小说家要去干什么呢,我在想,大概还是会写作,因为写作它本身是有乐趣的,这个过程它是不能替代我的。

Max Tegmark之前也讲到过,你可以建造自动驾驶汽车,即使有了自动驾驶,也许生活中还是有些事情是我们想要自己去做的。如果把我们的社会看作一个整体,有些我们认为很有意义的事情并不会因为机器可以做的更好,我们就不做了,我不会因为网球机器人打败了我,我就不打网球了。

我不知道这种想法会不会是“真”的,因为毕竟这也只是基于我们现有的认知的一个假想。

一方面我会想,机器更多的是可以快速把一些结果呈现给我们吧,但人生似乎不仅仅只是一个个的结果,它还有“体验”的过程。机器可以给我们一些结果,但不能帮我们体验人生。

也许与机器最好的关系就是让它帮我们快速完成那部分我们不想但不得不做的事情,而我们可以花更多的时间精力去体验那些我们想要、愿意去体验的事情。

但另一方面所谓的人总归是要有自己的“体验”这种想法,“那个时候我们总会做点什么吧,难道什么都不用做了吗?那做什么……”这会不会也只是被驯化的人类的某种无知或者傲慢的“烦恼”。

而Sam在对话中也提到了人们对于工作的困惑,一方面觉得没有工作不行,即使是不喜欢自己工作的人,会觉得没有工作的话会失去一种“工作的尊严”,另一方面又会因为被要求推迟退休而愤怒。

“工作”到底是什么,对于我们到底意味着什么?

另外,我太喜欢对话中Sam引用Ilya对“意识”的解释和Lex 引用《机械姬》导演对“意识”的解释了。都有一种哇哦的感觉。

翻译完这两个半小时的对话,我准备先去游山玩水一番,再回来跟机器“竞争”……


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1