3月16日14:00,在北京总部举行的发布会上,百度正式发布知识增强大语言模型“文心一言”。
据悉,这是百度文心大模型系列的又一新成员。在此次发布会上,百度创始人、董事长兼首席执行官李彦宏演示了文心一言在文学创作、商业文案创作、数理逻辑推理、中文理解、多模态生成场景下的具体应用实例,以期展现模型对文本的理解、推理、表达和创作能力。
在演示中,值得注意的是,由于训练数据主要基于中文,文心一言在中文理解能力上表现得较为突出。能够解释“洛阳纸贵”的含义、衍生意义,甚至基于这一成语创作藏头诗。
不过,令许多人想不到的是,文心一言发布期间,百度股价开始大跌,跌幅一度达到9.81%。截至收盘,百度跌幅为6.36%,报125.1港元,总市值3458亿。受此影响,A股与港股的ChatGPT概念板块均走势不佳,66只A股概念股中40只收跌,港股商汤-W、阅文集团均有不同幅度的下挫。
对于百度么股价下跌原因,一名人工智能行业创业者表示:“这可能是对这场发布会失望情绪的一个体现。”
发布会上没有实时演示,只用视频录像敷衍了事,彰显出百度官方对文心一言的能力并无信心。而百度创始人李彥宏也承认,就他实际使用体验看,文心一言的表现并不“完美”,同时发布会结束后并未全面开放体验,目前只是公开了一个测试版本。“这些都与市场的预期有很大差距。”该创业者说。
据了解,大语言模型的发展还处于初级阶段,关键技术仍有待进一步成熟与完善。
对此,硅基智能科技有限公司CEO司马华鹏指出,算法以海量数据为原料,在初始使用时,如不慎将有偏差的数据混入训练,无形中将影响算法运行结果,特别是在垂直领域,当训练数据量不足的情况下,很可能受到数据影响而导致模型给出错误的结论。同时,大模型、大数据、大算力是未来的发展趋势,早期投入的数据、算力等成本巨大,也是阻碍AIGC落地的重要方面。
司马华鹏进一步补充,AIGC发展过程中,还可能产生内容审核、生成内容的版权问题不清、伦理及政策监管等风险,同样值得关注。
“随着人工智能技术不断的进步和发展,人工智能生成的内容越发逼真,能够达到以假乱真的地步。虽然公司内部尽力做到防止产品或服务被不法分子乱用,但是对于可能被乱用造成的后果,仍然存在伦理与法律的风险,后续是否会出台 AIGC 作品相关知识版权或其他法律监管条款尚不明确。”他表示。
竞天公诚律师事务所合伙人袁立志也提出了谨慎对待人工智能所面临数据、技术和应用等多层面的风险。单就数据层面的风险而言,有数据来源不合法、收集使用数据未获个人同意、隐私数据泄露、数据质量缺陷、数据偏见、数据投毒、数据逆向还原等,这些风险既需要通过技术措施解决,也是法律合规关注的重点和难点。
而谈到百度之所以会在产品不成熟时就急于发布,投资者李华认为,主要为抢风口,在国内其他企业还未推出相应产品的情况下,率先推出类ChatGPT产品,有利于吸引更多投资者,提升百度股价,毕竟在今年风传要入局ChatGPT时,百度股价窜升,曾吃到第一波红利。
“心态浮躁和市场利益催化下,产品往往是道具,质量好坏不论,能与热点挂上钩就行。”李华说。
而另一位投资者朱新也表示,在ChatGPT席卷全球的热潮下,各家大厂为了赶风口,争先恐后推出自己的大模型,但实际上无论是技术、工程还是数据上都和OpenAI有很大的差距。百度与其这么赶工,推出并不成熟、甚至不堪实用的类ChatGPT,不如老老实实花12-18个月做些有价值的东西。