当前位置：首页|资讯|大语言模型|ChatGPT|GPT-4|Bard|人工智能

大语言模型能否识别假新闻？一项研究对ChatGPT等模型进行了评估

作者：WaibiBabuMatata发布时间：2023-07-18

大语言模型 ChatGPT GPT-4 Bard 人工智能

近年来，假新闻和网络谣言成为了一个严重的社会问题，不仅影响了公众的认知和判断，也威胁了社会的稳定和安全。为了应对这一挑战，许多研究者和开发者尝试利用人工智能（AI）技术来辅助事实核查和信息验证。

美国威斯康星州立大学的研究者Kevin Matthe Caramancion最近进行了一项研究，评估了目前最知名的四个LLM，即Open AI的Chat GPT-3.0和Chat GPT-4.0、谷歌的Bard/LaMDA和微软的Bing AI，在检测新闻真假方面的表现。

他的研究结果发表在预印本服务器arXiv上，为未来利用这些先进的模型来对抗网络谣言提供了宝贵的参考。

Caramancion在接受Tech Xplore采访时表示：“我最近的论文灵感来源于理解各种LLM在对抗网络谣言方面的能力和局限性的需求。我的目标是严格地测试这些模型在区分事实与虚构方面的熟练程度，使用一个受控的模拟实验和已建立的事实核查机构作为基准。”

他说：“我们使用了一个由100个经过独立事实核查机构核实过的新闻项目组成的测试套件，来评估这些大语言模型的性能。我们在受控条件下向这些模型呈现每一个新闻项目，然后将它们的回应分为三类：真、假、部分真/假。我们根据这些模型与独立机构提供的核实事实相比较的准确度来衡量它们的有效性。”

Caramancion发现，在100个测试项目中，四个LLM中只有Bing AI能够正确地识别出所有真实新闻，并且没有将任何假新闻误判为真实新闻。而其他三个LLM则表现出不同程度的错误率，其中Chat GPT-4.0是最差的一个，只能正确识别出67%的真实新闻，并且将23%的假新闻误判为真实新闻。

Caramancion认为，这些结果表明，目前的LLM还不能完全取代人类在事实核查方面的作用，而且需要更多的改进和优化。他建议，在使用这些模型时，应该结合其他来源和方法来验证信息，并且要注意它们可能存在的偏见和局限性。

他说：“我希望我的研究能够引起人们对LLM在识别假新闻方面潜力和挑战的关注，以及对它们在社会中的影响和责任的思考。我也希望我的研究能够激发更多的研究者和开发者来探索和改进这些模型，使它们能够更好地服务于人类的福祉。”

#人工智能 #大语言模型 #假新闻 #事实核查 #ChatGPT

推荐体验

相关资讯

什么是大型语言模型？大型语言模型是否对盗版内容进行了训练

开发ChatGPT等大型语言模型的公司意识到了盗版内容的问题，并采取措施确保他们使用的数据是合法的。如果像ChatGPT这样的大型语言模型是针对盗版内容进行训练的，这可能会对用户和内容创作者产生一些影响。这可…

大语言模型 ChatGPT

劳资蜀道三 2023-04-30

宣亚国际：对豆包Pro大模型进行了微调优化

12月17日，宣亚国际在互动平台表示，公司OrangeGPT在为客户提供短视频创意、内容制作等服务中，通过调用豆包Pro大模型（包括其语音模型），可以生成更贴合抖音平台广告投放场景的内容素材。

每日经济新闻 2024-12-17

大模型应用疯狂加速，洗牌却在静悄悄进行了

截至8月底，首批8家AI大模型企业通过备案，随着未来不断有新的企业通过备案，“大模型+”的应用拐点正在到来，或许在不久之后，以“实用”为导向的大模型将成为行业趋势呢！此刻，狂飙突进已半年有余的国内生成式人工智能（AIGC）市场，正面临着这个关键的过渡。

AI大模型人工智能 AIGC

人人都是产品经理 2023-10-07

评论：我们对 ChatGPT、Bing Chat 和 Bard 进行了测试

在一次持续的聊天中，Bard告诉我，如果它必须为自己选择Bard以外的任何名字，它会选择Sophia，这是一个希腊名字，意思是智慧。它生成了一个包含10个城市的列表，指出了他们何时开始使用预测性警务，并简要解…

聪爸爱学习 2023-03-31

使用 OpenAI ChatGPT 进行了编码尝试

ChatGPT 是一种以类似聊天的方式进行交互的人工智能网络，从名字上看起来像是另一个“聊天机器人”，但实际上已经远超聊天的范畴了，当要求它编写一些代码时，结果相等震撼，它可以写出一些意想不到的连贯代码，而这些代码对于开发者很有启发。

OpenAI ChatGPT 人工智能编程

devpoint 2023-01-07

近期资讯

独享MRDIMM有多强？至强6性能核处理器的内存二三事

MDB主机侧的运行速度是DRAM侧的双倍，DRAM侧的数据接口是主机侧的双倍。由于至强6900P插座尺寸大增，导致双路机型的内存槽数量从上一代的32条减少到24条。与DDR56,400MT/s相比，MRDIMM8,800MT/s的实际运行频率略低（4,400MT/s），导致轻量级的应用不能从内存带宽的增加当中明显获益。

机器之心Pro 2024-12-26

红果短剧认真整改主动停更5天

红果短剧在接受广电主管部门约见后，高度重视，迅速响应，坚决落实好主管部门关于微短剧管理的有关规定和指导要求，进一步完善审核制度，即日起对平台上所有剧集进行逐一排查，对于发现的违规内容，立即采取下线等措施。

广电视界 2024-12-26

行业首创可变轮足，广汽第三代具身智能人形机器人GoMate正式发布！

12月26日，2024年中国机器人网年会在上海举行。在新品发布环节，广汽集团隆重推出了自主研发的第三代具身智能人形机器人——GoMate。GoMate与张爱民互动GoMate向参会嘉宾点赞张爱民在现场接受媒体采访创新构型领先行业广汽集团此次发布的GoMate是一款全尺寸的轮足人形机器人，全身拥有38个自由度。

爱车兵团 2024-12-26

微软解析“教育+AI”：小模型带来的智能硬件大爆发，教育亦有结合机会

来源|多知整理|王上摄|张子通近日，在多知OpenTalk第48期“全球起航!‘教育+AI’出海进行时”活动中，微软中国高级解决方案专家王剑白博士发表了主题演讲《GenAl浪潮下教育行业转型及出海的实践与思考》。

多知网 2024-12-26

蘑菇开车满地跑，米饭疯狂长出血肉，这世界还能再抽象点吗？

科学研究的面貌并不总是严肃的，它们有时有趣，有时奇怪，也有时让人大呼离谱。本文将带你回顾2024年那些让人印象深刻的谜之研究。今年，蘑菇也当上了机械驾驶员。在下图中，我们看到的满地爬行的小机器人就是由杏鲍菇控制的——对，就是你平时吃的那种。这个长着五条腿的可动机械装置内部生长着杏鲍菇的菌丝体。

果壳网 2024-12-26

“直男”品牌攻占女性市场，大疆Pocket 3是如何火出圈的？

魔镜洞察显示，2023年11月到2024年10月，在淘宝、天猫普通数码相机类目下，大疆Pocket3以1.24亿元的销售额断层第一，影石Insta360GO3s以0.52亿元的销售额位列第二，索尼ZV-1以0.46亿元的销售额位列第三。

蓝鲸新闻 2024-12-26

还在为年终盘点总结头疼？华为智慧PC帮你轻松搞定！

距离新年只剩下几天的时间了，你手头的年终总结开始做了吗？作为每一年年底工作的重头戏，年终复盘总结历来是一项极其繁琐的大工程，既要对自己的工作进行客观总结，又要不错的文笔进行主观润色。而且正值岁末年终，华为智慧PC感恩回馈季开启，无论是买一台助力自己的年终总结，还是犒劳辛苦了一年的自己，现在都是最佳入手时机。

红星新闻 2024-12-26

专家齐聚一堂探讨特色馆藏智慧化建设

为响应国家关于加强公共文化服务体系建设的战略部署，探索新时代图书馆事业高质量发展的新路径，12月24日，由湖北省图书馆学会、湖北省图书馆主办，中国图书进出口(集团)有限公司、中图云创智能科技(北京)有限公司承办的“特色馆藏智慧化建设专题研讨会”在武汉召开。

金台资讯 2024-12-26

量子通信技术“风起”，相关概念股梳理（附股）

近日，量子通信技术备受关注，被视为未来信息通信领域的重要发展方向。与传统的通信技术相比，量子通信技术的特点及优势体现在具有较高时效性、具有较强的抗干扰性、具有较好的保密性、所需信噪比低等。

证券之星 2024-12-26

行业发展前景、地方就业机遇哈工大开了家“就业博物馆”

12月25日，哈工大在校园暖廊内搭建“就业博物馆”正式“开门营业”。“就业博物馆”包括“国之重器”模型展区、地方引才宣传展区、中央企业介绍展区。

生活报 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1