4Or1XKPiQ55 tech.huanqiu.comarticleAI新闻可靠性报告亮红灯,45%回答存重大错误,Gemini成重灾区/e3pmh164r/e3pmtmdvg【环球网科技综合报道】近日,一项跨越18国、涵盖14种语言的大规模研究向风头正劲的AI助手泼下冷水。10月24日消息,据外媒Gizmodo报道,欧洲广播联盟最新研究报告指出,主流AI聊天机器人在处理新闻内容时存在系统性缺陷,近半数回答存在重大问题,严重威胁公众信息获取质量。这项联合22家公共服务媒体的研究对ChatGPT、Copilot、Gemini和Perplexity等主流AI平台进行了3000次测试。结果显示,45%的回答存在至少一个重大错误,81%的回答包含轻微问题。信息来源缺失和准确性不足成为两大重灾区,分别影响31%和30%的回答。 研究负责人德滕德警告:“这些错误具有系统性、跨国界和多语言特性,当人们不知该信什么时,最终会选择什么都不信。”Gizmodo报道称,在平台表现方面,Google Gemini以76%的错误率垫底,是其他产品的两倍多。尽管与半年前相比部分模型有所改进,但错误率依然高企。研究人员特别指出,AI在处理突发新闻、复杂时间线和需要区分观点的事实类问题时尤为薄弱。然而与AI可靠性形成鲜明对比的是其迅猛普及。路透研究所数据显示,使用AI获取新闻的用户数量一年内翻倍,在阿根廷、美国及18-24岁年轻人中渗透率最高。更值得警惕的是,48%的年轻用户依赖AI简化新闻理解。(旺旺)1761276712949环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:秦耳环球网176127671294911[]//img.huanqiucdn.cn/dp/api/files/imageDir/73d244d418a616625e44bd9946133ac3u1.png{"email":"qiner@huanqiu.com","name":"秦耳"}
【环球网科技综合报道】近日,一项跨越18国、涵盖14种语言的大规模研究向风头正劲的AI助手泼下冷水。10月24日消息,据外媒Gizmodo报道,欧洲广播联盟最新研究报告指出,主流AI聊天机器人在处理新闻内容时存在系统性缺陷,近半数回答存在重大问题,严重威胁公众信息获取质量。这项联合22家公共服务媒体的研究对ChatGPT、Copilot、Gemini和Perplexity等主流AI平台进行了3000次测试。结果显示,45%的回答存在至少一个重大错误,81%的回答包含轻微问题。信息来源缺失和准确性不足成为两大重灾区,分别影响31%和30%的回答。 研究负责人德滕德警告:“这些错误具有系统性、跨国界和多语言特性,当人们不知该信什么时,最终会选择什么都不信。”Gizmodo报道称,在平台表现方面,Google Gemini以76%的错误率垫底,是其他产品的两倍多。尽管与半年前相比部分模型有所改进,但错误率依然高企。研究人员特别指出,AI在处理突发新闻、复杂时间线和需要区分观点的事实类问题时尤为薄弱。然而与AI可靠性形成鲜明对比的是其迅猛普及。路透研究所数据显示,使用AI获取新闻的用户数量一年内翻倍,在阿根廷、美国及18-24岁年轻人中渗透率最高。更值得警惕的是,48%的年轻用户依赖AI简化新闻理解。(旺旺)