BBC等机构研究评估AI工具新闻总结水平,谷歌Gemini错误比例最高
创始人
2025-10-24 08:53:39
0

IT之家 10 月 24 日消息,生成式 AI 的确在信息整理方面大有用处,生成的内容也常令人惊叹,但只要仔细一看,就能发现这项技术仍存在不少缺陷。

据外媒 Android Authority 今日报道,欧洲广播联盟(EBU)与 BBC 近日联合评估了 ChatGPT、Gemini 及 Perplexity 等多款 AI 系统在新闻摘要方面的表现。研究动因在于,现有约 15% 的 25 岁以下年轻人主要通过 AI 获取新闻

BBC 最初通过大规模问卷调查及六场焦点小组访谈收集公众对 AI 新闻工具的使用体验与看法,随后 EBU 将这项研究扩展至国际范围。

研究显示,约 42% 的英国成年人表示信任 AI 内容的准确性,年轻群体的信任度更高。不过,84% 的受访者认为,一旦出现事实性错误,将严重削弱自己对 AI 的信任。问题在于,这些系统的“不准确度”究竟为何,以及用户是否真的察觉到了这些错误。

结果显示,大多数 AI 生成的内容都存在问题。各模型整体表现差距不大,但 Gemini 成为明显“异类”,不仅错误数量最多,严重错误的比例也远高于其他系统

研究指出,Gemini 的问题主要包括:缺乏清晰的资料来源链接、未能区分可靠信息与讽刺内容、过度依赖维基百科、缺乏足够语境,以及错误引用原文

在六个月的研究周期中,各大 AI 系统的表现都有改进,新闻摘要的准确率普遍提升,Gemini 的进步尤为明显。但即使如此,Gemini 的表现仍明显落后于其他系统。

IT之家附报告链接:News Integrity in AI Assistants

相关内容

热门资讯

爆火!深圳这个地方即将全是人人... 共赴一场红树林诗意之约2025国际红树林之夜邀您“美美与共”吃限定美食、玩VR秘境在深圳做一次“红树...
甘孜文旅“十四五”时期成就斐然... 来源:环球网10月24日上午,四川省甘孜藏族自治州人民政府新闻办公室举行“辉煌75载·奋进新甘孜”建...
浙江台州:游“牛头烟雨” 赏山... 来源:环球网烟雨朦胧中,山海台州展开一幅水墨长卷。近日,随着浙江省台州市椒江区海门街道新“海门八景”...
山海之城的流量密码,解码青岛文... 一处网红街角、一棵“孤独的树”、一艘“日落橘子海”游船、一杯泡沫升腾的啤酒……从欣赏山海美景的拍照打...
秋日美景中国红叶第一山在四川,... 爱旅游,爱生活。旅游可以放松自己的心情,你有好久没来一场说走就走的旅行,忘掉不顺心,迎接新的幸福旅程...
湖北孝感:千年文化之城的文旅新... 在江汉平原的北部边缘,有一座城市,它的名字本身就是一个动人的故事——孝感。公元454年,此地因“孝行...
最佳观赏期已至!潭溪山悬崖红叶... 近日,随着气温下降与秋意渐浓,潭溪山旅游度假区迎来一年一度的悬崖红叶奇观。景区内黄栌、枫树等树种已陆...
夕阳余晖浸染古运河 枣庄台儿庄... 齐鲁网·闪电新闻10月24日讯 金秋十月,夕阳余晖浸染枣庄台儿庄。古老运河与现代化南水北调泵站并肩,...
深中通道西人工岛即将开放观光!... 打开百度APP畅享高清图片 明日(10月25日),深中通道西人工岛将开放观光。作为深中通道桥隧转换的...
【用AI联通】解锁酒香中“AI... 从《诗经》中的“微我无酒,以敖以游”,到三国《短歌行》的“对酒当歌,人生几何”,再到唐诗宋词的“劝君...