当“生成式引擎优化”(GEO)黑产被曝光,当几十元的软文能通过技术手段在几天内变成AI口中的“标准答案”,我们猛然惊觉:在这个信息唾手可得的时代,“真实”反而成了最稀缺的奢侈品。
曾经,我们惊叹于AI的博学多才,它能瞬间生成文章、解答疑惑。但当AI开始“一本正经地胡说八道”,当算法推荐的内容充斥着被“投毒”的虚假信息,用户开始怀念那个简单直接的年代——那个只需“百度一下”就能找到靠谱答案的年代。
正如在商品大爆发的时代,精选好商品、价格透明的胖东来因为“靠谱”而门庭若市。AI也正在制造一场失控的信息“熵增”,重塑用户信任成了当务之急。
315晚会揭露的GEO黑产,像是一面照妖镜,映射出当前AI搜索的软肋。
在利益的驱使下,黑灰产团伙利用AI抓取和生成的特性,通过大量发布虚假、夸大的软文,利用算法漏洞将劣质内容甚至虚假广告包装成“事实”。对于缺乏辨别能力的AI模型来说,这些海量的虚假数据成为了训练的“养料”。
在这些AI生成的结果中,你并不知道被哪家公司“投喂”了偏好自己的内容,结果已经失去了公正。在社交媒体时代,这些被误导的结果,会被大范围传播造成严重后果。
比如,前不久在股吧里传出一个来自豆包生成结果的截图:“某互联网巨头2月19日发布第三季度财报显示XX”,这个消息同步在雪球、同花顺、富途证券的论坛里发酵,第二天该互联网公司的股票就出现了不小幅度的下跌。
事实上,截至3月19日该互联网公司才发布第三季度财报。因此,豆包生成的结果欺骗了股民,又通过社交媒体、论坛制造了股市的恐慌。
这种现象背后,是AI技术难以规避的“先天缺陷”——幻觉。
AI本质上是一个概率模型,它擅长组合信息,但不擅长验证真伪。它无法像人类一样去追溯信息的源头,也无法判断一个网站是权威媒体还是营销号。当源头的水质被污染,AI生成的“答案”自然也是有毒的。
近期,演员刘美含在社交媒体上的一次吐槽引发了全网共鸣。她在配音时遇到“铸币坊”一词,向包括百度AI、DeepSeek、豆包等在内的5款AI工具提问“坊”字的读音。结果令人咋舌:多款AI给出了错误的“fāng”(一声),只有百度AI给出了正确的“fáng”(二声),并引用了《新华字典》的权威释义。
这个案例极具讽刺意味。当越来越多的人说要用AI替代搜索的时候,AI大模型们对于最为基础的语言文字却翻车了,而依托传统搜索技术的百度AI却守住了底线。
当前的世界出现各种“过剩”,也让选择变得更加困难,信任就变得弥足珍贵。AI需要具备建立信任完善机制,遵从“少即是多”的哲学原理,只有如此才能长久。
当前,制造和传播信息的门槛已经降为零,UGC的时代导致大量消息、短视频、文章把我们淹没了。就如当前中东战争,在微博上、朋友圈里、公众号里,各大自媒体平台上,都有许多虚假信息。为了躲避这些虚假信息,我只能关注央视国际频道等少数权威官方媒体报道。
同样,在商品大爆炸的时代,为何胖东来如此火爆?因为胖东来严苛的供应商管理机制和透明的价格体系,为消费者建立了足够的信任,也让消费者从各种虚假、噱头的商品传播中抽身出来。
在AI陷入信任泥潭时,以百度、谷歌为代表的传统搜索引擎,其核心价值也正在被重新审视和重估。
传统搜索的价值,不在于它能替你写诗作画,而在于它构建了一套严密的“真实世界映射系统”。它不创造信息,但它致力于筛选和连接最真实的信息。特别是在百度百科、百度文库等核心知识产品上,百度建立了一套AI难以复制的“权威性过滤网”。
百度百科之所以能成为中文互联网最大的知识库,核心在于它对“权威信源”的死磕。
不同于UGC内容的随意发布,百度百科执行的是“先审后发”机制。这不仅仅是机器审核,更有人工的层层把关。特别是对于人物、企业等敏感词条,百度百科要求必须提供新华网、人民网、央视等主流媒体的报道作为佐证。
在2024年底发布的“繁星计划”中,百度更是联合了中国科学院大学、北京大学等顶尖机构的超10万专家,共建了超过100万个专业词条。这种“专家共建+权威审核”的模式,构建了一道对抗虚假信息的铜墙铁壁。在AI满嘴跑火车的时候,百度百科依然在坚守“有据可查”的底线。
百度将传统搜索的严谨于AI的智能进行深度融合,依托百度百科、百度文库等核心数据资源,可以构建起比其他AI产品更值得信赖的系统。这也是为何百度AI大模型生成结果的幻觉更少的原因。
对此,笔者专门采访了百度AI的技术人人员,他提到百度AI将搜索技术融入其中,为AI生成结果设置了“三道防线”。
第一道防线,多源比对,全维度身份核验。 系统会自动抓取信息的发布时间、作者权威度、站点信誉。只有那些来自权威专业领域、时效性强的信息,才有资格进入AI的“视野”。
第二道防线,多源交叉验证。这是最关键的一步。AI不会采信单一来源的说法,而是必须经过“多方求证”。同一个结论,至少需要多个可信来源支撑,才会被采纳。这就从根源上杜绝了单一虚假信息误导用户的可能。
第三道防线,实时巡检,秒级纠偏。 即便如此,系统还搭建了“秒级响应”的自动巡检机制。一旦发现内容有偏差,系统与人工会立即介入,重新生产内容。
正是这套“笨功夫”打磨出来的系统,让百度AI在面对“铸币坊”这类专业问题时,能够精准地调用《新华字典》等权威数据,而不是胡乱猜测。
得益于“三道防线”带来的信任价值,百度搜索Skill(技能插件)已经在OpenClaw的全球技能市场中冲上了下载量第一的宝座。
开发者们深知,搜索类Skill是智能体的“基础设施”,它决定了整个智能体应用的“智商下限”。如果搜索源是虚假的,是AI自己虚构的,或者是被“GEO投毒”影响的,那么智能体给出的所有服务都将是危险的。
显然,在AI时代,信任变得更加稀缺,因此搜索引擎再次被价值发现,正是得益于其不做“幻觉制造机”,只做“真相连接器”的产品定位。
最近,社交媒体上涌现了许多“怀念百度一下”的声音。这并不是用户对技术的倒退,而是对信息质量的觉醒。
当AI开始用华丽的辞藻编织谎言,当算法推荐让我们陷入信息茧房,我们才发现,那个简单的“百度一下”,承载的是互联网最初的理想——让所有人平等、便捷地获取真实信息。
热力学第三定律讲“熵增”。当前的信息世界就进入了巨大的“熵增”时代,这给人们精确获取信息设置了门槛。在这个时代,最终取胜者并不是依靠信息生成的能力,而在于如何给用户带来信任,降低“熵增”导致的混乱。
下一篇:阿里:电商再沦陷,AI才是大救星