文|逐浪PRO
生活中,越来越难找到打开搜索引擎的理由了。
吃饭有点评软件,出行有导航地图,看新闻有资讯APP,购物有网购平台,聊天有社交媒体。越来越多搜索行为正从传统搜索框转移向一个个独立的APP。
传统搜索引擎的优势荡然无存,处境尴尬。而AI浪潮的来临,让传统搜索有了新的进化方向。
OpenAI正式上线ChatGPT的实时搜索功能;谷歌宣布其“双子座”AI模型将整合谷歌搜索功能;百度的AI智能回答,对文心大模型日均调用量超6亿次。
一场AI时代的搜索新“战事”正在上演,但AI搜索能否在用户生活中,提供足够“必要”的价值,仍是一个值得商榷的问题。
被抛弃的传统搜索引擎
一直以来,百度都长时间占据着中国互联网搜索领域的主导者位置。但随着用户搜索行为的多元化,传统搜索引擎的用户正在逐渐流失。
年轻人们在微博搜明星动态、热点新闻,在抖音和快手消耗琐碎时间,在小红书寻找经验攻略。
今年6月,钉钉总裁叶军曾在一场企业家论坛上谈到搜索变革,他表示,搜索场景已经被变革掉了,百度也得马上跟进,如果再不跟进,大家也不会用百度了。
搜索的前提,是平台有足够的内容,满足用户的信息需求。PC时代,所有内容通过网页展示,传统搜索引擎依赖爬虫技术,抓取互联网上的网页,然后进行清洗和排序。当用户输入查询的词条后,搜索引擎会根据其算法对网页进行排序,并将结果展示给用户。爬虫抓取的信息数量越多,质量越好,传统搜索引擎的体验就越高。
而在移动互联网时代,互联网入口变为手机上一个个APP,各APP厂商不愿意再将左右生死的流量权,交给搜索引擎,便高筑墙,深挖沟,将爬虫挡在门外,并加强运营机制,将优质内容、独家内容留在门内。于是,移动互联网时代,各APP内容孤岛化严重,信息从此不再“互联”。
流量的走向,重塑着新的互联网格局。但传统搜索处境下滑的同时,各独立APP的搜索量与日俱增。
小红书有将近70%的月活用户有搜索行为,1/3的月活用户打开小红书的第一件事就是直奔搜索;2023年,抖音生活服务搜索GMV增长254%,商品搜索GMV增长143.8%;2024年第二季度,使用快手搜索的月活跃用户近5亿,同时单日搜索次数同比增长超20%。更不用说微博的热搜,凭借搜索,缔造了一个又一个顶流话题。
就目前而言,传统搜索引擎已经落后于时代,其本质原因,在于搜索引擎并不生产内容,只是内容的搬运工,而搜索内容的需求已经被内容方满足。
生成式AI的诞生,给了传统搜索引擎更沉重一击,人们不再需要在搜索结果中,寻找所需信息,AI已可以通过自然对话方式,代替思考,提供答案。
人们直接跳过“搜索”,直达信息的彼岸。
之于搜索引擎,这是鹤顶红,却也是回魂丹。受威胁最大的传统搜索引擎,成为生成式AI最忠诚的拥趸。
2023年初,微软宣布与OpenAI合作,推出了由AI驱动的Bing搜索引擎和Edge浏览器。
同年5月,谷歌推出由生成式AI驱动的搜索引擎。谷歌称,这是谷歌搜索引擎多年来最大规模的一次革新。
2023年8月,昆仑万维推出了国内第一款AI搜索引擎,2个月后,百度也将旗下的简单搜索升级为AI互动式搜索引擎,在搜索页面内置文心一言大模型技术。
今年6月,360公司正式发布了“360AI搜索”和“360AI浏览器”;同一个月,知乎发布AI搜索产品“知乎直答”;7月,夸克升级了“超级搜索框”,推出以AI搜索为中心的一站式AI服务。
行业出现了“无AI,不搜索”的趋势,并且各大厂商为AI搜索赋予重任。
生成式AI,正在生成传统搜索的未来。
AI搜索难当大任
AI搜索引擎与传统搜索引擎有着显著的区别。
传统搜索引擎像一个图书馆的目录卡,用户需要提供书的具体书名或作者,才能找到书的位置。AI搜索引擎更像一个图书管理员,用户只需要告诉它大概的信息,它就能找到相关的书,并总结书中的主要内容。
而且,AI搜索还不局限于文字,能理解和索引视频、图片、语音等内容。还能实现了AI写作、AI文件总结等操作。
但AI搜索的发展似乎并不顺利。以上一切全新体验的前提,在于搜索的结果,务必精准。
谷歌 AI搜索上线不久后就闹出了不少笑话。很多用户都反映,AI搜索在“胡言乱语”。
一位用户向谷歌AI搜索提问“我每天应该吃多少块石头”,得到的回答是“根据加州大学伯克利分校地质学家的说法,人们每天应该至少吃一块小石头”。
在今年的百度世界2024大会上,百度发布检索增强的文生图技术iRAG,可结合百度搜索的图片资源,消除大模型,生成各种超真实的图片,“去除了机器味儿”。
而在媒体复刻发布会所展示的“爱因斯坦与天坛合影”指令时,大模型仍然出现错误幻觉:原本三层护栏,变成了四层甚至五层。
就目前而言,AI搜索生成答案的准确性和可靠性依旧难以保证、容易出现事实错误,且生成的内容缺乏深度、无法提供有效的溯源。
诺贝尔经济学奖得主保罗·克鲁格曼曾在社交媒体上批评了当前的人工智能,称它比没用还糟糕,“有很多关于谷歌和其他搜索引擎退化的消息。这是真的,让我的工作变得困难”。
同时,AI的滥用还在加剧互联网信息的混乱,产生很多无效信息、虚假信息,混淆了正常搜索的结果。
今年1月,江西南昌的一家MCN利用AI工具日产7000篇文章。文章内容真假混杂,甚至引发了网传西安有巨大爆炸声的谣言。
温州公安最近也抓捕了一位网络作者。该作者利用AI工具批量改写网络文章,发布到信息平台从而获得文章收益,最终造成了诸多不良的社会影响。
伴随着AI工具的普及,AI制造的无用、虚假信息的数量也越来越多。
清华大学新闻学院的报告称,近一年来,经济与企业类AI谣言,增速高达99.91%。谷歌研究人员也发现生成式AI造成的虚假信息正在互联网上泛滥成灾。
虽然,目前AI引发的内容风险还没有上升到“威胁生存”的地步,但按照AI的发展趋势来看,这种伪造或篡改的信息会越来越多。
最终导致互联网的信息更加混乱,使得真实与虚假之间的界限模糊。
甚至AI自己,也将在越发低质的语料库中停止进化与生长。
信息荒漠时代
随着 AI 生成的错误和无意义的信息会不断累积,互联网的错误、无用信息占比会逐步增加。
清华大学新闻学院新媒体研究中心主任、跨学科知名学者沈阳说,AI生成的内容急剧增加,大量自媒体文章的内容由AI自动生成,而AI幻觉产生的错误就夹杂在这些文章当中,这也会造成整个互联网的内容质量进一步下降,导致数据质量的整体下降。这种现象被称为“数据退化”。
AI的训练和学习需要大量的网络信息,但大量虚假和无意义的信息只会让AI陷入混乱,产生错误观念。
不止如此,AI除了要面临劣质内容的侵害,还面临优质底层信息的短缺。
研究公司 Epoch AI表示,到2028年,文字资料将会被消耗殆尽。而这些数据是人类在在过去几个世纪里,创作的大量文字、视频。
也有人试图用AI生成的信息训练AI,但结果并不美好。国外的科学家发现,如果 AI 只学习其他 AI 生成的内容,那么经过几代训练后,AI 将输出无意义的垃圾信息。
他们把这种现象称为“模型崩溃”。
当前正处于信息大爆炸时代,我们所有人都被大量的信息所包围,但是对于AI而言,这是一个数据匮乏的时代。
对AI而言,谁能帮助AI摆脱信息匮乏的窘相,谁就掌握了AI发展的未来。为此,OpenAI、Anthropic、百度等公司都在积极开发更优质的合成数据,以此克服挑战。但大多数学者都持悲观态度。
今年11月,有外媒报道,OpenAI下一代旗舰模型“猎户座”(Orion)的性能提升幅度,小于GPT-4相对GPT-3的提升。
其创始人奥特曼曾表示,可能不会把新模型命名为GPT-5。
多位专家劝说AI公司停止训练大模型,“如果当前趋势持续,人工智能很快就会耗尽其可用的训练数据。面对这种情况,AI公司可以选择停止追求规模更大、更复杂的模型。”
AI是当前互联网进步的主要动力之一,尤其是对搜索引擎而言,谁能突破AI的限制,谁就掌握了搜索市场的未来。
只是,这杯庆功酒遥遥无期。
评论