大模型兴起之后,有人说所有的行业都值得用AI重做一遍。那如果是AI和搜索结合,是不是能产生更好的效果?这篇文章,作者分享了AI搜索的一些底层知识,能够帮你,更好的用AI搜索。
早上朋友发信息给我:
智远,你可以呀,现在厉害了,不仅写作,还成了当代艺术家,还去悉尼、新加坡办画展,业务够多,忙得过来吗?
我顿时不知道怎么回应,惊讶又好奇的回了句:纳尼?
紧接着,朋友发来一张截图说:你看。我一看,天呐,AI搜索把我的资料和另一位同名人的资料,混在一起了,太坏了。认识我的还行,不认识的明显会被误导。
这两年,不少大模型公司布局AI搜索,很多人也感受到技术带来的快捷,不过,使用过程中,根本没意识到信息是否准确。
所以,怕你被AI误导。
我抽出时间,做了一个简单科普,比如:AI搜索的决策模型什么样?为啥机器味严重?AI搜索和内容平台的关系是什么?未来搜索会发生什么革命性变化等等。
毕竟了解底层知识,能够帮你,更好的用AI搜索。
01、有个词叫缸中之脑(Brain in a Vat)。什么意思呢?
想象一个血腥的画面:
你(或者别人)被一位疯狂的科学家,进行一次可怕的实验。他把大脑从身体上取下来,放进一个装有维持大脑存活的营养液的玻璃钢中。
然后,大脑神经末梢,连接到一台超级计算机,计算机按照设定程序,向你的大脑发送各种信息,让你以为以前很正常。
那么,对取出来的大脑来说,世界是不是依然和原来的一样?你看到的人、物体、天空,感受,还有记忆,是不是都还在?
这个实验,常用来说明怀疑论、唯我论和主观唯心主义的观点,简单讲:即我所体验的、看到的、到底是真的假的呢?
怕你共情不多,我再举个例子:
好不容易休息半天,躺在沙发上,看着外面阴雨天,突然想到昨天刚上映的恐怖片,还没看。于是,打开影片,刚看一半,心跳加速,你决定不看了。
为什么?因为太恐怖了。恐怖画面的信息,一次次传递到“缸中之脑”,让你觉得太真实,似乎恐怖画面马上要出现在自己身上。
但你知道吗?这些都是大脑模仿出来的,看似真实,未必真实,我们的感知,不仅由大脑产生,身体,也会影响它。
比如:
521到了,即便没有见面,你总送心爱的人一些温暖的东西,一杯奶茶、一束鲜花,她收到礼物那一刻,在远方也能感受到你对她的好看。
这就是具身认知,是思考,感觉、行为三者共振的结果,认识到它,你能感受到,外面我们接收到的任何信息,故事是一个个画面,所描绘的场景只要大脑熟悉,它都会共鸣。
而AI搜索,是什么呢?本质像一个“缸中之脑”。
运行在一个强大的模型上,模型像它的基础,帮它站稳脚跟,外面信息是它的食物,通过你的搜索,不断训练自己推理能力。
不论什么AI搜索软件,当你问题时,它都会遵循一个六步走的公式:
- 理解问题
- 检索信息
- 整合答案
- 生成回答
- 结果验证
幻想一下,现在来到未来时代,站在图书馆里,面前有一个人工智能,现在要找一本《穷查理宝典》,你会怎么做?
你可以手动输入,或者对着它说:“帮我找一本叫《穷查理宝典》。”此时,AI会利用语言技术,快速分析你的意图,提炼出最重要的部分,比如:书名、作者、人名。
然后,它会把你的问题和图书馆里的文档、图片快速匹配,从中找出重要的段落和句子。接着,它会做降噪处理,去掉干扰的内容,比如广告、重复的段落,确保剩下的都是有用的信息。
最后,AI会把所有找到的信息整合起来,生成一个答案,这就是AI搜索的过程。不难理解吧。
我突然想到一个画面:
小时候,老师经常说:“哎,你们是我带过最差的一届,要是无法理解,就把这段内容死机硬背下来。”,可你有没有想过,考试对死记硬背来说,意图是什么?
从人工智能角度看,答案只有一个词:检索。
也就是说:你背诵的所有资料,最后一刻,学校用一张试卷来检索大脑有没有记住,当成绩达标时,证明你通过了。
02、明白AI搜索的六步公式,能得到什么启发呢?
有两点:
- 知道AI的回答为什么很干巴
- 知道它为何缺乏情感和个性。
AI搜索生成逻辑有一些限制,为避免产生错误信息和不准确的信息,AI会倾向于保守地给你高频、标准化的表达。这种倾向自然会使回答显得更加刻板。
比如:
你问AI如何做好品牌营销?它一定会告诉你,首先要了解目标市场,然后创建一个独特的品牌定位,接着进行市场推广,最后通过反馈不断优化品牌策略。
另外,作为“缸中之脑”,AI只有一个搜索框,无法感受你的语气,看不到其他信息,所以也无法理解你的情感。
这样一来,AI生成的答案就缺乏人类的情感色彩和个性,看起来很机械,或者像是官方的回答。
值得一提的是:人们常说,一个人学习什么知识,他的见识就有多高。AI也是一样的。你给它喂草料,它自然吐不出钻石来。
所以,大公司为了防止AI搜索出来的内容很水,就会限制训练内容,会给AI喂新闻报道、学术论文和正式文本。这些文本风格比较客观,所以,AI学完后,回答也会是类似的风格。
现在AI搜索虽然看似有推理能力,但我测试了很多,发现整体推理还是比较弱。
一个主要原因,人类说话时,本身推理性就不强。所以,AI学习的内容也会相对较弱。在文字相关的搜索上,这种情况很常见,理科的内容相对更严谨一些。
显然,“缸中之脑”就是“缸中之脑”。看似聪明,但离不开三点:
- 大模型作为基础
- 固定的模型
- 知识库。
因此,重要的结论是:用AI搜索时,你不给它一个很健全的 prompt,它的解析能力会变得很弱,得到的答案自然很难让人满意。
03、你有没有想过,AI搜索平台和内容生态到底什么关系?
我觉得,从过去的传统搜索,到现在AI搜索,用一句话来形容转变的过程便是:从独立到融合,再到独立。
为什么呢?
没有大模型之前,谷歌在1998年开始做大规模搜索,后来进军中国,由于数据方面的问题,谷歌被限制,随后,百度在2000年快速崛起,靠爬虫抓取大量网页,然后分发和售卖广告起家。
这两家公司商业模式基本相似。
谷歌做了一个叫Knowledge Graph的知识库,还有Google Answers,百度则推出了“百度知道”和“百度百科”。
后来,国内360、搜狗也跟着做类似的产品。网页时代落幕,张一鸣用一个算法推荐,让今日头条拔地而起。头条采用推荐机制的同时,也尝试建立内容生态。
比如:
孵化垂类创作者,推出各种与内容相关的产品,但直到现在,我都觉得它还没成功,今日头条增长停滞后,头条搜索也没法跟着增长。
后来短视频涌现,抖音起来,它建立一个良好的内容生态和增长模式,所以,抖音搜索成功了。
不管怎么样,它们的核心目的只有一个,把内容控制在自己手里,通过掌握内容,建立壁垒,因为内容生态对搜索平台有很大的依赖性。
内容提供者,要依靠搜索引擎,来让内容被更多人看到,而搜索引擎,则要高质量的内容来吸引用户,并提供有用的搜索结果。
有了大模型之后呢?
微软推出新版必应,紧接着谷歌、百度、360和昆仑万维等企业也开始布局AI搜索。
李彦宏一直强调,把生成式AI技术和搜索深度整合在一起。周鸿祎也说,做搜索引擎的企业,最有机会研究像ChatGPT这样的产品,还有昆仑万维、秘塔AI也在加紧跟上。
不管怎么说,它们有相似之处:整合全网信息,让用户用自然语言表达需求,并提供经过组织和提炼的答案,这样可以减少冗余信息的时间消耗,确保答案的可追溯性、可信赖性。
不过,尽管这些搜索引擎,凭借原有的知名度、用户基础在市场上占据主导地位,由于移动互联网时代APP的“信息孤岛”现象,它们并没有完全掌控所有信息,反而,垂直搜索引擎正在逐渐崛起。
比如:
小红书推出自己的搜索,今日头条推出豆包,淘宝推出原生AI应用——淘宝问问,它嵌入淘宝搜索框,服务于月活跃用户近9亿、每日产生数百亿次搜索的庞大流量。
现在,抖音搜索量在移动端已经超过百度,小红书通过用户的真实分享和有用的笔记,建立了强大的社区氛围,这都是各自的优势。
因此,我看到两种趋势正在出现:一是通用搜索的AI升级,二是垂类搜索的崛起。
垂类搜索数据,主要来自自己的平台,类似于站内搜索,信息更服务于细分场景。当信息量足够多时,就会自然涌现。
长远来看,拥有优质内容的社区,做的搜索会更有优势,因为好内容平台能够吸引和留住用户,进而提升搜索功能的价值和使用频率。
明白这些也就理解了,我为什么说,搜索会经历从独立到融合,再到独立的过程。毕竟,独立,是全新的独立,是细分的独立。
实在不信的话了,你想想360AI、秘塔AI,天工AI到底有什么区别?把它们和淘宝问问、抖音搜索一比更明确呢?因此,未来优质内容社区的搜索功能将会胜出。
04、到这里,我们可以思考下:AI搜索的本质是什么?
我认为,AI搜索真正的关键在于AI技术本身,而不是传统的搜索方式。这就像“AI+”和“+AI”的区别。
AI+,更像把AI技术加到已有的系统或产品上。比如,在传统搜索引擎上加入AI功能,这种方式主要在现有技术基础上,增强功能。
+AI,不一样。
要求从一开始就以AI为核心,建立一个系统或产品。比如,设计一个完全依赖AI进行的搜索引擎,它所有功能都围绕AI技术展开,更像是从头开始,完全依赖AI技术运作。
很显然,“AI+”是改进现有系统,而“+AI”是从零开始,完全依靠AI技术。AI搜索真正力量在于后者,也就是“+AI”。
对于一般简单问答,AI搜索只弥补传统搜索的不足。但要真正创新和突破,要寻找新的应用场景和特定领域,比如学术、医疗、法律等。这些领域中,AI驱动的搜索才能真正发挥战略意义。
“AI原生”(AI Native)很重要,因为经过多年的发展,传统方法已经挖掘了所有可能性,AI原生的定义是,只有在引入AI能力的情况下,产品才能实现。
这种情况下,AI是最大的变量,但AI比例并不重要。
关键在于产品需要找到交叉点:哪些场景是只有AI才能实现?同时又满足大规模用户需求。这种探索越多越快,竞争优势就越大。这也是对各家产品经理的巨大考验。
那么,问题来了:
有人会觉得,传统搜索市场还有价值吗?肯定的。
传统搜索的强项在于寻址和寻找资讯。从商业角度看,PC端搜索市场增量有限,移动端又被抖音、小红书等平台分流,不过,百度财报中,搜索引擎依然是基本盘的重要组成部分。
还有人认为,谷歌和百度垄断这么多年,其他玩家还有机会吗?来看一组美国statcounter机构的数据:
截至2024年5月6日,美国搜索市场中,谷歌份额下降到了77.52%,其他市场被Bing和Yahoo蚕食,但谷歌基本盘还算稳。国内截至4月,电脑端必应的份额是37.24%,百度是22.53%,但百度的主导地位已经不在了。
虽然数据会存在偏差,但能看出搜索市场的变化和机会,AI搜索更应该理解用户意图,完成复杂的任务。
比如:
用户搜索不仅仅是寻找信息,还包括找地址,或查找短内容的源头;再比如,通过AI找到过去5年城市人口的发展趋势,甚至,搜索新能源汽车的渗透率趋势和原因。
还有找电影、追溯图片等等……,所以,需求背后,是AI搜索目前还没有攻克的场景。
总结而言
AI+,还是+AI,要看企业选择。
不论哪条路,我都认为,垂直领域的数据,将成为重要开采对象,不然怎么向数据要增量?那么问题来了:什么样的垂直数据还未被开采呢?嗯,值得思考的问题。
本文转载自:公众号:王智远,不代表爱氧气立场,平台仅提供信息存储空间服务。
本网站属于非赢利性网站,如对本稿件有异议或投诉,请联系(iyangqi@qq.com)爱氧气处理。