为什么说AI搜索不只是搜索?
作者|王艺
编辑|王博
经历了几轮爆料后,AI搜索赛道终于迎来了一位“重要玩家”——SearchGPT,一个由OpenAI推出的AI驱动的搜索引擎。
早在今年4月,就有工程师爆料OpenAI内部正在评估自己的AI搜索产品SONIC-SNC(SearchGPT);5月初,OpenAI即将发布搜索产品的消息更是在网上大面积传播。然而,直到三个月后,OpenAI的SearchGPT才正式亮相。
SearchGPT的推出并不让人意外,大家更关心的是, 搜索到底行不行,有没有抢夺传统搜索引擎市场份额的机会?
OpenAI CEO萨姆·奥尔特曼(Sam Altman)对此似乎很有信心,他将SearchGPT称之为“new prototype(新的产品原型)”,并直言“我们认为今天的搜索还有改进空间”。他还表示,跟“老派(old-school)”搜索引擎相比,全新的SearchGPT令自己惊喜,对自家新产品毫不吝惜溢美之词的同时,也丝毫不给谷歌、Bing等竞争对手留面子。
目前,AI搜索赛道竞争激烈,不仅有New Bing、Perplexity、You.com、Lepton Search、Genspark、Hebbia等优秀的海外产品,还有秘塔AI搜索、360 AI搜索、天工AI搜索、博查AI搜索、Reportify、Devv等发展势头迅猛的国内产品。
在谈到SearchGPT时,360集团创始人周鸿祎告诉「甲子光年」:“OpenAI本来做的是ChatGPT,他们觉得聊天界面能够解决一些问题,但现在不得不做一个平行的SearchGPT,作为新的用户体验和入口。 到底是Search好用还是Chat好用我们暂时不知道,有可能会平分秋色,也有可能一个被另外一个取代掉, 但这至少说明AI搜索是重要的场景入口,大家都不能错过。 ”
都说AI搜索重要,但AI搜索面临一个挑战是商业模式到底如何建立。“成本如果很低,用广告可以,但现在很难放广告,广告都不一定cover你每个单词搜索的成本。”周鸿祎说,“不是所有用户都愿意付费的,这个需要探索。”
本文,「甲子光年」将拆解SearchGPT及相关AI搜索产品,分析AI搜索产品的壁垒、突破和未来。
1.AI搜索不是搜索
要理解OpenAI搜索产品的优势,首先要理解AI搜索产品底层的运作原理。
目前市面上的 搜索产品主要有三大类,分别是专门的AI搜索产品、传统搜索引擎推出的加入了AI能力的产品和大模型厂商做的有搜索能力的产品 。
第一类以Perplexity、秘塔AI搜索、Genspark为代表,第二类以New Bing、Google AI Overview为代表,第三类以Kimi、豆包、腾讯元宝为代表。OpenAI虽然也属于大模型厂商,但是由于他们有了ChatGPT这一大模型产品,因此重新开发了专门的AI搜索产品,SearchGPT也因而归属于第一类。
AI搜索的底层原理其实可以用“RAG(Retrieval-augmented Generation,检索增强生成)”来概括,涉及Retrieval和Generation两个步骤。其中,大部分的“Retrieval(检索)”是由传统搜索引擎的API来完成的,少部分采用自建索引库的形式;而AI搜索产品主要做的事情就是拿到结果后的“Generation(生成)”,用AI代替人工, 阅读检索内容, 总结归纳后给到用户一个直接的答案。
当然,这背后的链路会更加复杂,包括问题改写(Intent Detection)、检索结果重排(Reranking)、获取详情内容(Read Content)等一些重要的环节,大模型在读取检索内容之后,还要对检索结果做预处理、搜索解决方案展示等工作。AI搜索的整个过程会涉及对大模型的多次调用,比如360做一次AI搜索就要调用9次大模型。
但是总体来说,AI搜索产品仍然是基于成熟的搜索产品发展而来的,检索步骤调用外部的API就能解决,上下文增强和总结和生成步骤也只需调用底层大模型的能力。换句话说, AI搜索产品相较于传统的搜索产品,并不是在做技术层面的创新,更多是在做产品层面的创新。
这也是为什么Perplexity称自己为“ 答案引擎 ”的原因——作为一个从搜索API到底层大模型都直接“套壳”的产品,Perplexity并不提供直接的搜索能力,而是通过接入API获取了搜索引擎检索的内容之后,再通过GPT-4、Claude等大模型将答案进行总结,最终整理成固定的格式呈现给用户,帮用户省去了逐页查看和总结的时间。
能用“套壳”做出30亿美元的估值,可以说,“套壳之王”Perplexity的胜利,不是技术的胜利,而是技术之上产品封装的胜利,是对用户需求精准洞察后,快人一步出击的胜利。
因此,AI搜索不是搜索,而是总结。AI搜索产品真正比拼的也不是底层的技术能力,而是技术之上,谁能提供更准确的答案、更快的响应速度、更智能化的用户体验。
其中,“准确”是最关键的一点。 搜索最大的壁垒是数据 , 要想得到准确的答案,底层数据的质量和数量至关重要 。只有底层数据库足够大、容纳的信息足够多、信息更新得足够及时,才能保证大模型在内容获取的时候“有据可依”,从而总结和输出更准确、更有时效性的内容。这也是谷歌为什么在搜索引擎领域常年保持90%以上市占率的原因——他们从1998年成立的第一天起就开始做索引,拥有全世界最大、最全的索引库,能够提供最准确和及时的搜索结果。
因此,想要让搜索结果变得更准确, 自建索引库 是很重要的解决办法。
目前,绝大多数AI搜索产品都只是接入了传统搜索引擎的API,没有重新做一套底层的搜索系统,只有少部分如秘塔AI搜索(播客和文库板块)、360AI搜索以及少数的垂直AI搜索引擎搭建了索引库。这主要是由于接入传统搜索引擎的API已经能解决95%的问题了,加之自建索引库的成本非常高昂,需要大量的人力财力和时间,因此,如果自建的索引库不能提供比Google和Bing的API更加优质的内容,就没有必要自建索引库。
自建索引库的成本有多高呢?360副总裁梁志辉曾经在一次播客中表示,爬取5000万网页的成本大约在100万-200万人民币左右,但是5000万网页对于搜索引擎来说是很小的一个数字,基本上做一个搜索引擎,起码要爬取1000亿的网页;如果要索引全球网页的话,基本上需要3000台-1万台服务器提供支持。
也就是说,做一个最简单的搜索引擎,起码要有20亿-40亿元的预算,这还不包括PageRank(网页排名)的服务器成本、终端厂商的保护费成本和人员成本。这对于任何一家中小型创业公司都是难以逾越的成本。
这也是为什么目前搜索引擎只有谷歌、微软、百度等几家大厂在做的原因——做搜索引擎成本太高了,只有大厂才有充足的资金、人才和设备去做这件事。
而除了成本高昂,搜索技术和算法也是相当有壁垒的一件事。以谷歌引以为傲的排名算法为例,它考虑了数百个不同的因素,包括内容质量、用户体验、移动友好性、页面加载速度、安全性等,不仅结构复杂,而且还会根据外界环境实时进行更新。据悉,谷歌平均每天发布6次算法更新,每年高达2000次;而且算法保密度极高,谷歌公司内部都没几个人知道其搜索排名算法的全貌。
可以想见,在如此巨大的成本+超高的技术门槛下,中小搜索引擎/AI搜索公司想要自建面向全网索引库的难度无异于愚公移山。
然而,这难得倒中小公司,却难不倒OpenAI。
作为一家累计融资额超过200亿美元、以高人才密度著称的公司,OpenAI在“钱”和“人”上自然都是不缺的。因此,他们完全有能力自建索引库。
那SearchGPT到底有没有自建索引库呢?
「甲子光年」询问了一些工程师后,得到的普遍回答是:“以OpenAI的资金和人才体量,是有能力自建索引库的,只是由于构建全网的索引库太费时费力费钱,他们应该是构建了部分的索引库,但是不会放弃接入外部搜索API,并且用爬虫做实时搜索补充答案。”
科技媒体TestingCatalog News扒出了SearchGPT的源代码,印证了这一猜测——他们发现,SearchGPT仍然接入了Bing索引库的API,但是与当前ChatGPT提供的通用Bing搜索功能不同,SearchGPT更擅长提供实时信息。而这一点,主要是靠网络爬虫(Crawlers)实现的。
OpenAI开发者页面的声明进一步印证了这一猜测。他们在开发者平台的概述中写道:“OpenAI使用网络爬虫和用户代理为其产品执行操作,这些操作要么是自动的,要么是由用户请求触发的。”
综上,SearchGPT很有可能采用了“ 自建部分索引库+接入Bing的 +实时网络爬虫 ”三者结合的技术路线,来确保搜索结果的准确和及时。
除了自建索引库,OpenAI为自己的AI搜索产品建立起的 另一道数据壁垒,是内容 。
在SearchGPT的发布页面,OpenAI提到,他们致力于打造一个蓬勃的出版商和创作者生态系统,帮助用户发现出版商网站和体验,同时为搜索带来更多选择。
与机构媒体等专业的信息提供内容商合作是OpenAI给竞争对手的有力一击。由于付费墙和反爬虫机制的存在,不少AI搜索产品是无法抓取到专业机构媒体提供的内容的,这也造成了AI搜索产品生成结果的不完整、体验性不佳。而与媒体建立合作关系后,不少媒体的独家报道都可以在SearchGPT里搜索到,这无疑繁荣了SearchGPT的内容生态,保障了其用户体验。
除了完善底层数据和内容生态,与媒体建立合作关系也是OpenAI为了确保版权合规的深思熟虑之举。
自ChatGPT推出以来,围绕生成式AI产品的版权诉讼就络绎不绝,比如《纽约时报》已经花费100万美元起诉OpenAI和微软,对冲基金Alden Global Capital 旗下的八家出版物集团(包括《纽约每日新闻》和《芝加哥论坛报》 )也对这两家公司提起了诉讼。同为生成式AI产品的Perplexity也因为在搜索结果中使用了《福布斯》的一篇报道,但没有准确注明来源,而收到了《福布斯》的律师函。
无论是自建索引库,还是通过与媒体合作获取独家内容,都有助于SearchGPT获取高质量的数据,建立起数据和内容壁垒,进而在已经硝烟弥漫的AI搜索战争中获得一定的后发优势。
2.用低延迟和多模态重构用户体验
如果说自建索引库和与媒体合作是OpenAI为自己建立起的第一道 数据壁垒 ,那么极低的延迟、多轮问答交互和多模态的结果呈现则是OpenAI为自己建立的第二道 用户体验 壁垒 。
前文我们提到,AI搜索不是搜索,而是总结。AI技术本身解决的是“信息撮合”问题,用户使用AI搜索的目的也不只是单纯地获取信息,而是“雇佣”产品满足自己的需求。尽管大模型技术会在一定程度上强化原有的搜索能力,但想要做好一款AI搜索产品,除了信息层面之外,还要在用户端进行发力,与用户进行创意性地交互,让信息端和交互端“双轮滚动”起来,才能诞生现象级的AI搜索产品。
什么样的交互能带来好的用户体验呢?
独立开发者、ThinkAny创始人idoubi(艾逗笔)在其AI搜索引擎的万字复盘文章中提到:“做好 AI 搜索引擎, 最重要的三点是准 / 快 / 稳,即回复结果要准,响应速度要快,服务稳定性要高 。”
前文中提到的自建索引库和与媒体合作保证了“准”,那“快”和“稳”怎么保证呢?
降低回复的延迟、能进行多轮问答就很关键。
SearchGPT也确实做到了回复低延迟。从展示视频中我们可以看到,SearchGPT的响应速度堪称迅速,从输入问题到给出回答,几乎只用了1—2秒。
如果说官方视频还有剪辑的嫌疑,那么部分获得体验资格的网友放出的体验视频则消除了这一嫌疑。从视频中我们发现,SearchGPT的响应速度确实很快,从提出问题到给出答案仅用了3秒。
这种超高的“实时性”是怎么实现的呢?有两种方式:第一种是提前把数据爬好,embedding(嵌入)到向量数据库里面,第二种是实时搜索网络上的内容。这两点也是自建索引库的基础,需要用到向量搜索、实时索引、实时数据分析等技术。
OpenAI是怎么获得这些技术能力的呢?这就不得不提到他们最近的一个“大动作”。
今年6月,OpenAI以5亿美元的价格收购了实时分析数据库公司Rockset,这是OpenAI历史上规模最大的一笔交易。Rockset是一个 实时全索引数据库 ,以其 实时索引和查询 功能著称,其服务主要针对那些需要对大量数据进行实时处理和查询的应用场景,比如实时仪表板、搜索索引、流式数据分析等。
Rockset拥有一个 名为RocksDB的键值存储系统 ,它由之前同在Facebook工作过的两位联创Venkat Venkataramani和Dhruba Borthakur共同开发,特别擅长快速读写,也因此能让用户在 毫秒级 的时间内查询和分析大规模的数据集。
通过流式数据摄取、自动索引、内存优化、高并发查询等技术,Rockset可以极大提升SearchGPT对于用户问询的响应速度,确保了AI搜索产品的“快”。
除了“快”,Rockset也能保证AI搜索产品的“稳”,即多轮交互问答。
Rockset作为一个实时全索引数据库,可以提供更全面、完整的数据,也支持多维度查询,这意味着用户可以根据不同的属性和条件来筛选结果;此外,通过上下文索引、SQL查询等技术,Rockset可以让AI搜索产品更好地存储和检索上下文状态,保持会话的连续性,提升AI搜索产品的多轮交互问答体验。
在OpenAI收购Rockset之前,在解决大模型的数据索引、查询和存储问题时,业内通用的方案是给大模型加一个“外挂”,也就是所谓的“向量数据库”。过去一年,向量数据库火遍大江南北,几乎每个向量数据库厂商都在以“大模型的记忆”为卖点进行营销。而Rockset不仅能做向量索引,还能做关键字索引、元数据索引等不同形态数据的索引,可以提供更高质量的搜索结果,同时满足多样化的查询需求。
这也是Rockset在RocksDB之外的另一项核心技术—— 混合搜索(Hybrid Search)。 这是一种多方面的搜索方法(整合了向量搜索、文本搜索和元数据过滤等),灵活性强,允许索引和使用多种类型的数据,包括实时数据,也因此经常被用于上下文相关的产品推荐、个性化内容聚合等场景。这项技术在微软的New Bing和谷歌的AI Overview中发挥了重要作用。
也正是得益于这种“混合搜索”的技术能力,SearchGPT拥有了第三个亮点——多模态。它不仅能提供文字版本的答案,还在结果展示层面加入了多样式的内容维度,包括数据、列表、图片视频等,提升了信息的丰富度与可理解性。
比如,有拿到测试资格的网友问它伦敦的天气情况,SearchGPT直接给出了未来七天的天气预报,包含天气图标等小组件。
网友又问SearchGPT伦敦野餐的最佳时间和地点有什么,它在给出若干公园选项的同时,还在左侧列出了一些不同天气下伦敦的照片。
而在SearchGPT的移动端,其答案的多模态表现也很出色:比如查询英伟达的股票会给出股票走势图;再比如搜索一首歌,SearchGPT会直接给出Youtube的视频,用户无需点开网页即可播放。
为什么多模态的呈现结果这么重要?这主要是由于目前绝大多数的AI搜索产品仍然是用文字给出答案的。尽管文字回复能解决用户大部分的问题,但是在入局者增多、同质化内卷的竞争环境下, 谁能提供更多维度、更丰富的答案,谁或许就能掌握开启AI搜索下一阶段竞争的钥匙。
多模态的检索不仅对于用户更直观地理解搜索内容、提升搜索体验有帮助,更是对于产品的迭代大有裨益——搭载了多模态模型的AI搜索产品能够同时处理文本、图像、声音、视频等不同类型的数据,从多元化的信息中获取更全面的知识和上下文,这对于复杂任务的理解和执行至关重要;通过跨模态学习,AI搜索产品及其背后的模型也可以更好地泛化到未见过的情境中,提高搜索结果的准确性、适应性和实用性。
搜索结果的多模态呈现,主要来自模型能力的加持。基本上,有能力做多模态大模型的厂商,也有能力做出多模态的AI搜索产品,这也是相当一部分多模态AI搜索产品出自大厂的原因——比如360集团推出的360AI搜索支持用户通过拍照的方式提问,也支持文档、图片、音频、视频搜索;昆仑万维推出的天工AI搜索不仅支持AI识图、AI图像生成等,还具备收、写、读、聊、说、话、听、唱的多模态能力,同时还生成思维导图和大纲;小度前CEO景鲲做的AI搜索产品Genspark也能根据用户问题生成可视化的图表和图片。
Genspark搜索结果,图片由「甲子光年」拼接
而OpenAI作为世界上实力最强的大模型公司之一,其模型的多模态处理能力自然不在话下。
在SearchGPT此次放出的展示Demo中,就展示了一个名为“视觉答案(Visual Answers)”的功能,但是OpenAI并没有详细解释其工作原理。
前文提到TestingCatalog News扒出了SearchGPT的源代码,这一源代码中,不仅露出了Bing的接口,而且可以发现,搜索结果由多模态模型提供支持。尽管看不出具体是什么模型和其处理流程,但该多模态模型应该具有自动理解图像的功能。
百度数据库部门产品总架构师朱洁认为,SearchGPT要想做出和Perplexity等产品不同的体验、实现作为后来者的弯道超车,最大的看点就在“多模态”。Rockset已经提供了多模态数据的检索能力,如果能依靠多模态大模型在交互端也玩出更多“花活”,那么获得更大的用户增长指日可待。
总之,Rockset的混合搜索能力,加上OpenAI的多模态大模型助力,让SearchGPT提供了更为良好的交互体验,而这也是OpenAI收购Rockset的初心。
在收购Rockset的公告中,OpenAI写道:“AI has the opportunity to transform how people and organizations leverage their own>
OpenAI说希望收购Rockset是为其自家跨产品检索基础设施提供支持,由此可以看出,对实时数据的访问和处理已经成为当下AI军备竞赛中的重要一环。 也有业内人士指出,这笔收购从本质上说明了向量数据库无法真正地解决“人工智能记忆(内存)”的问题,反倒是通用实时数据库才能做到 。而意识到了这一点的OpenAI也正在试图为其内部的各个大模型建立一个扎实的“通用数据底座”,从而减少大模型的幻觉,提高AI生成内容的准确性、及时性和上下文相关性。
收购Rockset是OpenAI推出SearchGPT之前极其重要的一步棋,它补齐了OpenAI的数据短板,提高了OpenAI数据提取、处理和分析的效率和速度,也让OpenAI能够持续地从各种来源提取和索引数据。 可以说,Rockset不仅帮助OpenAI降低了 搜索产品的延迟,让SearchGPT“更快”地给出答案,更是对于构建一个高效、完整、实时更新的索引库有着巨大的助力,进一步提升了AI搜索产品回答的时效性和准确度。
3.SearchGPT,为什么是现在?
为什么是现在推出SearchGPT?这可能与OpenAI面临的财务困境有关。
在The Information最近的一篇报道中提到,截至今年3月,OpenAI的推理成本(租用微软服务器的成本)达到了40亿美元,训练成本今年可能会飙升至30亿美元,再加上15亿美元的人工成本,因此,OpenAI今年的企业运营成本在85亿美元左右。
而从收入端看,尽管OpenAI最近每月的总收入为2.83亿美元,全年收入也可能达到35亿-45亿美元(根据FutureSearch的估算,OpenAI 2024年的年度经常性收入约为34亿美元,相差不多),但是究竟能否达到这一数字,取决于今年下半年的销售额。
也就是说,即使OpenAI拼尽全力达到了全年35亿美元的销售额,账面上仍然会出现约50亿美元的亏损。
这就让OpenAI不得不拼尽全力想办法赚钱。在OpenAI的营收结构中,收入的大头仍然是由C端贡献的——55%的营收来自购买ChatGPT Plus的付费订阅用户(约为770万),剩余45%的营收分别来自ChatGPT企业版(21%)、API收入(15%)和ChatGPT团队版(8%)。因此,从强大的C端基本盘入手,是OpenAI实现营收破局的关键。
C端场景里,搜索是最有价值的商业模式之一。搜索作为一个天然的大用户量场景,曾经是PC端的第一流量入口,百度靠搜索成就了自己的江湖地位,谷歌也凭借搜索成为全球市值最高的互联网公司之一,在其母公司Alphabet 2023年3703.94亿美元的营收中,有1750.33亿美元的营收就是谷歌搜索业务贡献的(约占总营收的47.26%)。
尽管ChatGPT的日活保持在5000万上下,仍然是生成式AI领域唯一的杀手级应用,但是距离互联网时代的Facebook、Youtube、Instagram等仍然有一定的距离。
拾象科技CEO李广密在今年4月在受访时表示:“如果是我,我会先把ChatGPT从5000万的DAU做到3个亿……因为ChatGPT现在还不到1000万的付费用户,如果做到3000万的付费用户,就是每年60亿美金的订阅收入,那就可以比较健康地支撑AGI每年的投入。”
除了用搜索提振流量和营收,抓住推理成本下降带来的时间窗口期,或许是OpenAI选择在此时推出SearchGPT的第二个原因。
搜索产品的营收不是直接来自C端用户,而是源自C端用户积累到一定量之后带来的B端用户。因此,搜索产品在现金流跑正之前,不仅有相当长的用户获取和运营周期,还有相当大的产品和技术的建设维护成本。
以传统搜索引擎为例:根据摩根士丹利的报告,谷歌在2022年的搜索次数约为3.3万亿次,单次平均成本约为0.2美分。从收入看,根据昆仑万维董事长方汉在一次播客中透露的数据,2023年谷歌搜索的广告收入约为1600亿美元,照此计算,一次搜索产生的收入约为5美分。
那AI搜索的成本是多少呢?从前文我们可以得知,AI搜索是在传统搜索引擎的基础上又加入了大模型的能力,因此AI搜索的成本在原有的0.2美分基础之上,还要加入调用大模型所产生的算力、电力消耗和硬件投资,单次AI搜索的成本约为传统搜索引擎的10倍,也就是2美元。
而今年5月以来,随着硬件性能的提升、算法的优化和技术架构的创新,大模型的推理成本在不断下降:比如幻方量化发布的Deepseek-V2版本的模型,就通过创新性的MLA架构,把显存占用降到了过去的5%—13%,其独创的DeepSeekMoESparse架构更是将计算量降到了极致,这一切都助推了其模型推理成本的降低;再比如OpenAI自己,他们在7月19日发布了GPT-4o mini,通过改进模型结构、优化训练数据和流程,GPT-4o mini做到了在性能接近GPT-4的同时,但成本相比GPT-3.5 Turbo便宜了60%以上,相较于两年前GPT-3的text-davinci-003版本,成本更是降低了99%。
在大模型推理成本不断降低的情况下,此时推出SearchGPT,不仅本身模型调用成本上就有优势,更是能借助不断增长的用户量进一步摊平单次搜索的成本。
4.无论如何都不要单纯做搜索
如果OpenAI真的是把SearchGPT作为自己引流、商业化破局的重要一步,那么SearchGPT要怎么在产品上突破,才更有机会成为OpenAI的“流量突破口”,吸引更多日活、实现更好地转化呢?
「甲子光年」认为,有两个方向:
第一个是,第二个是 自动化工作流 。
先来说第一个。前文我们提到,AI搜索最大的壁垒是数据,也就是内容。中国互联网内容的阵地已经被划分成了百度、微信、知乎、小红书、淘宝等各种阵营,彼此之间门阀高筑,相当割裂。相比于中国,国外互联网的生态要更开放一些,各个内容阵营之间的数据流动和共享发生得更加频繁。
由此,有一部分海外的AI搜索产品抓住这一机会点,开始探索AIGC+UGC的内容生成方式,试图以此丰富自己的内容生态,典型代表就是Perplexity和Genspark。
Perplexity推出了Pages功能,允许用户直接在Perplexity平台上生成内容。用户不仅可以将原本搜索获取的答案转换成一篇文章形式的“Pages”,还可以直接输入问询词,Perplexity会搜索公开的文章或报道直接生成一篇Pages。不仅如此,Perplexity还能根据用户的需求对Pages进行重写、格式化或删除,或者插入相关的图片和视频。
小度科技前CEO景鲲创立的Genspark也不例外。
在ProductHunt上,Genspark对自己的介绍是:“一个AI代理引擎,其中专门的AI代理进行研究并生成名为 Sparkpages 的自定义页面。Sparkpages没有偏见和SEO驱动的内容,综合了可信的信息,提供更有价值的结果,为用户节省时间。”
Sparkpages是Genspark的核心:用户在搜索问题后,Genspark不仅像其他AI搜索产品一样先给出一个回答,还会通过整合搜索结果生成一个主题网页,该主题网页就是Sparkpages。它会以结构化的方式,展示搜索主题相关的文字、图片、视频等,以瀑布流的方式呈现给用户。
Sparkpage不仅通过“信息聚合网页”的形式让用户更快速有效地访问信息,更是允许用户对生成的页面进行复制和编辑:在每个Sparkpage的右上角都有一个按钮“ Copy and Create My Plan ”,点击后会打开一个已经复制了刚才Sparkpage内容的编辑页,用户可以在右侧的Copilot一栏针对左侧的Context Pool做上下文的提问、调用外部搜索获取答案、同时还可以把Copilot里的内容一键复制到左侧的Sparkpage里。和Perplexity的Pages一样,Sparkpage同样可以被搜索引擎的SEO索引到。
景鲲前下属、小度AI产品经理刘久帅告诉「甲子光年」,景鲲还在小度工作的时候,就多次提到要“重构搜索背后的内容生态”,因此Genspark走这种“AIGC+UGC”的模式并不意外。
“AI搜索目前最大的壁垒在于背后信息源的质量,Genspark的优势就在于,短期内可以通过高质量的信息源+AI理解满足搜索需求,满足后生成高质量的结构化总结页面Sparkpage,这些内容又再次被搜索收录,相当于AI搜索产品内容的‘自产自销’。这种方式可以形成一个内容的数据飞轮。假设这一飞轮能转起来,那么理论上用户用得越多,优质内容就会越多,能慢慢构建起搜索背后的内容壁垒。”刘久帅说。
而 搜索产品“自动化工作流”的实现,则主要依赖Agent,尤其是多Agent联用(Multi-Agent)的能力。 AI搜索引擎与传统搜索引擎最大的不同,在于它们不只能将搜索结果进行总结与分类,还能在此之上有更进一步的动作,比如生成思维导图、生成PPT、进行工作和生活规划等。这背后的能力,都取决于Agent。
其实目前大部分的AI搜索产品都加入了AI Agent的能力,那些在资料整理之上“玩花活”式的呈现基本都是靠Agent插件实现的,比如360 AI搜索文档分析问答、分析网页内容、分析总结音视频、生成思维导图的功能,秘塔AI搜索的思维导图、梳理各种关联人物事件、搜索学术论文和播客的功能,天工AI搜索的文档+音视频分析、AI音乐、AI PPT等功能;
阿里国际最近推出的B2B AI搜索引擎,背后似乎也加入了AI Agent的能力。它能主动理解采购者的自然语言,并转化为专业的采购请求。更进一步,它还能根据全球市场数据预测需求、提供建议,实现更精准的匹配。用户只要在新的AI搜索引擎中用“大白话”询问,它会通过与用户的对话,更精确地理解用户的需求,为用户推荐多种选择,并主动比较、总结优劣,最终帮用户完成交易和履约送货。
但是在多Agent联用方面,目前能做到的AI搜索产品还比较少,只有博查AI搜索、Genspark等产品在尝试。
比如博查AI搜索首创了多智能体搜索(Agent Search)+多模态搜索(Media Search)的模式,引入了AI智能体和高质量UGC内容,会识别用户搜索需求,并匹配相应的智能体进行作答,还支持搜网页、搜短剧、搜视频、搜图片等。
博查AI搜索的整体架构基于字节扣子(Coze)开发者平台开发,并且和扣子合作打通了智能体发布渠道,未来开发者创作的智能体可以直接发布到博查,既能为大家提供更丰富的搜索内容,也能够为开发者的智能体提供定向流量。
Genspark也利用了多智能体框架,每个智能体都能针对特定类型的查询提供专业服务,确保搜索结果的精准性和相关性。有博主对Genspark的搜索流程进行了拆解后发现,每次搜索过程中,Genspark至少调用6个AI Agent,和4—14次的大模型。
上述Agent更多属于用Agent实现自动化的工作流,更多聚焦通用搜索;在垂直搜索方面,Genspark也用了三个Agent,来处理用户旅游、商品和图片的搜索意图。
用户不仅可以点击对应的标签进入到特定的Agent页面,也可以点击输入框,选择对应的Agent,进入针对性的Agent搜索。
在第十二届互联网安全大会期间,周鸿祎告诉「甲子光年」,Agent最重要的是解决了大模型无法“慢思考”的问题,Agent在AI搜索产品里是必不可少存在。
“人脑有快思考、慢思考两种方式。 大模型常见的是快思考 ,问2+2等于几,它脱口而出。但是真的有复杂的问题,比如写一篇论文、做分析, 人类是需要慢思考 ,需要调动规划和反思、逻辑推理能力,速度慢,但准确性高。大模型目前只有快思考没有慢思考的能力,我们提出用Agent的框架打造慢思考的系统,通过知识和工具、增强大模型的规划,打造大模型的慢思考的能力。”周鸿祎说。
不过,或许是还在产品原型阶段的原因,目前,我们没有看到SearchGPT里“多智能体”的能力,但是由于SearchGPT是集成在ChatGPT中的,未来OpenAI或许会将其与GPT Store中的智能体(GPTs)打通,联合起来为用户提供服务。
另外,周鸿祎还强调,大模型企业做AI产品时,一定要注意“与场景结合”,才能实现最好的用户体验。OpenAI推出搜索产品,也意味着其越来越注重“场景”的重要性。
正如a16z创始人马克·安德森(Marc Andresson)给Perplexity创始人阿拉文德·斯里尼瓦斯(Aravind Srinivas)的建议,“无论如何都不要单纯做搜索”——无论是UGC还是多Agent,都是搜索产品的“术”;只有找到合适的用户使用场景,才能“道术合一”,实现增长。
*参考资料:
《AI搜索产品深度分析-搜索原理和商业模式分析》,AI产品Rena
《拳打Google,脚踢Perplexity,Genspark要做美女给你打好饭还喂进嘴!的新物种》,AI产品黄叔
《我做了一个AI搜索引擎》,艾逗笔
《Why OpenAI Could Lose $5 Billion This Year》,The Information
《OpenAI Revenue Report》,FutureSearch
《张鹏对谈傅盛、方汉:AI 搜索的机会在哪,OpenAI 为什么没入局?》, AI局内人 | AGI Insider播客
《国内增速第一的360AI搜索在做什么?| 对谈360VP 梁志辉》,AI产品经理播客
《AI搜索揭秘:套壳之王Perplexity究竟有多难?独立开发是否有机会?》,硬地骇客播客
报告称大学生返乡就业比例上升,「北上广深」不香了?未来就业趋势会如何?
2022年底,我国疫情防控政策优化调整,三年抗疫转入新阶段。 据国家统计局数据显示,2022年,我国GDP超121万亿元,同比增长3%。 统计数据表明,全国新增就业累计实现1206万人,比上年减少63万人。 与此同时,产业轮动、新兴行业发展的影响仍在继续,灵活就业、副业受到更多职场人关注。
随着2023年春招季的来临,白领们又面临“跳槽”或“留任”的选择。 智联招聘对全国核心城市白领展开调研,重点分析与跳槽相关的各项因素,例如事业信心情况、职场生活与发展等,其中也包括对返乡就业、数字化工具影响等情况的调研。 最终发布《2023春季白领跳槽指数调研报告》,希望在新时期为企业和求职者提供参考。
核心发现
【跳槽篇】
超9成白领有跳槽意向或行为,跳槽指数3.65,高于去年
服务业、房地产业盛产跳槽“行动派”
北京白领跳槽指数最高,南昌职场人稳定性更强
薪酬水平仍是白领跳槽的首要因素,跳槽时00后更关注自身
白领求职信心指数达2.62,高于去年,4成以上职场人认为求职难
销售岗位求职信心指数最高
近5成白领担心失业,学习是白领应对失业焦虑的主要方式
【事业篇】
白领事业信心指数达3.71,高于去年,大中型企业职场人更有信心
“经济大环境不明朗”是影响白领事业信心的主要因素
零售快消行业白领事业信心满满,文体教育行业白领信心低迷
东北“老铁”事业信心指数爆表,长三角信心稍显不足
近9成白领在老家过年,未返乡者中超3成考虑回家乡工作
4成以上白领担心岗位被AI工具取代,超8成白领通过学习应对挑战
76%的白领表示要在新年“积极搞钱”,约7成想提升技能与竞争力
报告正文
【跳槽篇】
超9成白领有跳槽意向或行为,跳槽指数3.65,高于去年
智联招聘数据显示,今年春招季有跳槽意愿或行为的白领超9成。 其中,63.3%的白领“已更新简历,找工作中”,有29.1%的白领“有意向”跳槽意向,占比高于去年的26.1%。 也有3.5%的白领表示“已经收到offer,正在办离职/入职”,与去年的3.6%大体相当。
综合上述数据,2023年白领跳槽指数为3.65,比2022年的3.63、2021年的3.61有所提升。 这说明白领整体较去年跳槽意愿、流动性更强。
服务业、房地产业盛产跳槽“行动派”
从行业维度来看,受消费回暖影响,生活性服务业在2023年春节前后回暖,使相关从业人员跳槽意愿更加活络。 服务业(医疗/护理/美容/保健/酒店/餐饮/旅游/度假)白领跳槽行为最为活跃,72%的白领选择了“已更新简历,找工作中”或“已经收到offer,正在办理离职/入职”。 与此同时,处于调整期的房地产行业人员流动更加频繁,正在找工作和已拿到offer的白领占比共计69.6%,也成为跳槽“行动派”。
北京白领跳槽指数最高,南昌职场人稳定性更强
从城市维度来看,北京白领的跳槽指数最高,达到3.79,排名第一。 四大一线城市中,白领跳槽指数排名第二的是深圳,跳槽指数为3.75,这两所城市与2022年同期相比,跳槽指数提高,表明一线城市人员流动性增强。 南昌职场人的稳定性最强,白领跳槽指数仅为3.05,排名末位。
薪酬水平仍是白领跳槽的首要因素,跳槽时00后更关注自身
数据显示,2023年春季白领跳槽原因整体排序与2022年大致相当。 其中,薪酬水平仍是白领跳槽的首要因素,占比达53.6%,与上一年一致。 其次企业发展前景不明、福利待遇和职位晋升受限,占比均超过30%。
在被问及跳槽时最看重什么时,75%的白领选择了薪酬福利,占比最高,其次是职位晋升、企业发展前景和工作生活平衡。 从不同年龄的白领来看,选择薪酬福利的00后白领占比为80.4%,高于总体水平,且位居各年龄段之首。 此外,00后对职位晋升、工作生活平衡、培养与学习、通勤时间长短、工作内容是否有兴趣等方面的看重程度均高于总体水平。 选择企业发展前景的00后占比仅18.7%,明显低于总体的32.4%,且排在各年龄段之末。 这表明,跳槽时00后立足当下,更在意自身的职业发展,也追求工作与生活的平衡,但对企业的未来关注度较低。
白领求职信心指数达2.62,高于去年,4成以上职场人认为求职难
进入防控优化调整阶段,白领的求职信心有所提高。 智联招聘数据显示,2023年白领求职信心指数为2.62,比2022年的2.49有较大幅度提升。 分别有35.1%和12.6%的白领,认为当下找工作“有些挑战”和“非常难”,总占比为47.7%,低于2022年的总和55.4%。 这表明,白领的求职信心逐步恢复。
销售岗位求职信心指数最高
数据显示,销售岗位认为跳槽很容易和比较容易的占比共24.8%,销售岗位白领的求职信心指数为2.76,排名各岗位第一。 防控“放开”后,各行各业在“抢单”促发展,这让销售岗位有了更好的发展机会,白领求职信心增强。 此外,研发和技术的求职信心指数连续两年排在前五,岗位技术含量高、竞争壁垒高的白领对跳槽更有信心。
近5成白领担心失业,学习是白领应对失业焦虑的主要方式
虽然白领求职信心指数比去年有所提高,但担心自己在2023年会失业的白领占比达到47.3%,高于2022年的39.8%。 虽然经济开始回暖,但长期面对“不确定”的白领,对职场稳定性仍存担忧。
在应对失业焦虑方面,71.6%的白领通过“学习技能,提升竞争力”缓解焦虑,占比高于2022年的68.3%,仍排在第一位。 其次有63.8%的白领进行“心理调节,让自己放轻松”,占比高于去年的58.7%。 此外,“兼职/副业,增加收入途径”和“努力工作,获得老板赏识” 也是应对失业焦虑的重要方式,占比分别为31.6%、30.1%,高于去年的20.4%和29.6%。
【事业篇】
白领事业信心指数达3.71,高于去年,大中型企业职场人更有信心
智联招聘数据显示,2023年,白领整体取得事业成就的信心指数为3.71,高于2022年的3.61。 其中,29.6%的白领对2023年的事业非常有信心,高于去年的27.1%;选择“有信心”的白领占比30.7%,高于2022年的28.5%。
从企业规模上看,大中型企业的白领对2023年事业有成的信心更足。 其中,人以上企业白领表示有信心(“非常有信心”和“有信心”)的占比为60.5%,1001-人规模的占比62.7%,高于101-1000人规模(62%)和100人以下规模(57.3%)。 在事业信心方面,“船大好顶浪”成为大部分白领的共识。
“经济大环境不明朗”是影响白领事业信心的主要因素
关于影响白领2023年事业信心的因素,60%的白领表示受“经济大环境不明朗”影响,占比高于2022年的48.4%。 其次是“行业/公司发展前景不好”,占比48.2%,高于去年的43.5%。 也有35.3%的白领“觉得升职加薪无望”,17.4%担心“难以适应新技能”,7.1%担心“和领导同事的关系不好”。 可见,白领对2023年事业发展的预期更多的受到外部环境的影响。
零售快消行业白领事业信心满满,文体教育行业白领信心低迷
分行业看,对于2023年事业发展最有信心的是贸易/批发/零售/租赁业/快速消费品/耐用消费品行业,以3.86的指数领跑,高于2022年的3.66,排名也从去年的第二位提升至第一。 随着防控优化调整及刺激消费举措的陆续出台,零售快消行业迎来发展之春,该行业白领对2023年具有向好的预期。 能源/矿产/环保行业以3.81的事业信心指数排名第二,排名相较去年同期下降一位,但比去年3.75的事业信心指数有所提高。 在双碳目标指引下,传统能源企业在向绿色低碳转型,新能源行业更是蓬勃发展,从业者对未来满怀信心。 与此同时,“双减”对教育行业的影响仍在持续,文体教育/工艺美术行业白领事业信心指数低至3.13,排名垫底。
东北“老铁”事业信心指数爆表,长三角信心稍显不足
2023年,太原白领以4.26的事业信心指数排名第一。 2022年,太原生物产业增加值增长34.5%,新能源汽车产业、节能环保产业的增加值增长22%、21.9%。 高速增长的战略性新兴产业,为太原白领的事业发展巩固信心。
东北“老铁”对2023年事业满怀信心,哈尔滨、长春、沈阳三大城市白领的事业信心指数分别高达4.04、4.00和3.95,排在前四名。 近年来,东北逐步进行产业结构调整,冬奥会带来的“冰雪风潮”也一定程度刺激了当地经济发展,白领们的事业信心得到提升。
相比之下,经济更为发达的长三角地区白领事业信心稍显不足。 南京白领事业信心指数仅为3.30,排名垫底,上海也以3.58排名靠后。
近9成白领在老家过年,未返乡者中超3成考虑回家乡工作
防疫政策调整后,许多人返乡渡过了兔年春节。 在接受调研的白领中,47.7%返乡过年,39.6%工作就在家乡,共计87.3%的白领在老家过年。 也有少数白领由于担心复阳或其他原因,而不愿回乡与家人团聚。
在未回家过年的白领中,15.5%表示“开始思考在异地工作是否有必要”,5.5%“已经开始看家乡的工作机会”。 此外,也有13.1%的白领表示“一直都有回家找工作的打算”,数据表明34.1%的未返乡白领希望回家乡工作,略高于上一年的33%,可见返乡就业已成趋势。
当被问及考虑回乡工作的原因时,64.8%的白领表示“离家人更近,有更多时间陪伴家人”,35.2%认为“家乡压力较小,能够更好地平衡工作与生活”,28.2%表示“家乡城市发展势头好,能提供不错的工作机会”。
4成以上白领担心岗位被AI工具取代,超8成白领通过学习应对挑战
最近,新型聊天机器人模型ChatGPT上线2个月就突破了1亿月活,成为“史上用户增长最快的消费者APP”,“ChatGPT能否替代人类的工作?”成为职场人讨论的热门话题。 智联招聘的调研数据显示,19%的白领表示所在岗位已经部分被数字化工具所取代,22.4%表示“很可能”被AI取代。 但也有10.8%的白领信心满满,认为数字化工具完全不可能取代其所在岗位。
数据显示,52%的白领愿意“学习数字化知识,让AI为我所用”,有31.9%的白领表示将“积极学习进修,争取不被AI取代”,这表示共有83.9%的白领愿意通过学习应对挑战。 仅13%的白领较为佛系,表示“暂无想法,走一步看一步”。
76%的白领表示要在新年“积极搞钱”,约7成想提升技能与竞争力
面对2023年,大部分白领心态乐观。 76%的白领选择“努力奋斗,积极搞钱”,占比高于2022年的70.5%,依旧排在首位。 69.7%的白领选择“提升技能,增强竞争力”,高于去年的66.2%。 24.9%的白领选择“减轻压力,重视心理健康”,高于去年的23.5%。 可见,大部分白领在新的一年更积极进取。
中央经济工作会议指出,2023年,稳字当头、稳中求进是发展的主基调。 通过本次报告可以看出,与去年相比,白领们的跳槽、求职、事业信心三大指数均更高。 返乡就业成为白领求职新趋势,大部分白领们通过持续学习应对激烈的竞争和AI工具带来的挑战,越来越多职场人愿意积极提升自我以应对外部变局,从而更好地拥抱未来。