在人工智能领域的竞赛日趋白热化之际,科技巨头们正寻求减少对竞争对手的依赖。最新报道显示,Meta(facebook)正在开发自己的搜索引擎,旨在为其AI聊天机器人Meta AI提供支持,从而降低对微软必应和谷歌搜索数据的依赖。
这一举措可能源于多重考量。从表面看,Meta(facebook)希望扩展自身的数据收集能力,以构建更强大、实时的AI数据工具。这最终可能催生一个更广泛的Meta搜索工具,为其旗下应用提供实时洞察。例如,这对于Threads应用尤其具有价值,能够提供关于热点新闻的最新动态,从而提升应用内的互动参与度。
回顾Meta AI的发展历程,其对外部搜索的依赖显而易见。去年9月Meta AI首次亮相时,公司便说明将利用与必应的搜索合作来获取实时信息以丰富回答。今年4月,Meta(facebook)又宣布与谷歌建立额外合作关系,进一步扩展其网络搜索回复能力。在这两种情况下,当Meta AI利用这些引擎获取信息时,都会在回复中附上相应的搜索链接。
然而,根据《The Information》的报道,Meta(facebook)现在正计划构建自己的网络爬虫,以独立驱动搜索查询。报道指出:“随着Meta Platforms试图在人工智能开发上追赶OpenAI,这家Facebook的母公司正在开发一个能够爬取网络、为其Meta AI聊天机器人的用户提供关于当前事件的对话式答案的搜索引擎。”
从战略层面看,这一举动合乎逻辑。如果正在生成式AI领域与Meta(facebook)竞争的微软或谷歌决定终止搜索合作,Meta将拥有一个备选方案。但这同时也意味着Meta需要构建一个与谷歌和必应运作方式类似的复杂搜索系统,这无疑是一项巨大的工程,也是当初Meta选择与它们合作的主要原因。
那么,Meta(facebook)能否成功创建功能相当的网页爬虫,并足以在其聊天机器人中提供优质的答案呢?实际上,Meta已经拥有多个从外部网站收集信息的网络爬虫。为了给AI项目收集更多数据,这些爬虫近几个月的活动有所增加。它们可能已经在为这个新的搜索引擎收集数据,但打造一个专用的搜索引擎仍然是一个庞大的项目。
或许,其背后的宏大图景不仅仅是驱动应用内的流式搜索,而是在更广泛的信息收集意义上,为Meta未来的AI语言模型获取更多数据。更有可能的情况是,Meta(facebook)正在巩固其数据源以驱动AI工具,并利用现有爬虫从那些未更新robots.txt保护的外部提供者那里抓取尽可能多的数据。这有助于Meta在其已然庞大的数据存储基础上继续扩展。既然已经在收集这些信息,那么尽可能减少对外部搜索提供商的依赖也就顺理成章了。
因此,与其说Meta(facebook)旨在打造一个与现有搜索巨头的直接竞争对手,不如说它更侧重于最大化利用自身的数据收集流程。即便如此,这仍是一项意义重大的举措。如果成功,将为扎克伯格及其团队带来更广阔的发展机遇。考虑到该领域的激烈竞争,这一举动并不令人意外。Meta(facebook)正与这两家提供商争夺AI主导权,随着竞赛不断升温,如果它们停止在这方面帮助Meta,也将是预料之中的事。




