Meta计划自研搜索引擎，为AI聊天机器人注入独立“动力”

在人工智能领域的竞赛日趋白热化之际，科技巨头们正寻求减少对竞争对手的依赖。最新报道显示，Meta（facebook）正在开发自己的搜索引擎，旨在为其AI聊天机器人Meta AI提供支持，从而降低对微软必应和谷歌搜索数据的依赖。

这一举措可能源于多重考量。从表面看，Meta（facebook）希望扩展自身的数据收集能力，以构建更强大、实时的AI数据工具。这最终可能催生一个更广泛的Meta搜索工具，为其旗下应用提供实时洞察。例如，这对于Threads应用尤其具有价值，能够提供关于热点新闻的最新动态，从而提升应用内的互动参与度。

回顾Meta AI的发展历程，其对外部搜索的依赖显而易见。去年9月Meta AI首次亮相时，公司便说明将利用与必应的搜索合作来获取实时信息以丰富回答。今年4月，Meta（facebook）又宣布与谷歌建立额外合作关系，进一步扩展其网络搜索回复能力。在这两种情况下，当Meta AI利用这些引擎获取信息时，都会在回复中附上相应的搜索链接。

然而，根据《The Information》的报道，Meta（facebook）现在正计划构建自己的网络爬虫，以独立驱动搜索查询。报道指出：“随着Meta Platforms试图在人工智能开发上追赶OpenAI，这家Facebook的母公司正在开发一个能够爬取网络、为其Meta AI聊天机器人的用户提供关于当前事件的对话式答案的搜索引擎。”

从战略层面看，这一举动合乎逻辑。如果正在生成式AI领域与Meta（facebook）竞争的微软或谷歌决定终止搜索合作，Meta将拥有一个备选方案。但这同时也意味着Meta需要构建一个与谷歌和必应运作方式类似的复杂搜索系统，这无疑是一项巨大的工程，也是当初Meta选择与它们合作的主要原因。

那么，Meta（facebook）能否成功创建功能相当的网页爬虫，并足以在其聊天机器人中提供优质的答案呢？实际上，Meta已经拥有多个从外部网站收集信息的网络爬虫。为了给AI项目收集更多数据，这些爬虫近几个月的活动有所增加。它们可能已经在为这个新的搜索引擎收集数据，但打造一个专用的搜索引擎仍然是一个庞大的项目。

或许，其背后的宏大图景不仅仅是驱动应用内的流式搜索，而是在更广泛的信息收集意义上，为Meta未来的AI语言模型获取更多数据。更有可能的情况是，Meta（facebook）正在巩固其数据源以驱动AI工具，并利用现有爬虫从那些未更新robots.txt保护的外部提供者那里抓取尽可能多的数据。这有助于Meta在其已然庞大的数据存储基础上继续扩展。既然已经在收集这些信息，那么尽可能减少对外部搜索提供商的依赖也就顺理成章了。

因此，与其说Meta（facebook）旨在打造一个与现有搜索巨头的直接竞争对手，不如说它更侧重于最大化利用自身的数据收集流程。即便如此，这仍是一项意义重大的举措。如果成功，将为扎克伯格及其团队带来更广阔的发展机遇。考虑到该领域的激烈竞争，这一举动并不令人意外。Meta（facebook）正与这两家提供商争夺AI主导权，随着竞赛不断升温，如果它们停止在这方面帮助Meta，也将是预料之中的事。