5月9日,阿里巴巴正式在GitHub等平台开源ZeroSearch大模型搜索引擎。这一创新框架基于强化学习技术,无需依赖传统搜索引擎接口即可激发大模型的自主搜索能力,在性能超越谷歌搜索的同时,将成本压缩至原方案的12%以下。

技术原理:激活大模型内生知识,实现动态质量调控
ZeroSearch的核心突破在于挖掘大语言模型预训练阶段积累的海量知识,将其转化为自驱式检索模块。该模块能根据用户查询直接生成相关搜索结果,而非依赖外部搜索引擎调用。更值得注意的是,ZeroSearch首次实现了对生成内容的动态质量调控,通过算法实时优化结果的相关性与准确性,这一特性填补了传统搜索技术的功能空白。

性能评测:7大数据集全面领先
研究团队在NQ、TriviaQA、PopQA、HotpotQA等7大主流问答数据集上展开测试:
- 70亿参数模型经ZeroSearch增强后,搜索能力评分达33.06
- 140亿参数模型评分提升至33.97,超越谷歌搜索的32.47基准线
实验结果表明,参数规模与搜索效能呈显著正相关,为模型优化提供了明确路径。
成本优势:训练开支锐减88%
对比传统方案,ZeroSearch展现出惊人的经济效益:
- 使用谷歌搜索接口(SerpAPI)完成64,000次查询训练,成本约586.7美元(约合4238元人民币)
- 采用4块A100 GPU运行140亿参数模型模拟搜索,成本仅70.8美元(约511元人民币)
成本降幅达87.93%,大幅降低了大模型搜索技术的应用门槛。

此次开源意味着AI搜索领域迎来重要突破,企业及开发者可基于ZeroSearch构建高性价比的智能搜索方案,或将推动搜索引擎技术范式的革新。