百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
2月4日消息,深度研究智能体权威评测榜单DeepResearch Bench公布最新结果,百度千帆深度研究Agent(Qianfan-DeepResearch Pro)凭借卓越的端到端研究能力和极高的报告产出质量,登上测评榜单榜首。在衡量研究报告含金量的四大核心维度——全面性、洞察力、指令遵循度和可读性上,千帆深度研究Agent均实现了行业领先。

当前,深度研究(DeepResearch)正成为人工智能进化的关键分水岭。不同于传统文本生成,深度研究任务要求系统能够像人类专家一样,自主执行多步骤、可迭代的认知任务,涵盖了从复杂需求理解、广泛信息获取到深度洞察产出的全过程。深度研究Agent目前已广泛应用于学术综述、金融投研、商业分析等领域,能够将传统需数日的手动研究工作压缩至分钟级完成,显著提升研究与决策效率。
作为评价这一前沿赛道能力的“金标准”,DeepResearch Bench填补了通用 AI 评测在端到端深度研究任务上的空白。现有的Benchmark多聚焦于单一能力,难以覆盖长程推理与检索合成的复杂性。该榜单由领域专家设计了100个博士级别的研究任务,覆盖22个学科,并引入RACE报告质量评价框架与引文准确性评估,是目前全球范围内衡量 DeepResearch Agent生产力水平最硬核、最真实的评价体系。
千帆深度研究Agent能够在此次评测中脱颖而出,得益于优异的技术设计,它采用Agentic架构,通过“任务理解-规划-执行”循环机制实现端到端研究交付,依托百度搜索与RAG技术保障信息获取的广度、可信度与相关性。两大重要设计确保了任务执行的准确性,首先采用“由粗到细”的研究路径展开方式应对任务不确定性;其次,通过深度执行路径规划与实时反思机制,系统能在每个研究节点动态评估进展、调整策略,从而有效避免幻觉与路径偏离,并确保复杂研究任务的高质量完成。
此外,在报告生成阶段,千帆深度研究Agent采用独立的两阶段报告渲染机制:首先产出pivot报告,通过优化相关推理能力,来保证逻辑一致性和内容全面性;之后使用不同的渲染工具,基于pivot报告渲染出最终的markdown、html、ppt等多形态报告,从而实现“一次研究,多形态报告”的交付。
目前,该深度研究Agent已上线百度千帆平台,用户只需输入复杂调研需求,系统即可在十几分钟内生成带引用的专业级研究报告,真正实现“分钟级”的深度洞察交付。
此次登榜是百度千帆 Agent Infra强大支撑能力的集中体现。千帆 Agent Infra提供模型、工具、Agent开发、数据及Agent运行环境等一站式开发服务。平台已累计开发超130万个Agents,以百度独家能力“百度AI搜索”为代表的工具日均调用量已突破数千万次。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
最新资讯
- 宏英智能三季报透视:经营水平大幅改善,新能源布局加速落地 2025年10月29日,宏英智能发布2025年第三季度报告。报告显示,公司前三季度实现营收约4.34亿元,同比增长1.1
- 德力佳于上交所敲钟:上市首日高开超100%乘资本市场东风“破浪前行” 德力佳传动科技股份有限公司(以下简称“德力佳”)今日在上交所主板上市,股票代码为603092。 在发售阶段,德力佳便受
- 港股低开低走恒指午间收跌1.14%科技股、半导体股集体弱势 隔夜美股科技股再遭猛烈抛售,影响亚太股市集体走低。港股三大指数低开低走,截止午盘,恒生指数跌1.14%,国企指数跌1.1
- 工行温度岷县支行批量办理社保卡保障助学金高效落地 近日,工行岷县支行成功为岷县一中高一年级学生集中办理发放助学金的社保卡600余张,以高效、便捷的金融服务全力保障国家助学
- H5丨十五运会观赛指南 中华人民共和国第十五届全国运动会开幕在即,各个赛区有哪些不容错过的精彩赛事?十五运会有哪些热门项目和金牌赛事?观赛之余,
- 南网数字IPO开启申购:研发投入受关注,与关联方信披有出入 作者:方升 编辑:王成 今年6月,南方电网数字电网研究院股份有限公司向深交所递交了创业板IPO申报材料,顺利于10月
- 获评专精特新“小巨人”,西普尼02583.HK以科技持续提升市场潜力 近日,金表龙头西普尼发布了一则利好公告:公司被工业和信息化部认定为第七批专精特新“小巨人”企业。 根据《优质中小企业梯
- 协同创新,共赴新程|先导智能荣获亿纬锂能“联合创新奖” 近日,以“共生共长,共创美好生活”为主题的亿纬锂能2026年供应链合作伙伴大会圆满举行。先导智能凭借其深厚的技术创新实力






