|
|
| 百度伐谋Agent 2.0再登顶,已开源面向科研项目 |
|
近日,百度智能云推出的企业级算法自主优化智能体——百度伐谋Agent 2.0,再次登顶机器学习工程基准MLE-Bench,并刷新最优(SOTA)成绩。这是继去年10月首次登顶后,百度伐谋凭借过硬的工程能力再次取得亮眼表现。
据介绍,MLE-Bench是由OpenAI主导设立的检验智能体“动手能力”的硬核考核指标,它包含75个来自Kaggle竞赛的真实工程难题,重点考察人工智能在模型训练、数据准备、实验运行等机器学习全流程中的端到端实战能力。去年10月,百度伐谋登顶MLE-Bench,展现了其“寻找最优解的智能体”的能力。
最新的评测中,百度伐谋2.0在“高难度”任务上的能力表现依旧突出。评测显示,在统一运行标准下,百度伐谋2.0在“高难度”任务上的综合胜率显著领先,超越了搭载Claude-Opus-4.6等主流大模型的同类智能体,印证了百度伐谋在系统性分析复杂问题、迭代优化解决方案的成熟能力。
据介绍,百度伐谋2.0在演化策略、长程记忆机制、底层基础设施等层面进行了全面优化。其中,增强的演化策略能够让智能体在多条路径上并行探索,适时回溯调整,从而找到更优的解决方案;其长程记忆机制能够帮助智能体在人类工程师一样,在长链条任务中保持思路清晰、逻辑一致;依托百度智能云全栈AI云基础设施优化,则让算法演化迭代的效率显著提升。
同时,百度伐谋2.0还大幅降低了算法使用门槛,即便没有算法背景的业务人员,也能以自然语言和数据文件发起需求,系统自动交付可解释、可交互、可落地的决策方案,快速产出企业级解决方案。
百度伐谋上线至今已经吸引数千家企业使用,覆盖零售、金融、制造、能源、交通等国民经济核心领域。如在汽车制造领域,阿尔特太乙与伐谋合作研发御风智能预测系统,将单次风阻验证时间从10小时压缩至数分钟,整车研发周期平均缩短25%;在能源基建领域,中国能建广东院用伐谋解决海上风电电缆桥架布置难题,节省近一周工期与大量材料成本。
百度伐谋在科研场景同样展现出巨大应用潜力。北京工业大学团队将伐谋引入中国空间站微型气相色谱柱设计实验,以自动化寻优代替人工反复仿真,大幅提升分离效率;天津大学团队将伐谋用于灾害预测模型选优,把原本以"周"为单位的科研探索压缩至6小时内出成果。
为进一步降低科研团队的使用门槛,百度智能云近期还开源了Famou for Science项目,基于多智能体协同模式构建完整虚拟科研团队,涵盖团队负责人、实验管理、文档管理与评审等角色,可支持长线程科研任务的自动化推进,实现学科知识机理和样本数据融合的创新算法实验持续演化。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。