4NBS1v3eFW5 tech.huanqiu.comarticleKimi首个Agent开启小范围灰度测试 性能超OpenAI、Gemini/e3pmh164r/e3pmtm015【环球网科技报道 记者 李文瑶】6月20日晚间,月之暗面Kimi对外宣布发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,在HLE测试中,超过Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent打平。从功能来看,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果。Kimi-Researcher是一个零结构 Agent,没有复杂的提示词,也没有预设流程。在动态的环境里,Kimi-Researcher 自己学会了如何思考:当信息冲突时,如何权衡判断;面对任务节点,何时切换工具;哪些中间信息值得保留,哪些可以舍弃。模型的唯一驱动力,是任务本身是否被真正解决。据其介绍,作为深度研究模型,Kimi-Researcher引入大量数据来源,同时每条引用都能直接点击追溯,拥有文献严谨性,帮助告别幻觉。 月之暗面表示, Kimi-Researcher 基础预训练模型及强化学习后的模型将逐步开源,以推动Agent强化学习方向的探索。1750493483403环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:秦耳环球网175049348340311[]//img.huanqiucdn.cn/dp/api/files/imageDir/b7b995b74901930af6fc1b086c486de7u1.png{"email":"qiner@huanqiu.com","name":"秦耳"}
【环球网科技报道 记者 李文瑶】6月20日晚间,月之暗面Kimi对外宣布发布首个Agent产品Kimi-Researcher(深度研究),并开始小范围灰度测试。Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,在HLE测试中,超过Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent打平。从功能来看,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果。Kimi-Researcher是一个零结构 Agent,没有复杂的提示词,也没有预设流程。在动态的环境里,Kimi-Researcher 自己学会了如何思考:当信息冲突时,如何权衡判断;面对任务节点,何时切换工具;哪些中间信息值得保留,哪些可以舍弃。模型的唯一驱动力,是任务本身是否被真正解决。据其介绍,作为深度研究模型,Kimi-Researcher引入大量数据来源,同时每条引用都能直接点击追溯,拥有文献严谨性,帮助告别幻觉。 月之暗面表示, Kimi-Researcher 基础预训练模型及强化学习后的模型将逐步开源,以推动Agent强化学习方向的探索。