Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7
The Kimi technical team recently released a technical report on the preview version of Kimina-Prov
【研究顛覆】 清華大學與上海交通大學聯合發表的最新論文,對業界普遍認爲"純強化學習(RL)能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現,引入強化學習的模型在某些任務中的表現,反而遜色於
【研究颠覆】 清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于
全球知名科技公司小米正式發佈其首個針對推理(Reasoning)而生的大型開源模型 ——Xiaomi MiMo。該模型旨在解決當前預訓練模型在推理能力上的瓶頸,探索如何更有效地激發模型的推理潛能。
阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术,彻底改变了训练人工智能系统搜索信息的方式。这项创新技术通过模拟方法让大型语言模型(LLM)开发高级搜索功能,无需在训练过程
【AIbase 報道】米国時間2025年7月31日、シリコンバレーに本社を置く人工知能スタートアップ企業Creao AIは、連続して2つの資金調達を完了したことを発表しました。初期投資としてYun
論文リンク: https://www.arxiv.org/pdf/2505.05470 プロジェクトリンク: https://github.com/yifan123/flow_grpo 一方で、
在人工智能的迅速发展中,如何提升大语言模型(LLM)的检索和推理能力成为研究的热门话题。近日,阿里通义实验室提出了一个名为 “ZeroSearch” 的新框架,它能够使大型语言模型自己模拟搜索引擎
近日,字节跳动Seed团队正式推出全新Vision-Language-Action Model(VLA)模型GR-3,该模型在机器人操作领域展现出突破性能力,不仅能理解包含抽象概念的语言指令,还可
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论