小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现
小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現
一項名爲Absolute Zero Reasoner(AZR)的創新項目近日引發廣泛關注。該項目通過一種全新的“絕對零點”訓練範式,讓大型語言模型(LLM)能夠自主提出問題、編寫代碼、運行驗證,並
Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verif
法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景
DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论