关闭导航

包含标签"HumanEval"的内容

小米MiMo-7B开源大模型发布 轻量化+强化学习赋能顶级推理能力
AI妹 1 个月前 10 0

小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现

小米MiMo-7B开源推理大模型:轻量架构强化学习性能超32B模型
AI妹 1 个月前 9 0

小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現

AZR零数据自博弈机制显著提升LLM编程数学能力成AI自进化标杆
AI妹 1 个月前 6 0

一項名爲Absolute Zero Reasoner(AZR)的創新項目近日引發廣泛關注。該項目通過一種全新的“絕對零點”訓練範式,讓大型語言模型(LLM)能夠自主提出問題、編寫代碼、運行驗證,並

Mistral AI发布Devstral2系列开源编码模型 性能刷新纪录工具同步开源
AI妹 1 个月前 11 0

Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verif

法国Mistral AI推出Mistral3系列模型 开源128K上下文性能优价格仅GPT-4o一半
AI妹 1 个月前 16 0

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景

DeepSeek V3.2系列发布 核心DSA升级性能对标闭源且开源可商用
AI妹 1 个月前 17 0

DeepSeek 发布 V3.2(标准版)与 V3.2-Speciale(深度思考版),官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special