HumanEval - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"HumanEval"的内容

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

小米MiMo-7B开源大模型发布轻量化+强化学习赋能顶级推理能力

AI妹 5 个月前 31 0

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现

咨询场景数学研究与教育链式推理（CoT） Hugging Face DeepSeekMath

查看详情

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

小米MiMo-7B开源推理大模型：轻量架构强化学习性能超32B模型

AI妹 5 个月前 28 0

小米正式在Hugging Face平臺發佈其首個專爲推理（Reasoning）設計的開源大模型——MiMo-7B。據AIbase瞭解，MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化，展現

Group Relative Policy Optimization(GRPO) 通用推理小米AI实验室 MiMo-7B-RL API开放

查看详情

AZR零数据自博弈机制显著提升LLM编程数学能力成AI自进化标杆

AZR零数据自博弈机制显著提升LLM编程数学能力成AI自进化标杆

AI妹 5 个月前 18 0

一項名爲Absolute Zero Reasoner（AZR）的創新項目近日引發廣泛關注。該項目通過一種全新的“絕對零點”訓練範式，讓大型語言模型(LLM)能夠自主提出問題、編寫代碼、運行驗證，並

AZR 代码执行器自我博弈 Absolute Zero Reasoner Qwen2.5-7B

查看详情

Mistral AI发布Devstral2系列开源编码模型性能刷新纪录工具同步开源

Mistral AI发布Devstral2系列开源编码模型性能刷新纪录工具同步开源

AI妹 6 个月前 23 0

Mistral AI 正式推出第二代开源编码模型家族:Devstral2（1230亿参数旗舰版）与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verif

异步函数重写轻量免费旗舰API Claude Sonnet Mistral AI CodeLlama-70B

查看详情

法国Mistral AI推出Mistral3系列模型开源128K上下文性能优价格仅GPT-4o一半

法国Mistral AI推出Mistral3系列模型开源128K上下文性能优价格仅GPT-4o一半

AI妹 6 个月前 37 0

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型，包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3，覆盖从边缘设备到企业级推理的全场景

Apache2.0开源协议 HumanEval 商业免费使用 128K上下文长度 8B模型

查看详情

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

DeepSeek V3.2系列发布核心DSA升级性能对标闭源且开源可商用

AI妹 6 个月前 42 0

DeepSeek 发布 V3.2（标准版）与 V3.2-Speciale(深度思考版)，官方评测显示: - V3.2在128k 上下文场景下与 GPT-5互有胜负 - V3.2-Special

长文本DSA内核 DeepSeek V3.2 Apache2.0协议多数投票思考长度惩罚

查看详情



资讯姬

文章数量13546

总阅读量238.074k

总评论量0

会员数量2

本站由emlog驱动