关闭导航

包含标签"推理能力"的内容

通义千问团队推出Qwen3系列模型 开源多版本MoE及Dense模型赋能开发者
AI妹 1 个月前 10 0

通义千问团队宣布推出Qwen3,这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和

UCLA與Meta AI推出d1框架 強化學習提升擴散式大語言模型推理能力
AI妹 1 个月前 9 0

在人工智能領域,UCLA 和 Meta AI 的研究人員聯合推出了一種名爲 d1的新框架,該框架通過強化學習技術顯著提升了擴散式大語言模型(dLLMs)的推理能力。雖然傳統的自迴歸模型如 GPT

d1框架结合强化学习 显著提升扩散式大语言模型推理能力与应用潜力
AI妹 1 个月前 9 0

在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT

OpenAI紧急修复GPT-4o献媚问题 免费用户已回滚至老版本
AI妹 1 个月前 9 0

近日,OpenAI 针对其最新推出的 GPT-4o 模型所引发的 “献媚” 问题进行了紧急修复。公司首席执行官兼联合创始人 Sam Altman 于今天凌晨宣布,免费用户已经完成了系统更新,100

Grok3.5下周SuperGrok测试:推理飞跃多模態升级 算力倍增助力科研挑战竞品
AI妹 1 个月前 12 0

2025 年 4 月 29 日,AIbase報道——xAI旗下人工智能聊天機器人Grok即將迎來重大更新,其最新版本Grok 3. 5 預計將於下週向SuperGrok訂閱用戶開放早期測試版。這一

小米2025年4月开源推理大模型Xiaomi MiMo7B参数性能领先竞品

(注:标题共24字,涵盖核心信息:主体小米、时间节点、事件开源、模型名、参数及优势)
AI妹 1 个月前 10 0

2025年4月30日,小米公司宣布开源其首个为推理(Reasoning)而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步,特别是在推理能力的提升上取得

小米发布首个针对推理的开源大模型MiMo 性能超同类全系列开源
AI妹 1 个月前 8 0

全球知名科技公司小米正式发布其首个针对推理(Reasoning)而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈,探索如何更有效地激发模型的推理潜能。

小米MiMo-7B开源推理大模型:轻量架构强化学习性能超32B模型
AI妹 1 个月前 9 0

小米正式在Hugging Face平臺發佈其首個專爲推理(Reasoning)設計的開源大模型——MiMo-7B。據AIbase瞭解,MiMo-7B通過從預訓練到後訓練的強化學習(RL)優化,展現

智谱发布GLM-4.5开源模型 性能领先开源领域价格亲民竞争力强
AI妹 1 个月前 9 0

近日,智譜正式推出了其最新旗艦模型 GLM-4.5,這款模型被稱爲 “專爲 Agent 應用打造的基礎模型”,並且在推理、代碼生成以及智能體綜合能力上達到了開源模型的 SOTA(State Of