关闭导航

包含标签"推理效率"的内容

小米MiMo旧模型将于2026年6月30日下线 升级至V2.5系列
AI妹 11 天前 0 0

5月29日,据社交媒体消息,小米发布 MiMo-V2-Pro/Omni 模型下线通知,宣布将于2026年6月30日正式停止旧版本模型服务,并以 MiMo V2.5系列完成替换。其中,mimo-v2

MiniCPM-V4.6发布:端侧多模态大模型性能强效率高落地广
AI妹 13 天前 2 0

5月11日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布新一代端侧多模态大模型 MiniCPM-V4.6。这款仅拥有1.3B 参数的“轻量级”模型,凭借极致的智能密度与跨平台适配能力

阿里云百炼强化开放生态 接入多家主流第三方模型成AI模型超级市场
AI妹 19 天前 2 0

在 5 月 20 日的阿里云峰会上,阿里云宣布其大模型服务平台“百炼”进一步强化开放生态,正式宣布将接入多家行业领先的第三方顶尖模型。这一举措标志着百炼已不再仅仅是阿里自研“千问”模型的展示台,而

AMD推出vLLM-ATOM插件 助力Instinct GPU大模型推理高效提速
AI妹 28 天前 0 0

近日,AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下,显著榨取硬件潜能,为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1

月之暗面发布开源Kimi K2.6 编程长程任务Agent协作能力显著跨越
AI妹 1 个月前 3 0

国产大模型领域迎来重磅更新。4月21日,月之暗面(Moonshot AI)正式发布并开源了其最新旗舰模型 Kimi K2.6。这款模型在编程能力、长程任务处理以及多Agent(智能体)协作方面实现

阿里Marco-Mini-Instruct:轻量化MoE模型CPU流畅运行 创新upcycling技术
AI妹 2 个月前 4 0

阿里国际数字商业团队近日在 Marco-MoE 系列模型中重磅推出新成员——Marco-Mini-Instruct,再次展现了“以小博大”的极致效率理念。该模型总参数量17.3B,激活参数量却仅0

Google Gemini3.1Flash-Lite:速度突破实现实时网页渲染显潜力
AI妹 2 个月前 4 0

Google DeepMind 今日展示了其在生成式 AI 速度领域的突破性成果:Gemini3.1Flash-Lite。该模型凭借极高的推理效率,能够实现几乎“实时”的网页渲染,将 AI 从简单

AI视频领军企业完成C轮融资 全球首发实时世界模型PixVerse R1
AI妹 2 个月前 4 0

在 AI 视频生成领域,技术迭代的浪潮正从“内容生成”向“实时交互”加速演进。今日,AI 视频生成领域的领军企业 正式宣布完成 C 轮融资。本轮融资由鼎晖领投,并吸引了中国儒意、三七互娱以

英伟达拟推OpenAI定制处理器 战略转型稳核心客户聚焦推理效率
AI妹 3 个月前 4 0

硅谷的“算力霸主”正以一次前所未有的战略调头,重新定义 AI 推理的边界。2026 年 2 月 27 日,据知情人士披露, 英伟达 (NVIDIA) 计划推出一款专为

月之暗面Kimi K2.5吸金猛 20天收入超去年全年 海外用户助力估值破百亿
AI妹 3 个月前 5 0

国产大模型“独角兽”的赚钱速度再次刷新了行业认知。2026年2月24日,据 OSCHINA 报道, 月之暗面(Moonshot AI)