推理效率 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"推理效率"的内容

小米MiMo旧模型将于2026年6月30日下线升级至V2.5系列

小米MiMo旧模型将于2026年6月30日下线升级至V2.5系列

AI妹 11 天前 0 0

5月29日，据社交媒体消息，小米发布 MiMo-V2-Pro/Omni 模型下线通知，宣布将于2026年6月30日正式停止旧版本模型服务，并以 MiMo V2.5系列完成替换。其中，mimo-v2

模型下线部署成本推理能力模型升级性价比

查看详情

MiniCPM-V4.6发布：端侧多模态大模型性能强效率高落地广

MiniCPM-V4.6发布：端侧多模态大模型性能强效率高落地广

AI妹 13 天前 2 0

5月11日，面壁智能联合清华大学及 OpenBMB 开源社区，正式发布新一代端侧多模态大模型 MiniCPM-V4.6。这款仅拥有1.3B 参数的“轻量级”模型，凭借极致的智能密度与跨平台适配能力

面壁智能 OPPO 视频时序理解小米 OpenBMB开源社区

查看详情

阿里云百炼强化开放生态接入多家主流第三方模型成AI模型超级市场

阿里云百炼强化开放生态接入多家主流第三方模型成AI模型超级市场

AI妹 19 天前 2 0

在 5 月 20 日的阿里云峰会上，阿里云宣布其大模型服务平台“百炼”进一步强化开放生态，正式宣布将接入多家行业领先的第三方顶尖模型。这一举措标志着百炼已不再仅仅是阿里自研“千问”模型的展示台，而

第三方模型 AI模型超级市场阶跃星辰超节点服务器技术锁定

查看详情

AMD推出vLLM-ATOM插件助力Instinct GPU大模型推理高效提速

AMD推出vLLM-ATOM插件助力Instinct GPU大模型推理高效提速

AI妹 28 天前 0 0

近日，AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下，显著榨取硬件潜能，为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1

DeepSeek-R1 AMD 无感迁移稠密模型 AITER

查看详情

月之暗面发布开源Kimi K2.6 编程长程任务Agent协作能力显著跨越

月之暗面发布开源Kimi K2.6 编程长程任务Agent协作能力显著跨越

AI妹 1 个月前 3 0

国产大模型领域迎来重磅更新。4月21日，月之暗面（Moonshot AI）正式发布并开源了其最新旗舰模型 Kimi K2.6。这款模型在编程能力、长程任务处理以及多Agent(智能体)协作方面实现

Agent集群架构智能体并行作业协同办公 Mac本地部署 Kimi K2.6

查看详情

阿里Marco-Mini-Instruct：轻量化MoE模型CPU流畅运行创新upcycling技术

阿里Marco-Mini-Instruct：轻量化MoE模型CPU流畅运行创新upcycling技术

AI妹 2 个月前 4 0

阿里国际数字商业团队近日在 Marco-MoE 系列模型中重磅推出新成员——Marco-Mini-Instruct，再次展现了“以小博大”的极致效率理念。该模型总参数量17.3B，激活参数量却仅0

MoE架构 Qwen3-0.6B-Base 路由机制阿里国际数字商业团队激活参数量

查看详情

Google Gemini3.1Flash-Lite：速度突破实现实时网页渲染显潜力

Google Gemini3.1Flash-Lite：速度突破实现实时网页渲染显潜力

AI妹 2 个月前 4 0

Google DeepMind 今日展示了其在生成式 AI 速度领域的突破性成果:Gemini3.1Flash-Lite。该模型凭借极高的推理效率，能够实现几乎“实时”的网页渲染，将 AI 从简单

生成式AI速度 Google DeepMind 动态交互界面 360个Token 多模态任务测试

查看详情

AI视频领军企业完成C轮融资全球首发实时世界模型PixVerse R1

AI视频领军企业完成C轮融资全球首发实时世界模型PixVerse R1

AI妹 2 个月前 4 0

在 AI 视频生成领域，技术迭代的浪潮正从“内容生成”向“实时交互”加速演进。今日，AI 视频生成领域的领军企业正式宣布完成 C 轮融资。本轮融资由鼎晖领投，并吸引了中国儒意、三七互娱以

算力消耗下一代互动娱乐产品全球化 AI视频生成视频基础模型迭代三七互娱

查看详情

英伟达拟推OpenAI定制处理器战略转型稳核心客户聚焦推理效率

英伟达拟推OpenAI定制处理器战略转型稳核心客户聚焦推理效率

AI妹 3 个月前 4 0

硅谷的“算力霸主”正以一次前所未有的战略调头，重新定义 AI 推理的边界。2026 年 2 月 27 日，据知情人士披露，英伟达 (NVIDIA) 计划推出一款专为

GTC 2026开发者大会 OpenAI 推理性能系统架构商 AGI商业化

查看详情

月之暗面Kimi K2.5吸金猛 20天收入超去年全年海外用户助力估值破百亿

月之暗面Kimi K2.5吸金猛 20天收入超去年全年海外用户助力估值破百亿

AI妹 3 个月前 5 0

国产大模型“独角兽”的赚钱速度再次刷新了行业认知。2026年2月24日，据 OSCHINA 报道，月之暗面（Moonshot AI）

100–120亿美元估值 Moonshot AI 估值全球化布局 1万亿参数

查看详情

1



资讯姬

文章数量13527

总阅读量227.617k

总评论量0

会员数量2

本站由emlog驱动