关闭导航

包含标签"推理效率"的内容

阿里Marco-Mini-Instruct:轻量化MoE模型CPU流畅运行 创新upcycling技术
AI妹 6 天前 0 0

阿里国际数字商业团队近日在 Marco-MoE 系列模型中重磅推出新成员——Marco-Mini-Instruct,再次展现了“以小博大”的极致效率理念。该模型总参数量17.3B,激活参数量却仅0

Google Gemini3.1Flash-Lite:速度突破实现实时网页渲染显潜力
AI妹 22 天前 2 0

Google DeepMind 今日展示了其在生成式 AI 速度领域的突破性成果:Gemini3.1Flash-Lite。该模型凭借极高的推理效率,能够实现几乎“实时”的网页渲染,将 AI 从简单

AI视频领军企业完成C轮融资 全球首发实时世界模型PixVerse R1
AI妹 1 个月前 2 0

在 AI 视频生成领域,技术迭代的浪潮正从“内容生成”向“实时交互”加速演进。今日,AI 视频生成领域的领军企业 正式宣布完成 C 轮融资。本轮融资由鼎晖领投,并吸引了中国儒意、三七互娱以

英伟达拟推OpenAI定制处理器 战略转型稳核心客户聚焦推理效率
AI妹 1 个月前 2 0

硅谷的“算力霸主”正以一次前所未有的战略调头,重新定义 AI 推理的边界。2026 年 2 月 27 日,据知情人士披露, 英伟达 (NVIDIA) 计划推出一款专为

月之暗面Kimi K2.5吸金猛 20天收入超去年全年 海外用户助力估值破百亿
AI妹 1 个月前 2 0

国产大模型“独角兽”的赚钱速度再次刷新了行业认知。2026年2月24日,据 OSCHINA 报道, 月之暗面(Moonshot AI)

百度正式发布文心5.0全模态大模型 2.4万亿参数国际领先多领域应用
AI妹 2 个月前 16 0

在人工智能的浪潮中,百度于今日正式发布了其最新的全模态大模型 —— 文心 5.0。这款模型以其惊人的 2.4 万亿参数,展现出超强的语言理解与生成能力,标志着人工智能领域的一次重大飞跃。 文心

OpenAI与Cerebras合作部署晶圆级系统 打造全球最大高速AI推理平台
AI妹 3 个月前 15 0

OpenAI与美国AI芯片独角兽Cerebras联合宣布,将部署总计 750 兆瓦的Cerebras晶圆级系统,构建全球规模最大的高速AI推理平台。该合作自 2026 年起分阶段实施,预计 202

科大讯飞联合华为 国产算力助力星火大模型训练效率大幅提升
AI妹 3 个月前 13 0

在近日的互动平台上,科大讯飞宣布了一个振奋人心的消息:经过几年的努力和投资,他们在星火大模型的训练和推理效率上取得了显著进展。与直接依赖英伟达显卡的传统方法不同,科大讯飞选择了更具挑战性的全国产算

阶跃星辰发布Step3多模态推理大模型 7月31日开源并成立模芯生态联盟
AI妹 3 个月前 15 0

在2025世界人工智能大會(WAIC2025)前夕,階躍星辰在上海發佈了其新一代基礎大模型 ——Step3。這款模型不僅在智能性上取得突破,還兼顧了推理效率,旨在爲企業和開發者提供最優質的應用方案

阶跃星辰发布Step3大模型 7月31日开源并成立模芯生态创新联盟
AI妹 3 个月前 14 0

在2025世界人工智能大会(WAIC2025)前夕,阶跃星辰在上海发布了其新一代基础大模型 ——Step3。这款模型不仅在智能性上取得突破,还兼顾了推理效率,旨在为企业和开发者提供最优质的应用方案