推理速度 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"推理速度"的内容

谷歌为开源模型Gemma4推MTP起草器推理速度最高提升3倍

谷歌为开源模型Gemma4推MTP起草器推理速度最高提升3倍

AI妹 1 个月前 2 0

在开源模型领域投下“重磅炸弹”仅数周后，谷歌再次为其最强开源模型Gemma4 注入了强效“助推剂”。当地时间 5 月 5 日，谷歌正式发布了针对Gemma4 系列模型的多Token预测（MTP）起

开源模型 MTP起草器推理瓶颈移动端AI应用自主智能体

查看详情

腾讯开源1.25bit紧凑型AI翻译模型Hy-MT 离线多语言性能媲美大模型

腾讯开源1.25bit紧凑型AI翻译模型Hy-MT 离线多语言性能媲美大模型

AI妹 1 个月前 2 0

腾讯近日正式开源紧凑型 AI 翻译模型 Hy-MT1.5-1.8B-1.25bit。该公司声称，该模型在保持高性能的同时，可在智能手机上实现完全离线运行。目前，该模型支持包括中、英、德、法、日、藏

激进压缩方案 33种语言终端侧AI Hy-MT1.5-1.8B-1.25bit APK

查看详情

蚂蚁百灵大模型Ling-2.6-flash开源多量化版本提升推理与智能体能力

蚂蚁百灵大模型Ling-2.6-flash开源多量化版本提升推理与智能体能力

AI妹 1 个月前 2 0

蚂蚁集团旗下的百灵大模型今日宣布，正式开源其最新成员Ling-2.6-flash。该模型同步推出了BF16、FP8、INT4 等多个量化版本，旨在为全球开发者提供更灵活的硬件适配选择，进一步降低A

任务规划 H20显卡 Hugging Face BF16 工具调用

查看详情

阶跃星辰发布Step3.5 Flash系列模型极速响应低推理成本助力AI规模化落地

阶跃星辰发布Step3.5 Flash系列模型极速响应低推理成本助力AI规模化落地

AI妹 2 个月前 3 0

近日，国内 AI 大模型领军企业阶跃星辰（Stepfun）正式发布了全新的 Step 3.5 Flash 系列模型。这一动作标志着国产大模型在追求超高性能的同时，正向着更极速的响应和更低的推理成本

多模态处理能力视觉理解移动端交互场景长文本分析实时翻译

查看详情

英伟达推出Nemotron3Super开源AI智能体模型推理提速性能优异受众多大厂集成

英伟达推出Nemotron3Super开源AI智能体模型推理提速性能优异受众多大厂集成

AI妹 2 个月前 4 0

英伟达（NVIDIA）在AI大模型领域再次投下震撼弹。3月12日，英伟达正式发布了专为AI智能体(Agent)设计的新一代开源大模型—— Nemotron3Super

吞吐量西门子 Azure 120亿激活参数 gpt-5.4

查看详情

Anthropic Claude Sonnet5将发布：中端定位旗舰性能成本减半效率大增

Anthropic Claude Sonnet5将发布：中端定位旗舰性能成本减半效率大增

AI妹 4 个月前 63 0

在 AI 行业竞争白热化之际，Anthropic 再次传出重磅消息。多份行业报告显示，该公司的中端主力模型 Claude Sonnet5 已进入发布倒计时。业内人士透露，内部测试与上线前的静默准备

Claude Opus4.5 聊天机器人推理速度性价比之王开发者社区

查看详情

OpenAI因推理瓶颈寻英伟达外算力替代合作Cerebras等新势力

OpenAI因推理瓶颈寻英伟达外算力替代合作Cerebras等新势力

AI妹 4 个月前 20 0

据知情人士透露，全球 AI 领军企业OpenAI近期正积极系统性地寻找英伟达之外的算力替代方案。这一动作源于其对英伟达最新一代 AI 芯片在特定推理环节（尤其是响应速度）表现的失望。核心痛点:

Anthropic AMD 巨头博弈采购多元化推理环节

查看详情

阶跃星辰发布Step3.5Flash开源基座模型赋能Agent场景速度性能双突破高效智能

阶跃星辰发布Step3.5Flash开源基座模型赋能Agent场景速度性能双突破高效智能

AI妹 4 个月前 44 0

阶跃星辰（Stepfun）近日正式发布了其最新一代开源基座模型——Step3.5Flash。该模型专为智能体（Agent）场景打造，凭借强大的推理能力与极致的响应速度，旨在为开发者提供一个更聪明、

智能编程 GitHub Step4模型端云协同稀疏MoE架构

查看详情

腾讯开源混元翻译模型1.5 支持多语言端侧离线实时翻译

腾讯开源混元翻译模型1.5 支持多语言端侧离线实时翻译

AI妹 5 个月前 14 0

据AIbase报道，腾讯近日正式发布其混元翻译模型（HY-MT）的1.5版本，并宣布将其开源。这是一个支持33种语言互译的强大解决方案，旨在为移动设备和高效的端侧部署提供卓越的翻译能力。新

HY-MT1.5 上下文理解 Tencent-HY-MT1.5-1.8B 自定义术语库企业微信

查看详情

英伟达豪赌200亿获Groq LPU技术核心团队加盟巩固AI芯片护城河

英伟达豪赌200亿获Groq LPU技术核心团队加盟巩固AI芯片护城河

AI妹 5 个月前 25 0

全球AI芯片霸主英伟达（NVIDIA）正以惊人动作巩固其技术护城河。据CNBC与TechCrunch综合报道，英伟达已与AI芯片挑战者Groq达成一项非独家技术授权协议，并同步聘请Groq创始人兼

Groq AI推理市场 LPU AI芯片 Jonathan Ross

查看详情

1



资讯姬

文章数量13530

总阅读量231.384k

总评论量0

会员数量2

本站由emlog驱动