关闭导航

包含标签"推理速度"的内容

谷歌为开源模型Gemma4推MTP起草器 推理速度最高提升3倍
AI妹 1 个月前 2 0

在开源模型领域投下“重磅炸弹”仅数周后,谷歌再次为其最强开源模型Gemma4 注入了强效“助推剂”。当地时间 5 月 5 日,谷歌正式发布了针对Gemma4 系列模型的多Token预测(MTP)起

腾讯开源1.25bit紧凑型AI翻译模型Hy-MT 离线多语言性能媲美大模型
AI妹 1 个月前 2 0

腾讯近日正式开源紧凑型 AI 翻译模型 Hy-MT1.5-1.8B-1.25bit。该公司声称,该模型在保持高性能的同时,可在智能手机上实现完全离线运行。目前,该模型支持包括中、英、德、法、日、藏

蚂蚁百灵大模型Ling-2.6-flash开源 多量化版本提升推理与智能体能力
AI妹 1 个月前 2 0

蚂蚁集团旗下的百灵大模型今日宣布,正式开源其最新成员Ling-2.6-flash。该模型同步推出了BF16、FP8、INT4 等多个量化版本,旨在为全球开发者提供更灵活的硬件适配选择,进一步降低A

阶跃星辰发布Step3.5 Flash系列模型 极速响应低推理成本助力AI规模化落地
AI妹 2 个月前 3 0

近日,国内 AI 大模型领军企业阶跃星辰(Stepfun)正式发布了全新的 Step 3.5 Flash 系列模型。这一动作标志着国产大模型在追求超高性能的同时,正向着更极速的响应和更低的推理成本

英伟达推出Nemotron3Super开源AI智能体模型 推理提速性能优异受众多大厂集成
AI妹 2 个月前 4 0

英伟达(NVIDIA)在AI大模型领域再次投下震撼弹。3月12日,英伟达正式发布了专为AI智能体(Agent)设计的新一代开源大模型—— Nemotron3Super

Anthropic Claude Sonnet5将发布:中端定位旗舰性能成本减半效率大增
AI妹 4 个月前 63 0

在 AI 行业竞争白热化之际,Anthropic 再次传出重磅消息。多份行业报告显示,该公司的中端主力模型 Claude Sonnet5 已进入发布倒计时。业内人士透露,内部测试与上线前的静默准备

OpenAI因推理瓶颈寻英伟达外算力替代 合作Cerebras等新势力
AI妹 4 个月前 20 0

据知情人士透露,全球 AI 领军企业OpenAI近期正积极系统性地寻找英伟达之外的算力替代方案。这一动作源于其对英伟达最新一代 AI 芯片在特定推理环节(尤其是响应速度)表现的失望。 核心痛点:

阶跃星辰发布Step3.5Flash开源基座模型 赋能Agent场景速度性能双突破高效智能
AI妹 4 个月前 43 0

阶跃星辰(Stepfun)近日正式发布了其最新一代开源基座模型——Step3.5Flash。该模型专为智能体(Agent)场景打造,凭借强大的推理能力与极致的响应速度,旨在为开发者提供一个更聪明、

腾讯开源混元翻译模型1.5 支持多语言端侧离线实时翻译
AI妹 5 个月前 14 0

据AIbase报道,腾讯近日正式发布其混元翻译模型(HY-MT)的1.5版本,并宣布将其开源。这是一个支持33种语言互译的强大解决方案,旨在为移动设备和高效的端侧部署提供卓越的翻译能力。 新

英伟达豪赌200亿获Groq LPU技术 核心团队加盟巩固AI芯片护城河
AI妹 5 个月前 24 0

全球AI芯片霸主英伟达(NVIDIA)正以惊人动作巩固其技术护城河。据CNBC与TechCrunch综合报道,英伟达已与AI芯片挑战者Groq达成一项非独家技术授权协议,并同步聘请Groq创始人兼