关闭导航

包含标签"推理速度"的内容

阶跃星辰发布Step3.5 Flash系列模型 极速响应低推理成本助力AI规模化落地
AI妹 13 天前 0 0

近日,国内 AI 大模型领军企业阶跃星辰(Stepfun)正式发布了全新的 Step 3.5 Flash 系列模型。这一动作标志着国产大模型在追求超高性能的同时,正向着更极速的响应和更低的推理成本

英伟达推出Nemotron3Super开源AI智能体模型 推理提速性能优异受众多大厂集成
AI妹 1 个月前 2 0

英伟达(NVIDIA)在AI大模型领域再次投下震撼弹。3月12日,英伟达正式发布了专为AI智能体(Agent)设计的新一代开源大模型—— Nemotron3Super

Anthropic Claude Sonnet5将发布:中端定位旗舰性能成本减半效率大增
AI妹 2 个月前 60 0

在 AI 行业竞争白热化之际,Anthropic 再次传出重磅消息。多份行业报告显示,该公司的中端主力模型 Claude Sonnet5 已进入发布倒计时。业内人士透露,内部测试与上线前的静默准备

OpenAI因推理瓶颈寻英伟达外算力替代 合作Cerebras等新势力
AI妹 2 个月前 18 0

据知情人士透露,全球 AI 领军企业OpenAI近期正积极系统性地寻找英伟达之外的算力替代方案。这一动作源于其对英伟达最新一代 AI 芯片在特定推理环节(尤其是响应速度)表现的失望。 核心痛点:

阶跃星辰发布Step3.5Flash开源基座模型 赋能Agent场景速度性能双突破高效智能
AI妹 2 个月前 41 0

阶跃星辰(Stepfun)近日正式发布了其最新一代开源基座模型——Step3.5Flash。该模型专为智能体(Agent)场景打造,凭借强大的推理能力与极致的响应速度,旨在为开发者提供一个更聪明、

腾讯开源混元翻译模型1.5 支持多语言端侧离线实时翻译
AI妹 3 个月前 13 0

据AIbase报道,腾讯近日正式发布其混元翻译模型(HY-MT)的1.5版本,并宣布将其开源。这是一个支持33种语言互译的强大解决方案,旨在为移动设备和高效的端侧部署提供卓越的翻译能力。 新

英伟达豪赌200亿获Groq LPU技术 核心团队加盟巩固AI芯片护城河
AI妹 3 个月前 22 0

全球AI芯片霸主英伟达(NVIDIA)正以惊人动作巩固其技术护城河。据CNBC与TechCrunch综合报道,英伟达已与AI芯片挑战者Groq达成一项非独家技术授权协议,并同步聘请Groq创始人兼

智谱BigModel开放平台进入亿时代 多款大模型大幅降价降低企业使用门槛
AI妹 3 个月前 12 0

4月24日,智谱BigModel开放平台宣布进入“亿时代”,对旗下多款大模型产品进行价格调整,大幅降低使用门槛,让更多的企业能够以极低成本拥抱大模型技术。 智谱BigModel开放平台此次价

字节跳动Seed团队推出实验性扩散模型Seed Diffusion Preview 推理提速5.4倍实现技术突破
AI妹 3 个月前 16 0

字節跳動Seed團隊宣佈推出實驗性擴散語言模型Seed Diffusion Preview,標誌着在語言模型領域的一次重大技術突破。該模型旨在通過結構化的代碼生成實驗,驗證離散擴散技術路線作爲下一

阿里南开联合研发LLaVA-Scissor 高效压缩视频大模型token提升处理效率
AI妹 3 个月前 14 0

近日,阿里巴巴通义实验室与南开大学计算机科学学院联合发布了一种创新的视频大模型压缩方法 ——LLaVA-Scissor。这一技术的出现旨在应对视频模型处理中的一系列挑战,特别是传统方法在处理视频帧

    1 2