推理效率 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"推理效率"的内容

百度正式发布文心5.0全模态大模型 2.4万亿参数国际领先多领域应用

百度正式发布文心5.0全模态大模型 2.4万亿参数国际领先多领域应用

AI妹 4 个月前 19 0

在人工智能的浪潮中，百度于今日正式发布了其最新的全模态大模型 —— 文心 5.0。这款模型以其惊人的 2.4 万亿参数，展现出超强的语言理解与生成能力，标志着人工智能领域的一次重大飞跃。文心

2.4万亿参数文心App 专家指导校准混合专家结构文心一言官网

查看详情

OpenAI与Cerebras合作部署晶圆级系统打造全球最大高速AI推理平台

OpenAI与Cerebras合作部署晶圆级系统打造全球最大高速AI推理平台

AI妹 4 个月前 18 0

OpenAI与美国AI芯片独角兽Cerebras联合宣布，将部署总计 750 兆瓦的Cerebras晶圆级系统，构建全球规模最大的高速AI推理平台。该合作自 2026 年起分阶段实施，预计 202

4万亿晶体管收入潜力大规模商用 AI芯片英伟达

查看详情

科大讯飞联合华为国产算力助力星火大模型训练效率大幅提升

科大讯飞联合华为国产算力助力星火大模型训练效率大幅提升

AI妹 5 个月前 17 0

在近日的互动平台上，科大讯飞宣布了一个振奋人心的消息：经过几年的努力和投资，他们在星火大模型的训练和推理效率上取得了显著进展。与直接依赖英伟达显卡的传统方法不同，科大讯飞选择了更具挑战性的全国产算

科大讯飞长思维链强化学习训练效率国产算力方案英伟达A800

查看详情

阶跃星辰发布Step3多模态推理大模型 7月31日开源并成立模芯生态联盟

阶跃星辰发布Step3多模态推理大模型 7月31日开源并成立模芯生态联盟

AI妹 5 个月前 18 0

在2025世界人工智能大會（WAIC2025）前夕，階躍星辰在上海發佈了其新一代基礎大模型 ——Step3。這款模型不僅在智能性上取得突破，還兼顧了推理效率，旨在爲企業和開發者提供最優質的應用方案

激活参数38B 1+N模型矩阵 7月31日模芯生态创新联盟多模态

查看详情

阶跃星辰发布Step3大模型 7月31日开源并成立模芯生态创新联盟

阶跃星辰发布Step3大模型 7月31日开源并成立模芯生态创新联盟

AI妹 5 个月前 16 0

在2025世界人工智能大会（WAIC2025）前夕，阶跃星辰在上海发布了其新一代基础大模型 ——Step3。这款模型不仅在智能性上取得突破，还兼顾了推理效率，旨在为企业和开发者提供最优质的应用方案

NVIDIA Hopper架构原生多模态推理模型适配性跨领域知识理解全尺寸模型

查看详情

Meta发布五项AI感知前沿成果构建高级机器智能关键路径

Meta发布五项AI感知前沿成果构建高级机器智能关键路径

AI妹 5 个月前 18 0

Meta人工智能研究团队（FAIR）近日公开发布五项前沿研究成果，标志着AI感知领域的重大突破。这些开源项目从视觉编码器到3D空间理解，再到协作式推理框架，共同构建了通向高级机器智能(AMI)的关

PLM-VideoBench 检索任务视频问答高级机器智能(AMI) 3D空间理解

查看详情

阶跃星辰Step3基础大模型正式开源具MoE架构高效推理多模态能力

阶跃星辰Step3基础大模型正式开源具MoE架构高效推理多模态能力

AI妹 5 个月前 14 0

階躍星辰團隊宣佈其最新一代基礎大模型 Step3正式開源。Step3是一款專爲追求性能與成本極致均衡的企業和開發者設計的模型，旨在面向推理時代打造最適合應用的模型。該模型的開源地址包括

解码流程重构 MoE架构 GPU Direct RDMA 图文协同基础大模型

查看详情

阶跃星辰Step3大模型正式开源高性能多模态推理效率大幅提升行业领先

阶跃星辰Step3大模型正式开源高性能多模态推理效率大幅提升行业领先

AI妹 5 个月前 16 0

阶跃星辰团队宣布其最新一代基础大模型 Step3正式开源。Step3是一款专为追求性能与成本极致均衡的企业和开发者设计的模型，旨在面向推理时代打造最适合应用的模型。该模型的开源地址包括

MathVision GitHub StepMesh通信库开源 MFA注意力机制

查看详情

Deep Cogito開源Cogito v2系列LLM 主打機器直覺與自我改進推理

Deep Cogito開源Cogito v2系列LLM 主打機器直覺與自我改進推理

AI妹 5 个月前 17 0

【AIbase 報道】近日，一家鮮爲人知但備受關注的舊金山初創公司 Deep Cogito 發佈了旗下 Cogito v2系列大型語言模型（LLM），試圖在擁擠的開源AI賽道中突圍。不同於傳統的參

大型语言模型参数规模70B-671B 内省式推理思维效率最优 fp8量化版本

查看详情

Deep Cogito发布Cogito v2系列LLM 主打机器直觉与自我改进推理

Deep Cogito发布Cogito v2系列LLM 主打机器直觉与自我改进推理

AI妹 5 个月前 16 0

【AIbase 报道】近日，一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型（LLM），试图在拥挤的开源AI赛道中突围。不同于传统的参

fp8量化版本推理效率 Drishan Arora Hugging Face South Park Commons

查看详情

2



资讯姬

文章数量13527

总阅读量230.548k

总评论量0

会员数量2

本站由emlog驱动