MoE架构 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MoE架构"的内容

OpenAI拟开源GPT-OSS：MoE架构+长上下文能力引行业关注

OpenAI拟开源GPT-OSS：MoE架构+长上下文能力引行业关注

AI妹 5 个月前 15 0

近日，網絡上流傳出OpenAI即將推出開源模型系列“GPT-OSS”（GPT Open Source Software）的重大信息泄露，引發業界廣泛關注。據泄露的配置文件，這一操作系統系列模型參數

131k Tokens RoPE技术 OpenAI开源模型滑动窗口注意力机制高效注意力机制

查看详情

OpenAI拟开源GPT-OSS模型技术特点及AI行业潜在影响解析

OpenAI拟开源GPT-OSS模型技术特点及AI行业潜在影响解析

AI妹 5 个月前 16 0

最近、インターネット上でOpenAIがオープンソースモデルシリーズ「GPT-OSS」（GPT Open Source Software）を発表するという重大な情報漏洩が流出し、業界で広く注目を集め

Sliding Window Attention AIbase GPT-OSS mixture of experts 参数规模(20亿-120亿)

查看详情

字节跳动发布Seed1.5-VL视觉语言多模态模型高性能低成本开放API优势显著

字节跳动发布Seed1.5-VL视觉语言多模态模型高性能低成本开放API优势显著

AI妹 5 个月前 15 0

在上海举办的火山引擎 FORCE LINK AI 创新巡展上，字节跳动正式发布了最新的视觉 - 语言多模态模型 ——Seed1.5-VL。该模型凭借其出色的通用多模态理解和推理能力，成为此次活动的

AI视觉助手视觉-语言多模态模型图表理解交互Agent 推理成本低

查看详情

字节跳动发布Seed1.5-VL视觉语言多模态模型高性能低成本强推理且开放API

字节跳动发布Seed1.5-VL视觉语言多模态模型高性能低成本强推理且开放API

AI妹 5 个月前 15 0

在上海舉辦的火山引擎 FORCE LINK AI 創新巡展上，字節跳動正式發佈了最新的視覺 - 語言多模態模型 ——Seed1.5-VL。該模型憑藉其出色的通用多模態理解和推理能力，成爲此次活動的

MLP适配器 AI视觉助手视觉定位交互Agent Seed系列

查看详情

字节跳动火山引擎发布Seed1.5-VL 高性能低成本多模态模型API可便捷访问

字节跳动火山引擎发布Seed1.5-VL 高性能低成本多模态模型API可便捷访问

AI妹 5 个月前 14 0

上海で開催された「火山エンジン FORCE LINK AI ツアー」において、字節跳動は最新のビジュアル-言語マルチモーダルモデルである Seed1.5-VL を正式に発表しました。このモ

字节跳动 FORCE LINK AIツアー Doubao-1.5-thinking-vision-pro Seed1.5-VL MoE架构

查看详情

第三届开放原子开源大赛启动腾讯联合设百万奖金及就业通道

第三届开放原子开源大赛启动腾讯联合设百万奖金及就业通道

AI妹 5 个月前 21 0

Tencent and the Open Atoms Open Source Foundation jointly announced on August 5 that the third Ope

腾讯多模态数据容器技术创新满足需求产学研协同

查看详情

蚂蚁开源Ming-lite-omni 首个可媲美GPT-4o的开源多模态模型

蚂蚁开源Ming-lite-omni 首个可媲美GPT-4o的开源多模态模型

AI妹 5 个月前 15 0

蚂蚁集团旗下百灵大模型团队在近期蚂蚁技术日上宣布重大决定:将统一多模态大模型Ming-lite-omni进行全面开源。这一举措不仅标志着蚂蚁集团在AI领域的又一次重大开放，更被业界视为首个在模态支

Ming-lite-omni Ling-lite-1.5版本 300B尺寸SOTA MoE大语言模型 Ling-lite 百灵大模型团队

查看详情

蚂蚁集团开源220亿参多模态模型Ming-lite-omni 可对标GPT-4o

蚂蚁集团开源220亿参多模态模型Ming-lite-omni 可对标GPT-4o

AI妹 5 个月前 20 0

螞蟻集團旗下百靈大模型團隊在近期螞蟻技術日上宣佈重大決定:將統一多模態大模型Ming-lite-omni進行全面開源。這一舉措不僅標誌着螞蟻集團在AI領域的又一次重大開放，更被業界視爲首個在模態支

推理代码 220亿参数千问8B Ling-lite-1.5 SOTA水平

查看详情

腾讯开源混元-A13B：动态推理与MoE架构，性能媲美领先模型

腾讯开源混元-A13B：动态推理与MoE架构，性能媲美领先模型

AI妹 5 个月前 20 0

騰訊近日宣佈開源其全新語言模型“**混元-A13B**”，該模型引入了創新的**動態推理方法**，使其能夠根據任務複雜性在快速和深度“思考”之間智能切換。核心亮點:動態推理與MoE架構

/no_think 130亿活跃参数快速模式动态推理 20万亿训练token

查看详情

腾讯开源混元-A13B 动态推理MoE架构高性能表现优异

腾讯开源混元-A13B 动态推理MoE架构高性能表现优异

AI妹 5 个月前 16 0

テンセントは最近、新しく開発した言語モデル「**混元-A13B**」をオープンソース化することを発表しました。このモデルには、タスクの複雑さに応じて迅速な思考と深く考える「思考」の間でスマートに切

动态推论方法 20兆トークン训练 /think 87.3%准确率 256000トークン上下文窗口

查看详情

5



资讯姬

文章数量13527

总阅读量230.286k

总评论量0

会员数量2

本站由emlog驱动