混合专家架构（MoE） - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"混合专家架构（MoE）"的内容

上海AI实验室开源全球最大万亿参数自主科学多模态模型Intern-S1-Pro

上海AI实验室开源全球最大万亿参数自主科学多模态模型Intern-S1-Pro

AI妹 2 个月前 26 0

全球开源AI社区迎来重磅里程碑。上海人工智能实验室正式发布并开源了万亿参数级别的科学多模态大模型——书生 Intern-S1-Pro。该模型基于创新的“通专融合”技术架构 SAGE 打造，不仅刷新

开源自主技术链路突破奥赛金牌水平国产算力基座 SAGE架构

查看详情

DeepSeek-OCR2新一代文档识别模型：动态排序+MoE架构性能提升3.73%

DeepSeek-OCR2新一代文档识别模型：动态排序+MoE架构性能提升3.73%

AI妹 2 个月前 4 0

DeepSeek 宣布推出新一代文档识别模型 DeepSeek-OCR2。该模型在视觉编码器设计上实现了重大突破，旨在解决传统模型在处理复杂版式文档时逻辑感缺失的问题。 DeepSee

高效MoE架构 PDF批处理编解码框架 DeepEncoder V2 DeepSeek-OCR2

查看详情

安诊儿医疗大模型发布开源生态+临床落地中国医疗AI迈关键步

安诊儿医疗大模型发布开源生态+临床落地中国医疗AI迈关键步

AI妹 3 个月前 17 0

中国医疗AI迈出关键一步。 12 月 20 日，国家人工智能应用中试基地（医疗）在浙江正式对外开放产业园区，并重磅发布由蚂蚁集团与基地联合研发的“安诊儿医疗大模型”（AntAngelMed）。该模

寒武纪医疗智能革命 1000亿参数开源医疗大模型国家人工智能应用中试基地（医疗） Jack安心智能体

查看详情

阿里云Qwen3系列模型正式发布编码代理MCP深度融合多模态开源性能卓越

阿里云Qwen3系列模型正式发布编码代理MCP深度融合多模态开源性能卓越

AI妹 3 个月前 33 0

阿里雲Qwen團隊宣佈Qwen3系列模型正式發佈，以卓越的編碼能力、增強的代理功能和對Model Context Protocol（MCP）的深度支持，掀起AI社區熱潮。據AIbase瞭解，Qwe

TikTok Qwen-Agent框架 Qwen3-Audio QwenLM API集成

查看详情

阿里云Qwen3系列模型发布编码代理MCP多模态能力卓越性能领先

阿里云Qwen3系列模型发布编码代理MCP多模态能力卓越性能领先

AI妹 3 个月前 23 0

阿里云Qwen团队宣布Qwen3系列模型正式发布，以卓越的编码能力、增强的代理功能和对Model Context Protocol（MCP）的深度支持，掀起AI社区热潮。据AIbase了解，Qwe

BigCodeBench GPT-4o 混合专家架构（MoE） Qwen3-30B-A3B Qwen3-235B-A22B

查看详情

xAI Grok3.5测试版下周推出 SuperGrok专属聚焦第一性原理推理与技术专精

xAI Grok3.5测试版下周推出 SuperGrok专属聚焦第一性原理推理与技术专精

AI妹 3 个月前 14 0

xAI宣佈Grok3.5測試版將於下週正式推出，首批僅對SuperGrok訂閱用戶開放。據AIbase瞭解，該版本以其在火箭發動機和電化學等領域的精準技術解答能力引發熱議，號稱“全球首個人工智能能

火箭发动机 Simular AI 混合专家架构（MoE） Big Brain模式 API

查看详情

智谱发布GLM-4.5开源旗舰模型专为Agent打造性能国产开源第一价格亲民

智谱发布GLM-4.5开源旗舰模型专为Agent打造性能国产开源第一价格亲民

AI妹 3 个月前 13 0

近日，智谱正式推出了其最新旗舰模型 GLM-4.5，这款模型被称为 “专为 Agent 应用打造的基础模型”，并且在推理、代码生成以及智能体综合能力上达到了开源模型的 SOTA（State Of

Hugging Face 国产第一混合专家架构（MoE） 15万亿token预训练 SOTA

查看详情

Unsloth推出Qwen3动态量化2.0 低显存高效长上下文本地运行受社区广泛好评

Unsloth推出Qwen3动态量化2.0 低显存高效长上下文本地运行受社区广泛好评

AI妹 3 个月前 14 0

Unsloth宣布推出Qwen3的动态量化2.0版本（Dynamic2.0Quants），为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解，新版本通过改进的量化技术，在保持高准确度

Llama.cpp 个人开发推理引擎兼容 Qwen3-235B-A22B Colab笔记本

查看详情

第三届开放原子开源大赛启动腾讯联合设百万奖金及就业通道

第三届开放原子开源大赛启动腾讯联合设百万奖金及就业通道

AI妹 3 个月前 18 0

Tencent and the Open Atoms Open Source Foundation jointly announced on August 5 that the third Ope

工业问题解决影响力 HuanYuan大模型多模态数据问题操作系统创新

查看详情

字节跳动BAGEL多模态模型：MoE架构赋能性能超竞品开源受热捧

字节跳动BAGEL多模态模型：MoE架构赋能性能超竞品开源受热捧

AI妹 3 个月前 12 0

字節跳動SeedチームはHugging Faceプラットフォーム上で、混合専門家（MoE）アーキテクチャに基づくオープンソースのマルチモーダルベースモデル「BAGEL」を発表しました。総パラメータ

GitHub 混合专家架构（MoE）推論効率多言語最適化混合トランスフォーマー専門家(MoT)

查看详情

1



资讯姬

文章数量11972

总阅读量192.633k

总评论量0

会员数量2

本站由emlog驱动