MoE架构 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"MoE架构"的内容

月之暗面发布开源Kimi K2模型：1T参数MoE架构代码与Agent能力卓越

月之暗面发布开源Kimi K2模型：1T参数MoE架构代码与Agent能力卓越

AI妹 5 个月前 16 0

月之暗面公司正式发布了其最新力作——Kimi K2模型，并同步宣布开源。这款基于MoE架构的基础模型，凭借其强大的代码能力、卓越的通用Agent任务处理能力，一经发布便在AI领域引起了广泛关注。

API服务开源 MoE架构月之暗面公司 HuggingFace

查看详情

月之暗面开源万亿参数Kimi K2 代码与Agent能力领先开源领域

月之暗面开源万亿参数Kimi K2 代码与Agent能力领先开源领域

AI妹 5 个月前 14 0

月之暗面公司正式發佈了其最新力作——Kimi K2模型，並同步宣佈開源。這款基於MoE架構的基礎模型，憑藉其強大的代碼能力、卓越的通用Agent任務處理能力，一經發布便在AI領域引起了廣泛關注。

前端代码生成 MoE架构 MuonClip优化器 Tau2 Kimi-K2-Instruct

查看详情

月之暗面开源Kimi K2模型回应API速度问题并优化服务支持128K上下文

月之暗面开源Kimi K2模型回应API速度问题并优化服务支持128K上下文

AI妹 5 个月前 16 0

7月11日，月之暗面正式发布了具备更强代码能力和通用Agent任务处理能力的Kimi K2模型，并同步选择将其开源。这款基于MoE架构的基础模型总参数达1T，激活参数为32B，一经推出便受到广泛关

无问芯穹计费标准 MoE架构总参数1T 计算卡

查看详情

月之暗面开源Kimi K2模型回应API速度慢问题并推进优化提升

月之暗面开源Kimi K2模型回应API速度慢问题并推进优化提升

AI妹 5 个月前 18 0

7月11日，月之暗面正式發佈了具備更強代碼能力和通用Agent任務處理能力的Kimi K2模型，並同步選擇將其開源。這款基於MoE架構的基礎模型總參數達1T，激活參數爲32B，一經推出便受到廣泛關

Kimi K2模型 128K上下文模型体积大 1T总参数 32B激活参数

查看详情

2025年主流开源大模型架构特点、技术差异与趋势深度解析

2025年主流开源大模型架构特点、技术差异与趋势深度解析

AI妹 5 个月前 21 0

近年來，大型語言模型（LLM）的快速發展推動了人工智能技術的邊界，特別是在開源領域，模型架構的創新成爲業界關注的焦點。AIbase綜合近期網絡信息，深入剖析了Llama3.2、Qwen3-4B、S

MoE架构 DeepSeek-V3 Qwen3-4B SmolLM3-3B 多模态应用

查看详情

2025年主流开源大模型核心架构差异与技术趋势深度剖析

2025年主流开源大模型核心架构差异与技术趋势深度剖析

AI妹 5 个月前 19 0

近年来，大型语言模型（LLM）的快速发展推动了人工智能技术的边界，特别是在开源领域，模型架构的创新成为业界关注的焦点。AIbase综合近期网络信息，深入剖析了Llama3.2、Qwen3-4B、S

部署难度 Kimi-K2 Qwen3-4B 开源大模型推理速度

查看详情

阿里云Qwen3-Coder AI编程大模型开源能力达开源顶尖水平

阿里云Qwen3-Coder AI编程大模型开源能力达开源顶尖水平

AI妹 5 个月前 45 0

7月23日，阿里雲正式宣佈其最新的AI編程大模型Qwen3-Coder全面開源，這一舉措迅速在智能編程領域掀起熱潮。Qwen3-Coder憑藉其卓越的代碼生成和Agent能力，在Agentic C

Qwen Code 通义团队阿里云开源 35B激活参数

查看详情

阿里云开源Qwen3-Coder AI编程大模型达开源顶尖水平

阿里云开源Qwen3-Coder AI编程大模型达开源顶尖水平

AI妹 5 个月前 43 0

7月23日，阿里云正式宣布其最新的AI编程大模型Qwen3-Coder全面开源，这一举措迅速在智能编程领域掀起热潮。Qwen3-Coder凭借其卓越的代码生成和Agent能力，在Agentic C

MoE架构 480B参数量 HuggingFace Qwen3-Coder SWE-bench

查看详情

Qwen-MT机械翻译模型正式发布多语言高性能低代价优势显著

Qwen-MT机械翻译模型正式发布多语言高性能低代价优势显著

AI妹 5 个月前 20 0

Qwen-MTの機械翻訳モデルが正式リリースされました。Qwen-MTは、強力なQwen3モデルを基盤とし、超大規模な多言語および翻訳データでトレーニングを行い、強化学習技術を組み合わせることで、

92语言 MoE架构自动评估百煉 qwen-mt-turbo

查看详情

腾讯重组AI研发体系加码大模型姚顺雨加盟引才加速行业竞逐

腾讯重组AI研发体系加码大模型姚顺雨加盟引才加速行业竞逐

AI妹 5 个月前 20 0

腾讯正以前所未有的力度加码大模型战略。今日，公司宣布对AI研发体系进行深度重组，新设AI Infra部、AI Data部、数据计算平台部，全面强化从算力底座、数据体系到模型研发的全栈能力。此举标志

智能体混元大模型陈鹏刘煜宏 AI研发体系重组

查看详情

6



资讯姬

文章数量13527

总阅读量230.286k

总评论量0

会员数量2

本站由emlog驱动