关闭导航

包含标签"MoE架构"的内容

火山引擎新豆包1.5深度思考模型上线边缘大模型网关 提供500万tokens免费
AI妹 5 个月前 20 0

4月25日,字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。 豆包

火山引擎豆包1.5深層思考モデルがエッジLLMゲートウェイ上线、500万トークン無料提供
AI妹 5 个月前 13 0

4月25日、バイトダンス傘下の火山エンジンは、最新リリースの豆包1.5・深層思考モデルがエッジ大規模言語モデルゲートウェイに全面的に上线し、ユーザーに最大500万トークンの無料利用枠を提供すると発

火山引擎豆包1.5深度思考模型全面上线边缘网关 提供500万tokens免费额度
AI妹 5 个月前 15 0

4月25日,字節跳動旗下的火山引擎宣佈,其最新發佈的豆包1.5·深度思考模型已全面上線邊緣大模型網關,併爲用戶提供高達500萬tokens的免費使用額度,這一舉措在AI領域引起了廣泛關注。 豆包

阿里云Qwen3系列模型本周发布 多规模超256K上下文亮点纷呈
AI妹 5 个月前 13 0

阿里雲Qwen團隊通過社交平臺正式確認,Qwen3系列模型將於本週內發佈,標誌着其旗艦大語言模型(LLM)與多模態能力的又一次重大升級。據AIbase瞭解,Qwen3將推出包括0.6B、4B、8B

阿里云Qwen3系列模型本周发布 多规模+256K上下文+多模态能力升级
AI妹 5 个月前 16 0

阿里云Qwen团队通过社交平台正式确认,Qwen3系列模型将于本周内发布,标志着其旗舰大语言模型(LLM)与多模态能力的又一次重大升级。据AIbase了解,Qwen3将推出包括0.6B、4B、8B

阿里巴巴推出通义千问3混合推理模型 开源部署成本低性能提升显著
AI妹 5 个月前 16 0

阿里巴巴正式推出新一代通義千問模型 Qwen3(千問3),並宣佈其開源。阿里雲表示,千問3是國內首個 “混合推理模型”,同時集成了 “快思考” 與 “慢思考” 的能力。相比於 DeepSeek-R

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 5 个月前 18 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密

阿里Qwen3:通义千问最新开源大模型 混合推理多模態赋能全场景
AI妹 5 个月前 16 0

Qwen3是什麼? 阿里Qwen3是通義千問系列的最新一代開源大語言模型(LLM),於2025年4月29日正式發佈。作爲全球首個支持“混合推理”的模型,Qwen3包含8款不同規模的模型,涵蓋稠密

阿里Qwen3-235B-A22B模型HuggingChat上线 技术突破赋能开源AI生态
AI妹 5 个月前 16 0

由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A

通义灵码编程智能体支持Qwen3 新功能助力开发者编码效率提升
AI妹 5 个月前 18 0

通义灵码团队宣布其编程智能体全面支持Qwen3,并上线了全新的编程智能体功能。这一智能体具备自主决策、环境感知和工具使用等能力,能够根据开发者的诉求,使用工程检索、文件编辑、终端等工具,端到端地完