关闭导航

包含标签"MoE架构"的内容

火山引擎豆包1.5深度思考模型全面上线边缘网关 提供500万tokens免费额度
AI妹 1 个月前 10 0

4月25日,字節跳動旗下的火山引擎宣佈,其最新發佈的豆包1.5·深度思考模型已全面上線邊緣大模型網關,併爲用戶提供高達500萬tokens的免費使用額度,這一舉措在AI領域引起了廣泛關注。 豆包

阿里云Qwen3系列模型本周发布 多规模超256K上下文亮点纷呈
AI妹 1 个月前 9 0

阿里雲Qwen團隊通過社交平臺正式確認,Qwen3系列模型將於本週內發佈,標誌着其旗艦大語言模型(LLM)與多模態能力的又一次重大升級。據AIbase瞭解,Qwen3將推出包括0.6B、4B、8B

阿里云Qwen3系列模型本周发布 多规模+256K上下文+多模态能力升级
AI妹 1 个月前 10 0

阿里云Qwen团队通过社交平台正式确认,Qwen3系列模型将于本周内发布,标志着其旗舰大语言模型(LLM)与多模态能力的又一次重大升级。据AIbase了解,Qwen3将推出包括0.6B、4B、8B

阿里巴巴推出通义千问3混合推理模型 开源部署成本低性能提升显著
AI妹 1 个月前 9 0

阿里巴巴正式推出新一代通義千問模型 Qwen3(千問3),並宣佈其開源。阿里雲表示,千問3是國內首個 “混合推理模型”,同時集成了 “快思考” 與 “慢思考” 的能力。相比於 DeepSeek-R

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 1 个月前 12 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密

阿里Qwen3:通义千问最新开源大模型 混合推理多模態赋能全场景
AI妹 1 个月前 9 0

Qwen3是什麼? 阿里Qwen3是通義千問系列的最新一代開源大語言模型(LLM),於2025年4月29日正式發佈。作爲全球首個支持“混合推理”的模型,Qwen3包含8款不同規模的模型,涵蓋稠密

阿里Qwen3-235B-A22B模型HuggingChat上线 技术突破赋能开源AI生态
AI妹 1 个月前 9 0

由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A

通义灵码编程智能体支持Qwen3 新功能助力开发者编码效率提升
AI妹 1 个月前 9 0

通义灵码团队宣布其编程智能体全面支持Qwen3,并上线了全新的编程智能体功能。这一智能体具备自主决策、环境感知和工具使用等能力,能够根据开发者的诉求,使用工程检索、文件编辑、终端等工具,端到端地完

阿里巴巴开源通义万相Wan2.2 视频生成模型携MoE架构等多维度突破
AI妹 1 个月前 9 0

阿里巴巴今晚正式開源視頻生成模型"通義萬相Wan2.2",此次發佈包含三款核心模型:文生視頻(Wan2.2-T2V-A14B)、圖生視頻(Wan2.2-I2V-A14B)和統一視頻生成(Wan2.

阿里巴巴开源通义万相Wan2.2 视频生成模型创新架构与电影级美学控制
AI妹 1 个月前 10 0

阿里巴巴今晚正式开源视频生成模型"通义万相Wan2.2",此次发布包含三款核心模型:文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.