在人工智能竞争白热化的当下,国产大模型再次交出了一份惊艳的答卷。5月9日,百度正式推出了新一代基础大模型——文心大模型5.1。目前,该模型已全面上线百度千帆模型广场及文心一言官网,正式面向企业级用
在国内大模型与算力底座协同发展的关键期,国产算力平台与顶尖算法模型的“强强联手”再次传来捷报。近日, 海光信息 正式宣布,旗下深算3号DCU已顺利完成与腾讯混元H
字节跳动旗下火山引擎于5月6日宣布,豆包大模型家族正式迎来首款全模态理解模型——Doubao-Seed-2.0-lite。作为该系列的重磅升级版本,新模型彻底打破了单一模态的限制,实现了视频、图像
寒武纪公司宣布,他们已成功完成对深度求索公司最新开源 AI 模型 DeepSeek-V4 的 Day 0 适配。此举意味着该模型在发布当天即可实现稳定运行,为用户带来了更高效的人工智能体验。寒武纪
北京时间4月24日,DeepSeek 正式推出新一代大模型 DeepSeek-V4,其整体性能已达到比肩当前顶级闭源模型的水平,成为开源 AI 领域又一里程碑式产品。 超长100万上下文窗口
4月23日,腾讯混元 Hy3preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K 上下文长度。这是混元重建后训练的第一个模型,也
通义灵码团队宣布正式上线Qwen3,并开源了8款「混合推理模型」,这标志着编程智能体的进一步发展。此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、220多亿激活参数
通義靈碼團隊宣佈正式上線Qwen3,並開源了8款「混合推理模型」,這標誌着編程智能體的進一步發展。此次開源包括兩款MoE模型:Qwen3-235B-A22B(2350多億總參數、220多億激活參數
Qwen3-30B-A3B模型迎来了重大更新,推出了新版本Qwen3-30B-A3B-Thinking-2507。这一新版本在推理能力、通用能力及上下文长度上实现了显著提升,标志着该模型不仅更加轻
Qwen3-Coder系列迎来了新成员——Qwen3-Coder-Flash,这款被开发者亲切称为“甜品级”的编程模型以其卓越的性能和高效的运行速度,为编程领域带来了新的惊喜。 Qwen3-Co