近日,AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下,显著榨取硬件潜能,为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1
在腾讯最新的人才引进和组织架构调整之后,4 月 23 日,腾讯正式发布并开源了其全新 AI 大模型 —— 混元 Hy3 preview。这一模型被称为 “混元重建后训练的第一个模型”,也是迄今为止
4月23日,腾讯混元 Hy3preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K 上下文长度。这是混元重建后训练的第一个模型,也
在 Cloud Next '26 大会上,谷歌正式发布了一系列旨在构建“代理企业(The Agentic Enterprise)”的核心基础设施。此次更新涵盖了从
谷歌近日正式发布了 Gemma4系列的开源模型,标志着人工智能领域的一次重大进步。这些模型的特别之处在于,某一款仅需激活3.8亿个参数,便能在权威榜单上超越体量是其20倍的其他大型模型。这意味着,
传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”,每次遇到相同的模式都需要重新计算,这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈,DeepSeek 的研究团队近日推出
阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R
4月29日,通義App與通義網頁版(tongyi.com)全面上線阿里新一代通義千問開源模型Qwen3(簡稱千問3)。用戶可以第一時間在通義App和網頁版中的專屬智能體“千問大模型”,以及主對話頁
Ollama官方宣佈已全面支持阿里巴巴通義千問最新一代大語言模型系列——Qwen3。這一重要更新進一步豐富了Ollama的開源模型生態,爲開發者、企業及AI愛好者提供了更強大的本地化部署選擇,顯著
Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密