全球开源大模型生态迎来架构层面的颠覆性突破。谷歌于6月3日正式发布了全新统一多模态模型 Gemma412B 。该模型最大的创新在于彻底取消了传统多模态模型必不可少
5月11日,面壁智能联合清华大学及 OpenBMB 开源社区,正式发布新一代端侧多模态大模型 MiniCPM-V4.6。这款仅拥有1.3B 参数的“轻量级”模型,凭借极致的智能密度与跨平台适配能力
5月18日,腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学,正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准
近日,AMD 正式发布了名为 vLLM-ATOM 的全新插件。这款工具的核心使命是在维持现有工作流不变的前提下,显著榨取硬件潜能,为 DeepSeek-R1、Kimi-K2以及 gpt-oss-1
3月26日消息,谷歌研究团队(Google Research)近日正式推出全新向量量化压缩算法TurboQuant,通过创新的 PolarQuant 与 QJL 技术,将大语言模型(LLM)推理过
IBM 近日正式推出了 Granite4.01B Speech。这是一款专为边缘计算和企业级部署设计的紧凑型语音语言模型,旨在提供高效率的多语种自动语音识别(ASR)与双向自动语音翻译(AST)能
继学术界孵化出多个现象级 AI 引擎后,开源推理框架 vLLM 的核心成员正式宣布成立初创公司 Inferact。该公司以 8亿美元的投前估值,成功完成了高达 1.5亿美元的种子轮融资
在2026年CES展会上,全球知名游戏与高性能硬件品牌雷蛇(Razer),正式进军AI开发者硬件市场。新产品线聚焦本地大模型(LLM),旨在为开发者、研究人员及中小企业提供高性能、高灵活性的AI基
12月22日,北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7,在全球大模型竞争中再掀波澜,为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓
最近,DeepSeek 宣布了一项重要决定:将其自研的推理引擎进行开源,但并不会直接向公众开放完整的代码库。相反,他们选择与现有的开源项目 vLLM 合作,致力于分享核心的优化成果。这一举动旨在解