芯片巨头英伟达周一在加州圣地亚哥举行的 NeurIPS 人工智能大会上宣布了新的基础设施和人工智能模型,此举旨在加速构建物理人工智能(Physical AI)的基础技术,该领域包括能够感知现实世界
12月1日 — 中国人工智能初创公司深度求索(DeepSeek AI)发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Sp
DeepSeek今日正式发布 DeepSeek-Math-V2,这款6850亿参数的混合专家(MoE)模型成为全球首个以开源形式达到国际数学奥林匹克(IMO)金牌水平的数学推理大模型。该模型基于
Meta AI 实验室今日在 Hugging Face 平台上推出了一款创新型大模型,专为验证和优化链式思维(Chain-of-Thought, CoT)推理而设计。该模型名为“CoT-Verif
11月27日,DeepSeek 团队在 Hugging Face 扔出236B 参数巨兽——DeepSeek-Math-V2,采用 MoE 架构,活跃参数仅21B,上下文一口气拉到128K tok
昨晚,一张1024×1024的霓虹汉服大片在RTX4090上只用2.3秒就渲完,显存指针稳稳停在13GB——阿里通义实验室丢出的Z-Image-Turbo让围观群众瞬间安静:参数只有6B,却把20
阿里巴巴通义实验室近日重磅开源全新图像生成模型 Z-Image,该模型凭借仅 6B 的参数规模,实现了高效的图像生成与编辑,其视觉质量已接近国际领先商业模型的三倍参数级别(约20B)。Z-Imag
新加坡人工智能计划AISG发布新一代大语言模型Qwen-Sea-Lion-v4,底层由Meta Llama全面切换为阿里巴巴“通义千问”Qwen3-32B,并在东南亚语言综合评估基准(Sea-He
11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,
微软最近发布了 Fara-7B,这是一款拥有70亿参数的新型计算机使用智能助手(Computer Use Agent, CUA),旨在直接在用户的设备上执行复杂任务。Fara-7B 凭借其小巧的体