4月14日消息,英伟达(NVIDIA)正式宣布推出全球首个开源量子人工智能模型系列——“Ising(伊辛)”。该系列模型旨在攻克量子计算中最核心的工程瓶颈,协助研究人员与企业构建可运行实用程序的容
近日,小米下一代 Kaldi 团队(k2-fsa)正式开源 OmniVoice,这是一款支持超过600种语言的超大规模多语言零样本文本转语音(TTS)模型,在中英文及多语言基准测试中多项关键指标达
微软的 Bing 团队近日宣布开源其最新的词嵌入模型 “Harrier”。该模型在多语言 MTEB v2 基准测试中表现优异,支持超过 100 种语言,为用户提供了更为强大的语言处理能力。Ha
在最新发布的 GLM-5.1中,这一开源模型展示了其卓越的智能水平,能够在长达8小时的任务中独立工作,完成复杂的工程项目。与之前仅能进行短时间交互的模型相比,GLM-5.1在代码能力和长程任务执行
微软近日开源了名为VibeVoice的前沿语音 AI 模型家族,涵盖自动语音识别(ASR)和文本转语音(TTS)等多项能力。该项目以其强大的长音频处理、多说话人自然对话生成以及实时低延迟特性,迅速
艾伦人工智能研究所(AI2)近日发布了突破性的全开源网络代理 MolmoWeb 。与传统依赖网页底层代码(DOM)的代理不同,MolmoWeb 仅通过读取屏幕截图进行决策,
2026年3月24日,美团龙猫(LongCat)团队正式开源专门用于数学形式化与定理证明的深度学习模型——LongCat-Flash-Prover。该模型针对大语言模型在严密逻辑推演中的短板,通过
在大模型向垂直专业领域进军的征途中, 美团 刚刚交出了一份令学术界与工业界瞩目的答卷。 3月21日, 美团 正式开源了名为 LongCat-Fla
在 2026 年 GTC 大会上,英伟达宣布大幅扩展其开源模型家族,旨在全面加速智能体、物理 AI 及医疗领域的创新。本次发布的核心是 Nemotron 3 系列全理解多模态模型,其中 Nemot
Hume AI近日开源发布了其最新语音生成模型TADA(Text-Acoustic Dual Alignment),这是一款基于大语言模型的文本转语音(TTS)系统,采用创新的文本-声学双对齐架构