关闭导航

包含标签"视觉与音频编码器"的内容

英伟达发布Nemotron3 Nano Omni多模态模型 整合视音频图文效率高表现优异
AI妹 1 个月前 1 0

英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”,这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中,旨在为用户提供更快速和智能的响应。根据英伟达的介绍,这款

英伟达推出Nemotron3Nano Omni新多模态大模型 性能居六大权威榜首助力企业AI部署
AI妹 1 个月前 2 0

当地时间4月28日,英伟达正式推出其最新的开放式多模态大模型——Nemotron3Nano Omni。这款模型被定位为“全能选手”,通过高度整合视频、音频、图像和文本的深度推理能力,旨在为开发者提

韩国大模型竞赛陷争议 入围企业用中美开源代码引自主化质疑
AI妹 4 个月前 16 0

据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、O