视频理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"视频理解"的内容

英伟达发布Nemotron3 Nano Omni多模态模型整合视音频图文效率高表现优异

英伟达发布Nemotron3 Nano Omni多模态模型整合视音频图文效率高表现优异

AI妹 1 个月前 2 0

英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”，这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中，旨在为用户提供更快速和智能的响应。根据英伟达的介绍，这款

六大权威排行榜英伟达 30B-A3B混合专家架构吞吐量音频理解

查看详情

英伟达推出Nemotron3Nano Omni新多模态大模型性能居六大权威榜首助力企业AI部署

英伟达推出Nemotron3Nano Omni新多模态大模型性能居六大权威榜首助力企业AI部署

AI妹 1 个月前 2 0

当地时间4月28日，英伟达正式推出其最新的开放式多模态大模型——Nemotron3Nano Omni。这款模型被定位为“全能选手”，通过高度整合视频、音频、图像和文本的深度推理能力，旨在为开发者提

Nemotron3Nano Omni 开源模型音频感知专有云模型企业级AI智能体

查看详情

OpenAI推出GPT-4.1系列新模型性能提升成本优化且API专用

OpenAI推出GPT-4.1系列新模型性能提升成本优化且API专用

AI妹 5 个月前 19 0

人工知能分野の競争が激化する中、OpenAIが技術革新で再び業界をリードしています。AIbaseがソーシャルメディアから得た情報によると、OpenAIは最近、APIを通じてGPT-4.1、GPT-

百万Token上下文窗口编码能力技术革新 GPT-4.1系列指示遵循能力

查看详情

字节跳动Vidi多模态模型：精准时间检索超长视频性能超GPT-4o等主流模型

字节跳动Vidi多模态模型：精准时间检索超长视频性能超GPT-4o等主流模型

AI妹 5 个月前 15 0

字節跳動宣佈推出全新多模態模型Vidi，專注於視頻理解與編輯，首版核心能力爲精準的時間檢索功能。據AIbase瞭解，Vidi能夠處理視覺、音頻和文本輸入，支持長達一小時的超長視頻分析，在時間檢索任

智能视频分析娱乐与推荐多模态模型 Gemini1.5Pro ByteScale分布式训练系统

查看详情

字节跳动Vidi多模态模型：视频时间检索性能超GPT-4o

字节跳动Vidi多模态模型：视频时间检索性能超GPT-4o

AI妹 5 个月前 17 0

字节跳动宣布推出全新多模态模型Vidi，专注于视频理解与编辑，首版核心能力为精准的时间检索功能。据AIbase了解，Vidi能够处理视觉、音频和文本输入，支持长达一小时的超长视频分析，在时间检索任

视频理解 ByteScale分布式训练系统高效编辑能力多模态模型 ActivityNet数据集

查看详情

Google推出Gemini2.5Pro Preview I/O版提升编码及视频理解能力

Google推出Gemini2.5Pro Preview I/O版提升编码及视频理解能力

AI妹 5 个月前 17 0

近日，Google 宣佈推出其最新的 AI 模型 ——Gemini2.5Pro Preview（I/O 版）。這一升級版是在即將召開的 Google I/O2025開發者大會前發佈的，標誌着公司在

Google I/O2025开发者大会 VideoMME xAI Gemini API 视频理解

查看详情

Google推出Gemini2.5Pro Preview 性能升级助力开发者提升竞争力

Google推出Gemini2.5Pro Preview 性能升级助力开发者提升竞争力

AI妹 5 个月前 17 0

近日，Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview（I/O 版）。这一升级版是在即将召开的 Google I/O2025开发者大会前发布的，标志着公司在

开发者支持 Vertex AI xAI Google I/O2025开发者大会 Gemini聊天机器人应用

查看详情

阿里南开联合发布LLaVA-Scissor 革新视频大模型压缩技术获佳绩

阿里南开联合发布LLaVA-Scissor 革新视频大模型压缩技术获佳绩

AI妹 5 个月前 17 0

最近、アリババ・テンユンラボと南開大学コンピューターサイエンス学部は、革新的な動画大規模モデル圧縮方法であるLLaVA-Scissorを共同で公開しました。この技術は、動画モデル処理における一連の

EgoSchema数据集 SCC手法阿里巴巴·天韵实验室视频问答视频大模型压缩

查看详情

阿里南開聯合研發LLaVA-Scissor 高效壓縮視頻大模型token並提升性能

阿里南開聯合研發LLaVA-Scissor 高效壓縮視頻大模型token並提升性能

AI妹 5 个月前 16 0

近日，阿里巴巴通義實驗室與南開大學計算機科學學院聯合發佈了一種創新的視頻大模型壓縮方法 ——LLaVA-Scissor。這一技術的出現旨在應對視頻模型處理中的一系列挑戰，特別是傳統方法在處理視頻幀

连通分量时间压缩 LLaVA-Scissor 相似性图视频大模型压缩

查看详情

字节跳动Seed1.5-VL多模态模型发布性能对标Gemini2.5Pro仍存课题

字节跳动Seed1.5-VL多模态模型发布性能对标Gemini2.5Pro仍存课题

AI妹 5 个月前 17 0

今日ますます激化する人工知能分野において、字節跳動の Seed チームは5月13日に正式に、最新のマルチモーダル大規模モデル「Seed1.5-VL」を発表しました。このモデルは、知能エージェント技

SOTA 视频理解 200亿参数多模态大模型 Seed1.5-VL

查看详情

1



资讯姬

文章数量13547

总阅读量240.562k

总评论量0

会员数量2

本站由emlog驱动