关闭导航

包含标签"视频理解"的内容

OpenAI推出GPT-4.1系列新模型 性能提升成本优化且API专用
AI妹 1 个月前 9 0

人工知能分野の競争が激化する中、OpenAIが技術革新で再び業界をリードしています。AIbaseがソーシャルメディアから得た情報によると、OpenAIは最近、APIを通じてGPT-4.1、GPT-

字节跳动Vidi多模态模型:精准时间检索 超长视频性能超GPT-4o等主流模型
AI妹 1 个月前 7 0

字節跳動宣佈推出全新多模態模型Vidi,專注於視頻理解與編輯,首版核心能力爲精準的時間檢索功能。據AIbase瞭解,Vidi能夠處理視覺、音頻和文本輸入,支持長達一小時的超長視頻分析,在時間檢索任

字节跳动Vidi多模态模型:视频时间检索性能超GPT-4o
AI妹 1 个月前 9 0

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任

Google推出Gemini2.5Pro Preview I/O版 提升编码及视频理解能力
AI妹 1 个月前 10 0

近日,Google 宣佈推出其最新的 AI 模型 ——Gemini2.5Pro Preview(I/O 版)。這一升級版是在即將召開的 Google I/O2025開發者大會前發佈的,標誌着公司在

Google推出Gemini2.5Pro Preview 性能升级助力开发者提升竞争力
AI妹 1 个月前 7 0

近日,Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview(I/O 版)。这一升级版是在即将召开的 Google I/O2025开发者大会前发布的,标志着公司在

阿里南开联合发布LLaVA-Scissor 革新视频大模型压缩技术获佳绩
AI妹 1 个月前 7 0

最近、アリババ・テンユンラボと南開大学コンピューターサイエンス学部は、革新的な動画大規模モデル圧縮方法であるLLaVA-Scissorを共同で公開しました。この技術は、動画モデル処理における一連の

阿里南開聯合研發LLaVA-Scissor 高效壓縮視頻大模型token並提升性能
AI妹 1 个月前 8 0

近日,阿里巴巴通義實驗室與南開大學計算機科學學院聯合發佈了一種創新的視頻大模型壓縮方法 ——LLaVA-Scissor。這一技術的出現旨在應對視頻模型處理中的一系列挑戰,特別是傳統方法在處理視頻幀

字节跳动Seed1.5-VL多模态模型发布 性能对标Gemini2.5Pro仍存课题
AI妹 1 个月前 8 0

今日ますます激化する人工知能分野において、字節跳動の Seed チームは5月13日に正式に、最新のマルチモーダル大規模モデル「Seed1.5-VL」を発表しました。このモデルは、知能エージェント技

字节跳动发布Seed1.5-VL多模态大模型 性能优异开放API供用户体验
AI妹 1 个月前 7 0

在人工智能領域競爭日益激烈的今天,字節跳動的 Seed 團隊於5月13日正式發佈了其最新的多模態大模型 Seed1.5-VL,旨在爲智能體技術的進步鋪平道路。該模型經過超過3萬億 tokens 的

字节跳动发布Seed1.5-VL视觉语言多模态模型 高性能低成本开放API优势显著
AI妹 1 个月前 8 0

在上海举办的火山引擎 FORCE LINK AI 创新巡展上,字节跳动正式发布了最新的视觉 - 语言多模态模型 ——Seed1.5-VL。该模型凭借其出色的通用多模态理解和推理能力,成为此次活动的