关闭导航

包含标签"多模态模型"的内容

字节跳动Vidi多模态模型:精准时间检索 超长视频性能超GPT-4o等主流模型
AI妹 1 个月前 8 0

字節跳動宣佈推出全新多模態模型Vidi,專注於視頻理解與編輯,首版核心能力爲精準的時間檢索功能。據AIbase瞭解,Vidi能夠處理視覺、音頻和文本輸入,支持長達一小時的超長視頻分析,在時間檢索任

字节跳动Vidi多模态模型:长视频时间检索性能超越GPT-4o与Gemini等主流模型
AI妹 1 个月前 11 0

バイトダンスは、ビデオの理解と編集に特化した新しいマルチモーダルモデル「Vidi」を発表しました。最初の主要機能は、正確な時間検索機能です。AIbaseの情報によると、Vidiは視覚、音声、テキス

字节跳动Vidi多模态模型:视频时间检索性能超GPT-4o
AI妹 1 个月前 10 0

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任

OpenAI开放gpt-image-1图像生成API 首周7亿图引百万用户成本低至2美分
AI妹 1 个月前 13 0

OpenAI 在近日宣佈,已將其最新的圖像生成功能通過 API 開放給開發者,使其能夠將這一先進的技術集成到各種應用和服務中。這一消息無疑爲開發者們提供了一個新的機遇,特別是在圖像處理和創作領域。

火山引擎新豆包1.5深度思考模型上线边缘大模型网关 提供500万tokens免费
AI妹 1 个月前 11 0

4月25日,字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。 豆包

Perplexity AI正式集成WhatsApp 推出实时搜索与原生图像生成核心功能
AI妹 1 个月前 11 0

Perplexity AI宣佈正式集成WhatsApp平臺,爲用戶帶來實時搜索、來源引證與原生圖像生成等強大功能。據AIbase瞭解,這一更新允許用戶在WhatsApp聊天中直接調用AI助手,獲取

Moonshot AI开源Kimi-VL多模态模型 高效能处理长文档与多任务
AI妹 1 个月前 10 0

中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长

PPIO发布国内首个Agentic AI基础设施平台及兼容E2B的Agent沙箱
AI妹 1 个月前 9 0

在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC)上,独立分布式云计算服务商PPIO重磅发布国内首个Agentic AI基础设施服务平台,标志着智能体应用开发迎来全新发展阶段。

阿里Qwen2.5-Omni-3B:显存减半 实时音视频 多模态强
AI妹 1 个月前 10 0

在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志

阿里Qwen2.5-Omni-3B多模态模型:显存减半 支持实时音视频交互
AI妹 1 个月前 10 0

在開源大模型的競爭中,阿里巴巴推出了其最新的多模態模型 Qwen2.5-Omni-3B。這款模型的顯著特點是顯存使用減少了50%,在同等處理能力下,更加適合普通消費者的 GPU 設備。這一創新標誌