字節跳動宣佈推出全新多模態模型Vidi,專注於視頻理解與編輯,首版核心能力爲精準的時間檢索功能。據AIbase瞭解,Vidi能夠處理視覺、音頻和文本輸入,支持長達一小時的超長視頻分析,在時間檢索任
バイトダンスは、ビデオの理解と編集に特化した新しいマルチモーダルモデル「Vidi」を発表しました。最初の主要機能は、正確な時間検索機能です。AIbaseの情報によると、Vidiは視覚、音声、テキス
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任
OpenAI 在近日宣佈,已將其最新的圖像生成功能通過 API 開放給開發者,使其能夠將這一先進的技術集成到各種應用和服務中。這一消息無疑爲開發者們提供了一個新的機遇,特別是在圖像處理和創作領域。
4月25日,字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。 豆包
Perplexity AI宣佈正式集成WhatsApp平臺,爲用戶帶來實時搜索、來源引證與原生圖像生成等強大功能。據AIbase瞭解,這一更新允許用戶在WhatsApp聊天中直接調用AI助手,獲取
中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长
在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC)上,独立分布式云计算服务商PPIO重磅发布国内首个Agentic AI基础设施服务平台,标志着智能体应用开发迎来全新发展阶段。
在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志
在開源大模型的競爭中,阿里巴巴推出了其最新的多模態模型 Qwen2.5-Omni-3B。這款模型的顯著特點是顯存使用減少了50%,在同等處理能力下,更加適合普通消費者的 GPU 設備。這一創新標誌
emlog2 个月前
发表在:欢迎使用emlog这是系统生成的演示评论