在人工智能的持续发展中,最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本,具有4.1亿参数,基于 SigLIP2-400M 和 MiniCPM4
近日,中山大學、鵬城實驗室與美團聯合發佈了一項名爲 X-SAM 的新型圖像分割多模態大模型,標誌着圖像分割技術的一次重要進步。該模型的出現,不僅提高了圖像分割的精度,還實現了從 “分割萬物” 到
人工智能正在突破視頻理解的最後邊界。當前市面上的AI工具雖然能夠分析單個視頻並生成摘要,但面對數千小時的多視頻內容時卻顯得力不從心。這個技術瓶頸正困擾着安防公司和營銷企業,前者需要AI篩查海量監控
字节跳动刚刚发布了其最新的多模态大语言模型 Vidi2,一个拥有120亿参数、专用于视频理解的AI模型。该模型能够处理数小时长的原始素材,理解其中的故事脉络,并根据简单提示生成完整的TikTok短
在2025世界计算大会上,昆仑元 AI 正式发布了基于昇腾(Ascend)平台的全模态融合模型 BaiZe-Omni-14b-a2b。这一新模型具备强大的文本、音频、图像和视频理解与生成能力,采用
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论