关闭导航

包含标签"多模态大语言模型"的内容

字节跳动联合港大、华科推出UniTok视觉分词器 赋能多模态与视觉任务
AI妹 3 个月前 11 0

近日,字节跳动联合香港大学和华中科技大学共同推出了全新的视觉分词器 UniTok。这款工具不仅能在视觉生成和理解任务中发挥作用,还在技术上进行了重要创新,解决了传统分词器在细节捕捉与语义理解之间的

字节跳动清华联合发布ChatTS时序多模大模型 成果获VLDB2025接受
AI妹 3 个月前 11 0

在多模態大語言模型(MLLM)迅速發展的浪潮中,字節跳動與清華大學近日聯合發佈了名爲 ChatTS 的新型時序多模態大模型。ChatTS 的推出不僅爲時序數據的處理與推理注入了新活力,也填補了當前

字节跳动与清华联合发布ChatTS时序多模态大模型填补领域空白
AI妹 3 个月前 15 0

在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前

Meta携手港中文推出Multi-SpatialMLLM模型 大幅提升空间理解能力
AI妹 3 个月前 11 0

科技巨頭 Meta 與香港中文大學的研究團隊聯合推出了 Multi-SpatialMLLM 模型,這一新框架在多模態大語言模型(MLLMs)的發展中取得了顯著進展,尤其是在空間理解方面。該模型通過

苹果与哥大开发SceneScout系统 助力盲人街景导航 结合多模态模型效果良好
AI妹 3 个月前 11 0

近日,苹果公司与哥伦比亚大学的研究团队共同开发了一款名为 SceneScout 的人工智能原型系统。这一系统旨在为盲人及低视力群体(BLV)提供街景导航的辅助功能,帮助他们更好地进行日常出行。

苹果与哥伦比亚大学开发SceneScout系统助力视障者导航
AI妹 3 个月前 13 0

最近、アップル社とコロンビア大学の研究チームは、SceneScoutという名前の人工知能プロトタイプシステムを開発しました。このシステムは視覚障害者や低視力者(BLV)向けに街並みのナビゲーション

苹果与哥大开发SceneScout AI原型系统,辅助盲人低视群体街景导航。
AI妹 3 个月前 14 0

近日,蘋果公司與哥倫比亞大學的研究團隊共同開發了一款名爲 SceneScout 的人工智能原型系統。這一系統旨在爲盲人及低視力羣體(BLV)提供街景導航的輔助功能,幫助他們更好地進行日常出行。

阿里巴巴推出HumanOmniV2多模态模型 强化全局上下文理解与推理能力
AI妹 3 个月前 14 0

阿里巴巴集团近期正式推出其最新多模态大语言模型HumanOmniV2,在AI领域再掀波澜。这款模型以其强大的全局上下文理解能力和多模态推理能力,标志着阿里巴巴在人工智能技术的又一次重大突破。

阿里巴巴HumanOmniV2多模态大模型:全局推理突破,重塑AI应用新边界
AI妹 3 个月前 14 0

阿里巴巴集團近期正式推出其最新多模態大語言模型HumanOmniV2,在AI領域再掀波瀾。這款模型以其強大的全局上下文理解能力和多模態推理能力,標誌着阿里巴巴在人工智能技術的又一次重大突破。

阿里语音AI开源ThinkSound 全球首个支持链式推理的音频生成模型
AI妹 3 个月前 13 0

近日,阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound,该模型通过引入思维链(Chain-of-Thought)技术,突破传统视频转音频技术对画面动态捕捉的局限,实现