关闭导航

包含标签"多模态处理能力"的内容

LPM1.0模型发布 实时生成多模态交互人物视频促AI交互新升级
AI妹 1 天前 0 0

近日,研究人员正式发布LPM1.0模型,该研究项目旨在通过单张参考图像实时生成涵盖说话、聆听及唱歌行为的人物视频。LPM1.0的核心突破在于其多模态处理能力,能同步整合文本、音频与图像输入,生成具

阶跃星辰发布Step3.5 Flash系列模型 极速响应低推理成本助力AI规模化落地
AI妹 13 天前 0 0

近日,国内 AI 大模型领军企业阶跃星辰(Stepfun)正式发布了全新的 Step 3.5 Flash 系列模型。这一动作标志着国产大模型在追求超高性能的同时,正向着更极速的响应和更低的推理成本

谷歌Flow视频工具开放给Workspace商务等用户 新增竖屏支持集成图像生成器
AI妹 2 个月前 10 0

谷歌近日宣布正式扩大其人工智能视频制作工具 Flow 的访问权限。这款自去年5月推出以来一直仅限 AI Pro 和 AI Ultra 订阅用户使用的工具,现已全面向拥有 商务、企业及教育版 Wor

腾讯开源WeKnora:LLM驱动多模态文档理解检索助力信息精准提取高效整合
AI妹 3 个月前 15 0

在信息爆炸的時代,處理複雜的文檔資料一直是企業和研究者面臨的挑戰。現在,騰訊開源了一款基於大型語言模型(LLM)的全新文檔理解與檢索工具 WeKnora,旨在幫助用戶高效地從 PDF、Word、圖

腾讯开源WeKnora:多模态文档理解检索工具助力高效信息处理
AI妹 3 个月前 15 0

在信息爆炸的时代,处理复杂的文档资料一直是企业和研究者面临的挑战。现在,腾讯开源了一款基于大型语言模型(LLM)的全新文档理解与检索工具 WeKnora,旨在帮助用户高效地从 PDF、Word、图