多模态处理能力 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"多模态处理能力"的内容

GodeX网关v1.1.0发布适配国产多模态模型与联网搜索还原

GodeX网关v1.1.0发布适配国产多模态模型与联网搜索还原

AI妹 8 天前 2 0

在人工智能应用开发中，不同大模型服务商之间迥异的API协议往往让开发者苦不堪言。为了彻底解决这一痛点，开源OpenAI Responses API网关项目 GodeX

知识检索应用 AI Agent MiniMax-M3 编程工具结构化Responses输出

查看详情

腾讯阿里竞投DeepSeek估值翻倍混元3.0本周发布国产大模型竞争转向多模态

腾讯阿里竞投DeepSeek估值翻倍混元3.0本周发布国产大模型竞争转向多模态

AI妹 1 个月前 2 0

据4月22日行业消息，腾讯与阿里巴巴正寻求参与国产大模型新锐DeepSeek的新一轮融资，受此大厂竞逐驱动，DeepSeek的估值目标已从数日前的100亿美元飙升至超过200亿美元。此前在4月

多模态处理能力阿里巴巴国产大模型混元（Hunyuan）轻量化设计

查看详情

谷歌确认成苹果首选云服务商双方基于Gemini开发新机及2026全新Siri

谷歌确认成苹果首选云服务商双方基于Gemini开发新机及2026全新Siri

AI妹 1 个月前 3 0

在近期举行的Google Cloud Next26大会上，谷歌官方正式确认苹果已选定其为首选云服务提供商，双方正基于Gemini模型共同开发下一代Apple Foundation机型。这意味着备受

Siri Gemini模型私有云计算架构谷歌 AI智能体

查看详情

LPM1.0模型发布实时生成多模态交互人物视频促AI交互新升级

LPM1.0模型发布实时生成多模态交互人物视频促AI交互新升级

AI妹 1 个月前 4 0

近日，研究人员正式发布LPM1.0模型，该研究项目旨在通过单张参考图像实时生成涵盖说话、聆听及唱歌行为的人物视频。LPM1.0的核心突破在于其多模态处理能力，能同步整合文本、音频与图像输入，生成具

播客深度伪造风险离线音频驱动视频生成流式传输技术唇形同步

查看详情

阶跃星辰发布Step3.5 Flash系列模型极速响应低推理成本助力AI规模化落地

阶跃星辰发布Step3.5 Flash系列模型极速响应低推理成本助力AI规模化落地

AI妹 2 个月前 3 0

近日，国内 AI 大模型领军企业阶跃星辰（Stepfun）正式发布了全新的 Step 3.5 Flash 系列模型。这一动作标志着国产大模型在追求超高性能的同时，正向着更极速的响应和更低的推理成本

阶跃星辰多模态处理能力视觉理解高频交互场景智能客服

查看详情

谷歌Flow视频工具开放给Workspace商务等用户新增竖屏支持集成图像生成器

谷歌Flow视频工具开放给Workspace商务等用户新增竖屏支持集成图像生成器

AI妹 4 个月前 14 0

谷歌近日宣布正式扩大其人工智能视频制作工具 Flow 的访问权限。这款自去年5月推出以来一直仅限 AI Pro 和 AI Ultra 订阅用户使用的工具，现已全面向拥有商务、企业及教育版 Wor

Nano Banana Pro AI Ultra AI绘图视觉起点竖屏视频

查看详情

腾讯开源WeKnora：LLM驱动多模态文档理解检索助力信息精准提取高效整合

腾讯开源WeKnora：LLM驱动多模态文档理解检索助力信息精准提取高效整合

AI妹 5 个月前 18 0

在信息爆炸的時代，處理複雜的文檔資料一直是企業和研究者面臨的挑戰。現在，騰訊開源了一款基於大型語言模型（LLM）的全新文檔理解與檢索工具 WeKnora，旨在幫助用戶高效地從 PDF、Word、圖

统一语义视图模块化架构科研文献分析助手结构化内容提取 WeKnora

查看详情

腾讯开源WeKnora：多模态文档理解检索工具助力高效信息处理

腾讯开源WeKnora：多模态文档理解检索工具助力高效信息处理

AI妹 5 个月前 18 0

在信息爆炸的时代，处理复杂的文档资料一直是企业和研究者面临的挑战。现在，腾讯开源了一款基于大型语言模型（LLM）的全新文档理解与检索工具 WeKnora，旨在帮助用户高效地从 PDF、Word、图

文档解析 WeKnora 知识图谱 LLM 医疗知识助手

查看详情



资讯姬

文章数量13535

总阅读量233.893k

总评论量0

会员数量2

本站由emlog驱动