多模态融合 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"多模态融合"的内容

长安汽车天枢大模型通过国家级备案成重庆首家智能网联合规车企

长安汽车天枢大模型通过国家级备案成重庆首家智能网联合规车企

AI妹 5 天前 1 0

国内智能网联汽车的底层算法竞争正加速进入合规化落地的新阶段。6月4日，长安汽车官方宣布，其全栈自研的“长安天枢大模型”已正式通过国家网信办的“生成式人工智能服务”备案审批。这使得长安汽车成为重庆首

规模化量产逻辑推理多模态融合端侧感知意图理解

查看详情

中美大模型差距收窄国产AI商业化推进港股通互联网ETF成新宠

中美大模型差距收窄国产AI商业化推进港股通互联网ETF成新宠

AI妹 3 个月前 5 0

中美差距收窄，国产大模型开启“商业化博弈” 根据浦银国际最新研报显示，中美在大模型综合水平上的差距已显著压缩至 3 到 6 个月。国内厂商正正式告别单纯的“参数竞赛”，转向极致的效率优化与多

京东云海AI存储系统智谱AI AI原生内容平台 ToC市场 AI辅助创作工具

查看详情

百度文心Moment大会发布文心5.0 2.4万亿参数原生全模态助行业落地

百度文心Moment大会发布文心5.0 2.4万亿参数原生全模态助行业落地

AI妹 4 个月前 15 0

在今日举办的百度文心Moment大会上，百度正式发布了备受瞩目的文心大模型5.0正式版。这款拥有2.4万亿超大规模参数的“巨兽”，标志着百度在人工智能领域完成了从多模态融合向“原生全模

代码编写 2.4万亿参数自回归架构原生全模态统一建模技术多模态融合

查看详情

CES2026英伟达黄仁勋发布Vera Rubin芯片力推开源及四大AI领域

CES2026英伟达黄仁勋发布Vera Rubin芯片力推开源及四大AI领域

AI妹 5 个月前 14 0

在今日举办的 CES 2026 国际消费电子展上，英伟达（NVIDIA）CEO 黄仁勋不仅带来了性能强劲的 Vera Rubin 芯片，更凭借对全球 AI 格局的深度洞察引发行业震动。

语言 Vera Rubin芯片 DeepSeek-R1 自动驾驶英伟达

查看详情

Midjourney Omni-Reference全向参考新功能：多元素精准控制创作新突破

（注：标题紧扣核心主体Midjourney、功能名Omni-Reference全向参考、核心优势多元素精准控制，字数符合30字左右要求）

Midjourney Omni-Reference全向参考新功能：多元素精准控制创作新突破（注：标题紧扣核心主体Midjourney、功能名Omni-Reference全向参考、核心优势多元素精准控制，字数符合30字左右要求）

AI妹 5 个月前 20 0

在图像生成领域，Midjourney 近期推出了一项名为 “Omni-Reference”（全向参考）的新功能，为用户带来了更大的创作自由。这一全新图像引用系统不仅是 V6版本中 “角色参考” 功

CLIP-ViT 图像生成一致性教学体验 Midjourney Omni-Reference 共享参考模板

查看详情

谷歌Gemma3n：低资源设备多模态AI模型，引领移动端智能新趋势

谷歌Gemma3n：低资源设备多模态AI模型，引领移动端智能新趋势

AI妹 5 个月前 16 0

谷歌在I/O2025大会上正式揭晓Gemma3n，一款专为低资源设备设计的多模态AI模型，仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。Gemma3n继承了Gemini Nano的架构

多模态AI模型低资源设备移动端AI Hugging Face 多模态融合

查看详情

谷歌Gemma3n：2GB RAM低资源设备多模态移动AI技术新突破

谷歌Gemma3n：2GB RAM低资源设备多模态移动AI技术新突破

AI妹 5 个月前 18 0

At the I/O 2025 conference, Google officially unveiled Gemma3n, a multi-modal AI model designed sp

知识蒸馏无障碍技术 Google 里程碑设备端运行

查看详情

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命

AI妹 5 个月前 18 0

2025年7月，阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound，为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入，生成高保真的音效与音景，完美适配画面

高精度同步 ModelScope ThinkSound 影视后期制作游戏音效设计

查看详情

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命

AI妹 5 个月前 16 0

2025年7月，阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound，爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入，生成高保真的音效與音景，完美適配畫面

GitHub AI音效师链式推理（CoT）游戏开发自然语言处理

查看详情

Medeo AI新版亮相：颠覆性视频Agent工具支持迭代编辑与自然语言修改

Medeo AI新版亮相：颠覆性视频Agent工具支持迭代编辑与自然语言修改

AI妹 5 个月前 31 0

AI视频生成领域迎来颠覆性突破!Medeo AI最新版本正式亮相，这一真正意义上的视频Agent工具彻底摆脱了传统AI的桎梏，不再局限于一次性生成或单一风格，而是支持复杂提示词和自然语言实时修改。

文本+图像复杂提示词 AIbase分析师内测阶段自然语言实时修改

查看详情



资讯姬

文章数量13552

总阅读量241.718k

总评论量0

会员数量2

本站由emlog驱动