关闭导航

包含标签"多模态融合"的内容

CES2026英伟达黄仁勋发布Vera Rubin芯片 力推开源及四大AI领域
AI妹 14 天前 8 0

在今日举办的 CES 2026 国际消费电子展上,英伟达(NVIDIA)CEO 黄仁勋不仅带来了性能强劲的 Vera Rubin 芯片,更凭借对全球 AI 格局的深度洞察引发行业震动。

Midjourney Omni-Reference全向参考新功能:多元素精准控制创作新突破

(注:标题紧扣核心主体Midjourney、功能名Omni-Reference全向参考、核心优势多元素精准控制,字数符合30字左右要求)
AI妹 1 个月前 9 0

在图像生成领域,Midjourney 近期推出了一项名为 “Omni-Reference”(全向参考)的新功能,为用户带来了更大的创作自由。这一全新图像引用系统不仅是 V6版本中 “角色参考” 功

谷歌Gemma3n:低资源设备多模态AI模型,引领移动端智能新趋势
AI妹 1 个月前 10 0

谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。Gemma3n继承了Gemini Nano的架构

谷歌Gemma3n:2GB RAM低资源设备多模态移动AI技术新突破
AI妹 1 个月前 9 0

At the I/O 2025 conference, Google officially unveiled Gemma3n, a multi-modal AI model designed sp

阿里巴巴通义实验室开源ThinkSound 多模态音频模型赋能音效创作新革命
AI妹 1 个月前 11 0

2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命
AI妹 1 个月前 11 0

2025年7月,阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound,爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入,生成高保真的音效與音景,完美適配畫面

Medeo AI新版亮相:颠覆性视频Agent工具支持迭代编辑与自然语言修改
AI妹 1 个月前 20 0

AI视频生成领域迎来颠覆性突破!Medeo AI最新版本正式亮相,这一真正意义上的视频Agent工具彻底摆脱了传统AI的桎梏,不再局限于一次性生成或单一风格,而是支持复杂提示词和自然语言实时修改。