关闭导航

包含标签"多模态理解"的内容

MMaDA多模态大模型三大核心创新助力性能全面超越主流AI模型表现卓越
AI妹 1 个月前 8 0

最近,普林斯顿大学、字节跳动、清华大学和北京大学联手搞了个大事情,推出了一款名为 MMaDA 的多模态大模型! 这可不是普通的 AI,它号称能让 AI 拥有“深度思考”的能力,还能在文本、图像、甚

MMaDA多模态大模型:统一架构+三大黑科技,超越GPT-4等主流模型
AI妹 1 个月前 9 0

最近,普林斯頓大學、字節跳動、清華大學和北京大學聯手搞了個大事情,推出了一款名爲 MMaDA 的多模態大模型! 這可不是普通的 AI,它號稱能讓 AI 擁有“深度思考”的能力,還能在文本、圖像、甚

MMaDA多模态大模型:三大黑科技赋能深思考 性能超越GPT-4等
AI妹 1 个月前 9 0

最近、プリンストン大学、字節跳動、清華大学、北京大学が協力して、多モーダル大規模モデルの「MMaDA」を発表しました!これは普通のAIではありません。このAIは「深い思考」を行う能力があり、テキス

vivo发布BlueLM-2.5-3B边缘侧多模态模型 高效且GUI理解能力优异
AI妹 1 个月前 8 0

最近、vivo AI Labは最新のエッジ側マルチモーダルモデルであるBlueLM-2.5-3Bを発表しました。このモデルはコンパクトで効率的であり、グラフィカルユーザーインターフェース(GUI)

谷歌Gemini2.5Flash-Lite稳定版正式发布 速度快成本低定价优势显著
AI妹 1 个月前 12 0

近日,谷歌正式宣布其最新的 Gemini2.5Flash-Lite 模型已进入稳定版本(GA)。这一版本被称为是速度最快、成本最低的模型,标志着谷歌在人工智能领域的又一重要进展。Gemini2.5

谷歌Gemini2.5Flash-Lite稳定版发布 低价高效支持百万token上下文
AI妹 1 个月前 9 0

近日,谷歌正式宣佈其最新的 Gemini2.5Flash-Lite 模型已進入穩定版本(GA)。這一版本被稱爲是速度最快、成本最低的模型,標誌着谷歌在人工智能領域的又一重要進展。Gemini2.5

WAIC2025生数科技发布Vidu Q1 参考生视频功能破商业化瓶颈
AI妹 1 个月前 12 0

在WAIC2025世界人工智能大会上,生数科技重磅发布Vidu Q1"参考生视频"功能,通过算法创新彻底颠覆传统视频制作流程,为视频生成领域带来突破性进展。 告别分镜,一键直出视频 "参考生视

阿里Qwen团队发布Qwen3-Omni-Flash全模态大模型 实现实时流式多模态交互
AI妹 1 个月前 12 0

AIbase12月9日报道 阿里巴巴Qwen团队今日发布新一代全模态大模型Qwen3-Omni-Flash-2025-12-01。该模型支持文本、图像、音频和视频的无缝输入,并通过实时流式响应同步

快手可灵数字人2.0全面上线 三步生成5分钟生动高表现力视频
AI妹 1 个月前 13 0

快手推出的可灵数字人2.0版本已全面上线,用户只需经过三个简单的步骤,就能生成一个 “能说会演” 的数字人。这一更新为用户带来了显著的体验提升。 新版本的可灵数字人允许用户上传角色图片、添加

谷歌Workspace Studio通用可用 零代码AI代理开启企业自动化新征程
AI妹 1 个月前 18 0

12月3日,谷歌正式宣布Google Workspace Studio通用可用,这款AI代理构建工具标志着企业自动化进入“零代码时代”。依托Gemini3的多模态理解能力,Workspace St