关闭导航

包含标签"多模态大模型"的内容

北京智源Emu3.5发布:统一模态预测世界下一秒,真正理解物理的AI
AI妹 1 个月前 13 0

12月4日,北京智源人工智能研究院正式发布新一代多模态大模型Emu3.5,被誉为“真正理解物理世界的AI”。与以往图像、视频、文本模型各自为战不同,Emu3.5首次实现“世界级统一建模”,让AI从

MLLM-SC框架优化6G带宽 提升AR等场景低时延高质量体验
AI妹 1 个月前 19 0

AR 眼镜刚问“对面是什么楼”,后端的 MLLM-SC 框架就在 10 ms 内画出一张“语义注意力热图”:建筑轮廓被标成深红,优先级调到最高,其他背景一律降码率。高维多模态数据不再“平均