近日,谷歌對其文本轉圖像生成模型Imagen4進行了重大升級,引發了人工智能領域的廣泛關注。據最新消息,升級後的Imagen4Ultra在權威的Artificial Analysis圖像競技場排行
谷歌在其AI視頻生成工具Veo3發佈僅100小時後,迅速將其推廣至全球71個新國家用戶使用。不過,這一波擴展仍未包括歐盟國家。 這一消息由谷歌Gemini副總裁Josh Woodward在X平臺
近日,一款名爲 Direct3D-S2的全新3D 生成框架引發了業界熱議。該框架通過創新的 空間稀疏注意力(SSA)機制,顯著提升了高分辨率3D 圖像生成的質量與效率,爲千兆級3D 生成提供了更具
近日,英伟达、香港大学与麻省理工学院的研究团队联合发布了一种名为 Fast-dLLM 的创新技术,旨在提升扩散语言模型的推理效率。与传统的自回归模型不同,扩散语言模型采用逐步去除文本噪声的方式生成
最近、NVIDIA、香港大学およびマサチューセッツ工科大学の研究チームは、拡散言語モデルの推論効率を向上させるための新技術「Fast-dLLM」を発表しました。従来の自己回帰モデルとは異なり、拡散
最近一款名为Fogsight的AI动画引擎引发业内关注。这款工具通过输入简单概念词即可生成叙事完整、视觉效果出色的教学动画,为教育工作者和内容创作者提供了高效、便捷的解决方案。
可灵AI公司宣布,其自主研发的O1视频大模型已于今日零时起面向公众全量开放。该模型采用MVL(多模态视觉语言)统一交互架构,在单一输入框内融合文字、图像、视频三种指令,并首次引入Chain-of-
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论