关闭导航

包含标签"扩散模型"的内容

视觉智能从感知到决策的演进:推理、评测与基础设施重构
AI妹 1 个月前 3 0

从早期的ImageNet分类到如今的扩散模型,计算机视觉在过去十年间一直致力于让机器“看清世界”。然而,当感知能力接近人类极限,单纯追求准确率的边际收益正在递减。在CVPR2026上,视觉智能的研

ComfyUI完成3000万美元融资估值5亿 节点式工作流成专业AI创作主流工具
AI妹 1 个月前 3 0

4月24日,由开源项目演进的AI初创公司 ComfyUI 宣布完成3000万美元融资,公司估值达到5亿美元。本轮融资由Craft Ventures领投,Pace

苹果WWDC2026将推全新Core AI框架 取代Core ML加速端侧生成式AI战略布局
AI妹 3 个月前 4 0

苹果公司计划在 WWDC2026开发者大会上推出全新的 Core AI 框架,旨在取代现有的 Core ML,标志着其端侧 AI 战略重心从传统机器学习向生成式人工智能的全面转型。根据相关爆料,尽

Inception Labs发布Mercury2:扩散模型架构革新,速度超竞品性价比高
AI妹 3 个月前 5 0

人工智能初创公司 Inception Labs 近日宣布推出 Mercury2,这不仅是一个性能强劲的推理模型,更在底层架构上实现了一次大胆的“范式转移”。 该模型彻底弃用了目前主流的 Tr

庞天宇加入腾讯混元任首席研究科学家主导多模态RL技术及团队招聘
AI妹 4 个月前 12 0

 近日,AI学术界与产业界传来重磅消息,MLNLP学术委员、资深研究员庞天宇正式宣布加入腾讯混元(Tencent Hunyuan),出任首席研究科学家及多模态强化学习(Multimoda

字节南洋理工联合研发StoryMem 开源AI电影级长视频叙事获关键突破
AI妹 5 个月前 20 0

近日,字节跳动与南洋理工大学联合研发的开源框架StoryMem在AI视频生成领域引发广泛关注。该框架通过创新的“视觉记忆”机制,将现有单镜头视频扩散模型转化为多镜头长视频故事讲述者,能自动生成时长

三星新自回归图像生成方法:分层策略提升质量与扩展性
AI妹 5 个月前 18 0

In the field of image generation, technological advancements are continuously driving the developm

Character.AI发布AvatarFX 静态图转可说话动态视频角色工具
AI妹 5 个月前 15 0

Character.AI 近日宣佈推出全新視頻生成模型 AvatarFX,這一突破性技術能夠將靜態圖片轉化爲具有真實感的可說話視頻角色,賦予圖像中的人物動態表情、脣部同步以及自然肢體動作。 Av

Character.AI推出AvatarFX 静态图片转可说话动态视频角色模型
AI妹 5 个月前 18 0

Character.AI 近日宣布推出全新视频生成模型 AvatarFX,这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色,赋予图像中的人物动态表情、唇部同步以及自然肢体动作。 Av

JSON Visuals for ChatGPT正式发布,JSON风格代码与随机化助力创意图像生成
AI妹 5 个月前 18 0

JSON Visuals for ChatGPT正式发布,为ChatGPT的图像生成能力注入全新创意维度。据AIbase了解,这一工具提供超过50种独特的美学代码,结合属性随机化器,可生成无限风格