AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位,
近日,一款名为 Direct3D-S2的全新3D 生成框架引发了业界热议。该框架通过创新的 空间稀疏注意力(SSA)机制,显著提升了高分辨率3D 图像生成的质量与效率,为千兆级3D 生成提供了更具
AI领域迎来一项重大技术突破——MotionPro,一款专为图像到视频(I2V)生成设计的精密运动控制器正式亮相。这一技术通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,为视
随着人工智能技术的飞速发展,AI视频生成领域再迎重磅突破。近日,Moonvalley正式发布其全新AI视频生成模型 Marey Realism v1.5,并通过ComfyUI平台实现全面集成。这款
2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面
2025年7月,阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound,爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入,生成高保真的音效與音景,完美適配畫面
人工智能在數字人領域的應用持續升溫,阿里巴巴聯合北京郵電大學近日推出了一項令人矚目的新項目——FantasyPortrait。這一項目通過創新的表情增強擴散變換器(DiT),實現了單人及多人場景下
人工智能在数字人领域的应用持续升温,阿里巴巴联合北京邮电大学近日推出了一项令人瞩目的新项目——FantasyPortrait。这一项目通过创新的表情增强扩散变换器(DiT),实现了单人及多人场景下
腾讯正式发布了混元世界模型1.5(Tencent HY WorldPlay),这是国内首个开放的实时互动体验平台。该模型通过简单的文字描述或图片,就能迅速生成独特的互动世界,用户能够通过键盘、鼠标
快手旗下Kling AI于Omni生态周首日发布2.6版本,首次内置音频生成,支持中英双语对白、歌唱与音效同步输出,实现“文本⇄视频⇄音频”一键闭环。官方口号“See the Sound, Hea
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论