快手科技正式对外披露了其视频生成大模型产品可灵AI(Kling AI)的商业化进展。数据显示,截至2025年12月,可灵AI的单月营收已突破2000万美元。以此推算,其年化收入运行率(ARR)达到
以色列科技公司 Lightricks 近日宣布公开其最新视听合成系统 LTX-2。该系统具备极高的计算效能,能够根据简短的文本描述,直接生成长达20秒且音画完全同步的高清视频内容。 与传统的视觉
阿里通義實驗室近日發佈了一款名爲 “OmniTalker” 的新型數字人視頻生成大模型。這一創新模型的核心在於其能夠通過上傳一段參考視頻,實現對視頻中人物的表情、聲音和說話風格的精準模仿。相較於傳
阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传
备受瞩目的 AI 视频生成工具 PixVerse v4正式在 Replicate 平台上线,为内容创作者们带来了前所未有的高清视频快速生成体验。新版本不仅支持生成5秒或8秒 的流畅视频片段,分辨率
腾讯发布了一款创新技术 ——HunyuanVideo-Avatar 语音数字人模型,并将其开源。这一技术能够仅凭一张图片和一段音频,生成自然、真实的数字人说话或唱歌视频,标志着短视频创作进入了全新
騰訊發佈了一款創新技術 ——HunyuanVideo-Avatar 語音數字人模型,並將其開源。這一技術能夠僅憑一張圖片和一段音頻,生成自然、真實的數字人說話或唱歌視頻,標誌着短視頻創作進入了全新
近日,通义大模型发布CoGenAV,以音画同步理念创新语音识别技术,有效解决语音识别中噪声干扰的难题。 传统语音识别在噪声环境下表现欠佳,CoGenAV则另辟蹊径,通过学习audio-visua
近日,通義大模型發佈CoGenAV,以音畫同步理念創新語音識別技術,有效解決語音識別中噪聲干擾的難題。 傳統語音識別在噪聲環境下表現欠佳,CoGenAV則另闢蹊徑,通過學習audio-visua
2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论