人工智能语音领域迎来强力竞争者,初创公司 Resemble AI 正式发布了名为“Chatterbox Turbo”的开源文本转语音模型,其矛头直指 ElevenLabs 和 Cartesia 等
近日,清华大学 TSAIL 实验室联合生数科技推出了全新的开源视频生成加速框架 TurboDiffusion 。这一突破性的技术框架在确保视频生成质量不减的前提下
阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音,还具
今日,通义千问团队正式发布全新图像生成模型 Qwen-Image-Layered,该模型以自研创新架构打破传统 AI 图片编辑局限,通过 “图层拆解” 技术赋予静态图片可编辑性,开启 “指哪改哪”
长期以来,将一张普通的扁平化照片转换为可灵活编辑的图层文件,一直是专业设计师的“刚需”。据 AIbase 报道,阿里巴巴旗下人工智能部门 Qwen 近日推出了一款革命性的图像编辑模型 —— Qwe
近日,美团旗下的 LongCat 团队宣布开源其最新的视频生成模型 ——LongCat-Video-Avatar,标志着虚拟人技术的又一次重要突破。该模型在长视频生成领域表现优异,具有多项核心功能
人工智能技术的边界正在不断被突破!继BrowserUse、ComputerUse等AI自动化项目引发热议后,一个全新的PhoneUse类项目——DroidRun,正式进入公众视野。这款创新性应用让
人工智能技術的邊界正在不斷被突破!繼BrowserUse、ComputerUse等AI自動化項目引發熱議後,一個全新的PhoneUse類項目——DroidRun,正式進入公衆視野。這款創新性應用讓
The boundaries of artificial intelligence (AI) technology are constantly being pushed! Following t
人工知能技術の限界が次々と突破されています!BrowserUse、ComputerUseなどのAI自動化プロジェクトが話題になった後、全く新しいPhoneUseタイプのプロジェクトであるDroid
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论