关闭导航

包含标签"GitHub"的内容

Resemble AI发布Chatterbox Turbo开源语音模型 低延迟带水印对标行业巨头
AI妹 22 天前 8 0

人工智能语音领域迎来强力竞争者,初创公司 Resemble AI 正式发布了名为“Chatterbox Turbo”的开源文本转语音模型,其矛头直指 ElevenLabs 和 Cartesia 等

清华联合生数科技开源TurboDiffusion AI视频生成提速最高达200倍1.9秒出5秒视频
AI妹 25 天前 10 0

近日,清华大学 TSAIL 实验室联合生数科技推出了全新的开源视频生成加速框架 TurboDiffusion 。这一突破性的技术框架在确保视频生成质量不减的前提下

阿里通义实验室开源新一代Fun-Audio-Chat-8B端到端低延迟情感语音交互大模型
AI妹 26 天前 11 0

阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音,还具

通义千问发布Qwen-Image-Layered模型 图层拆解开启精准图片编辑新时代
AI妹 28 天前 13 0

今日,通义千问团队正式发布全新图像生成模型 Qwen-Image-Layered,该模型以自研创新架构打破传统 AI 图片编辑局限,通过 “图层拆解” 技术赋予静态图片可编辑性,开启 “指哪改哪”

阿里Qwen-Image-Layered开源:静态图可拆分为可编辑RGBA图层
AI妹 29 天前 9 0

长期以来,将一张普通的扁平化照片转换为可灵活编辑的图层文件,一直是专业设计师的“刚需”。据 AIbase 报道,阿里巴巴旗下人工智能部门 Qwen 近日推出了一款革命性的图像编辑模型 —— Qwe

美团LongCat团队开源最新视频生成模型LongCat-Video-Avatar
AI妹 1 个月前 10 0

近日,美团旗下的 LongCat 团队宣布开源其最新的视频生成模型 ——LongCat-Video-Avatar,标志着虚拟人技术的又一次重要突破。该模型在长视频生成领域表现优异,具有多项核心功能

DroidRun:AI操作智能手机新标杆 开源助力技术普及与创新
AI妹 1 个月前 11 0

人工智能技术的边界正在不断被突破!继BrowserUse、ComputerUse等AI自动化项目引发热议后,一个全新的PhoneUse类项目——DroidRun,正式进入公众视野。这款创新性应用让

DroidRun:AI操作手机新突破 视觉理解自我修复开源加速落地
AI妹 1 个月前 9 0

人工智能技術的邊界正在不斷被突破!繼BrowserUse、ComputerUse等AI自動化項目引發熱議後,一個全新的PhoneUse類項目——DroidRun,正式進入公衆視野。這款創新性應用讓

DroidRun:AI操作手机的视觉解析、自我修复及开源计划新突破
AI妹 1 个月前 9 0

The boundaries of artificial intelligence (AI) technology are constantly being pushed! Following t

DroidRun:AI智能操作手机 视觉识别+自我修复 计划开源
AI妹 1 个月前 7 0

人工知能技術の限界が次々と突破されています!BrowserUse、ComputerUseなどのAI自動化プロジェクトが話題になった後、全く新しいPhoneUseタイプのプロジェクトであるDroid