Hume公司于2025年5月29日正式发布全新语音语言模型EVI3,这一创新标志着通用语音智能领域的重大飞跃。相较于传统文本到语音(TTS)模型,EVI3不仅能够理解和生成任意人类语音,还能精准捕
微软今日发布全新的实时文本转语音模型 VibeVoice-Realtime-0.5B。尽管模型规模仅为0.5B,但却具备接近实时的语音生成能力,最快可在约300毫秒内开始发声,实现“话未说完音已先
近日,AI 视频公司 Runway 正式发布了其最新的视频生成模型 Gen-4.5。该模型专为创作者、影视制作人和企业用户设计,预计不久后将向所有订阅层级开放。Gen-4.5凭借其卓越的性能,在
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论