关闭导航

包含标签"CER"的内容

美团LongCat团队开源LongCat-AudioDiT 端到端语音克隆性能创新高
AI妹 13 天前 1 0

 音频生成技术正迎来从级联架构向端到端生成的范式转移。针对传统 TTS 系统因“梅尔频谱”中间表征带来的信息损耗与误差累积,美团 LongCat 团队于今日正式发布并开源了 LongCa

智谱AI推GLM-ASR系列语音模型开源,发布智谱AI输入法
AI妹 4 个月前 18 0

智谱 AI 正式推出了其最新的 GLM-ASR 系列语音识别模型,并将相关技术开源,旨在为广大用户提供更高效的语音交互体验。这一系列的推出还包括了一款桌面端的 “智谱 AI 输入法”,为用户在 P