TTS - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"TTS"的内容

阿里语音大模型Fun-Realtime-TTS-Preview获全球第五国产第一横扫三大核心语音赛道

阿里语音大模型Fun-Realtime-TTS-Preview获全球第五国产第一横扫三大核心语音赛道

AI妹 12 天前 1 0

2026 年 5 月 28 日，全球权威 AI 评测平台 Artificial Analysis 发布了最新一期语音排行榜（Speech Arena）。阿里巴巴凭借语音大模型 Fun-Realti

Chat 毫秒级延迟 Artificial Analysis 文本转语音 Fun-Realtime-TTS-Preview

查看详情

Fish Audio发布新一代开源TTS模型S2 情感可控性与表现力迎来重大突破

Fish Audio发布新一代开源TTS模型S2 情感可控性与表现力迎来重大突破

AI妹 3 个月前 4 0

Fish Audio 正式发布新一代文本转语音（TTS）模型 S2，标志着开源TTS技术在表现力和可控性上迎来重大突破。这款名为 Fish Audio S2的模型主打超强情感可控性，用户可通过

多语言强化学习对齐自然语言指令 S2-Pro 流式推理引擎

查看详情

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展

AI妹 5 个月前 31 0

近日，清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio，这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域

Codec 全模态模型标准化进程 TTS 隔离推理

查看详情

清华上海AI Lab提出GenPRM 大幅提升大模型过程监督推理能力

清华上海AI Lab提出GenPRM 大幅提升大模型过程监督推理能力

AI妹 5 个月前 18 0

在人工智能领域，随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注，大语言模型（LLM）的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而，在处理复杂推理问题

GenPRM 过程监督推理推理能力 TTS GPT-4o

查看详情

2人組Nari Labs、16億パラメータTTSモデルDiaをリリース自然会話生成を目指す

2人組Nari Labs、16億パラメータTTSモデルDiaをリリース自然会話生成を目指す

AI妹 5 个月前 17 0

Nari Labsという2人組のスタートアップ企業が、16億パラメーターを持つテキスト音声変換（TTS）モデル「Dia」をリリースしました。テキストプロンプトから自然な会話を直接生成することを目指

Google NotebookLM 16億パラメーター ElevenLabs OpenAI gpt-4o-mini-tts PyTorch2.0+

查看详情

两人创业公司Nari Labs发布开源TTS模型Dia 性能优于ElevenLabs等竞品

两人创业公司Nari Labs发布开源TTS模型Dia 性能优于ElevenLabs等竞品

AI妹 5 个月前 19 0

一家名为 Nari Labs 的两人创业公司发布了 Dia，这是一个拥有16亿参数的文本转语音（TTS）模型，旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称，Dia 的性

情绪语调 Apache2.0许可证 TTS OpenAI gpt-4o-mini-tts Dia

查看详情

创业公司Nari Labs发布开源TTS模型Dia 性能优于多款同类产品

创业公司Nari Labs发布开源TTS模型Dia 性能优于多款同类产品

AI妹 5 个月前 16 0

一家名爲 Nari Labs 的兩人創業公司發佈了 Dia，這是一個擁有16億參數的文本轉語音（TTS）模型，旨在直接從文本提示生成自然對話。其聯合創始人 Toby Kim 聲稱，Dia 的性

OpenAI gpt-4o-mini-tts Sesame CSM-1B 16亿参数文本转语音模型 TTS

查看详情

LLaMA-Omni2语音模型：高质量实时交互与多模块融合突破

LLaMA-Omni2语音模型：高质量实时交互与多模块融合突破

AI妹 5 个月前 14 0

最近 AI 圈可是熱鬧非凡，今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型（SpeechLMs），參數規模從0.5B 到14B 不等，專門爲實現高質量

InstructS2S-200K数据集语音到语音生成語音指令跟隨口語問答梅爾頻譜圖

查看详情

开源TTS新突破：Muyan-TTS零shot快速生成高连贯长音频内容

开源TTS新突破：Muyan-TTS零shot快速生成高连贯长音频内容

AI妹 5 个月前 20 0

A new breakthrough has been achieved in open-source text-to-speech (TTS) technology! The recently

model weights podcasts English video dubbing GitHub Muyan-TTS

查看详情

MiniMax Speech-02登顶国际权威音声榜单超越OpenAI等巨头创SOTA

MiniMax Speech-02登顶国际权威音声榜单超越OpenAI等巨头创SOTA

AI妹 5 个月前 15 0

人工知能領域の急速な発展の中で、国産の大規模モデルの進化速度には驚かされます。今年の初めには、DeepSeek-R1が低コストでOpenAIを上回る性能を示し、海外の大規模モデルによる市場の独占的

Speech-02 ElevenLabs 人工智能文本转语音 T2V框架

查看详情

1



资讯姬

文章数量13527

总阅读量227.786k

总评论量0

会员数量2

本站由emlog驱动