关闭导航

包含标签"TTS"的内容

清华NLP实验室等联合发布UltraEval-Audio v1.1.0开源框架推动音频模型发展
AI妹 15 天前 8 0

近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域

清华上海AI Lab提出GenPRM 大幅提升大模型过程监督推理能力
AI妹 1 个月前 9 0

在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题

2人組Nari Labs、16億パラメータTTSモデルDiaをリリース 自然会話生成を目指す
AI妹 1 个月前 9 0

Nari Labsという2人組のスタートアップ企業が、16億パラメーターを持つテキスト音声変換(TTS)モデル「Dia」をリリースしました。テキストプロンプトから自然な会話を直接生成することを目指

两人创业公司Nari Labs发布开源TTS模型Dia 性能优于ElevenLabs等竞品
AI妹 1 个月前 9 0

一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性

创业公司Nari Labs发布开源TTS模型Dia 性能优于多款同类产品
AI妹 1 个月前 8 0

一家名爲 Nari Labs 的兩人創業公司發佈了 Dia,這是一個擁有16億參數的文本轉語音 (TTS) 模型,旨在直接從文本提示生成自然對話。其聯合創始人 Toby Kim 聲稱,Dia 的性

LLaMA-Omni2语音模型:高质量实时交互与多模块融合突破
AI妹 1 个月前 7 0

最近 AI 圈可是熱鬧非凡,今天咱們就來聊聊其中的 “狠角色”——LLaMA-Omni2。這是一系列超厲害的語音語言模型(SpeechLMs),參數規模從0.5B 到14B 不等,專門爲實現高質量

开源TTS新突破:Muyan-TTS零shot快速生成高连贯长音频内容
AI妹 1 个月前 9 0

A new breakthrough has been achieved in open-source text-to-speech (TTS) technology! The recently

MiniMax Speech-02登顶国际权威音声榜单 超越OpenAI等巨头创SOTA
AI妹 1 个月前 8 0

人工知能領域の急速な発展の中で、国産の大規模モデルの進化速度には驚かされます。今年の初めには、DeepSeek-R1が低コストでOpenAIを上回る性能を示し、海外の大規模モデルによる市場の独占的

MiniMax Speech-02登顶国际语音榜 零样本克隆技术破局音频领域
AI妹 1 个月前 8 0

在人工智能領域的快速發展中,國產大模型的進步速度讓人驚歎。早在今年初,DeepSeek-R1以超低成本獲得了超越 OpenAI 的表現,令人重新審視國外大模型的壟斷地位。如今,MiniMax 再次

FlowSpeech语音合成技术新突破 自然流畅解决差异多场景适用开启新可能
AI妹 1 个月前 8 0

Artificial intelligence speech synthesis technology has made a new breakthrough. A text-to-speech

    1 2