关闭导航

包含标签"文本转语音(TTS)"的内容

微软开源VibeVoice语音AI模型家族 含ASR/TTS支持长音频及本地部署
AI妹 16 天前 2 0

微软近日开源了名为VibeVoice的前沿语音 AI 模型家族,涵盖自动语音识别(ASR)和文本转语音(TTS)等多项能力。该项目以其强大的长音频处理、多说话人自然对话生成以及实时低延迟特性,迅速

Hume AI开源TADA文本转语音模型:双对齐零幻觉高效低耗多语言支持
AI妹 1 个月前 2 0

Hume AI近日开源发布了其最新语音生成模型TADA(Text-Acoustic Dual Alignment),这是一款基于大语言模型的文本转语音(TTS)系统,采用创新的文本-声学双对齐架构

LLaMA-Omni2语音语言模型:高质量实时交互性能超越前辈引关注
AI妹 3 个月前 12 0

最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量

利用纳米AI智能体调用MCP制作精美英语学习素材网页教程
AI妹 3 个月前 12 0

一、前言 纳米AI的智能体为英语学习者和教育者带来了革命性的工具。本教程将详细指导您如何利用纳米AI的智能体,调用模型上下文协议(MCP),轻松制作包含中英双语对照、核心词汇解析以及配套MP3音

ElevenLabs发布视频转音乐流程与AI学生包 赋能创作者及学生群体
AI妹 3 个月前 12 0

AI語音技術領域的先鋒企業ElevenLabs近日宣佈了兩項重大更新:全新的視頻到音樂生成流程以及專爲學生設計的AI學生包。這兩項創新不僅進一步鞏固了ElevenLabs在AI音頻領域的領先地位,

ElevenLabs发布视频到音乐生成流程与AI学生包 赋能创作与教育
AI妹 3 个月前 13 0

AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位,

法国Kyutai推出Unmute语音AI:模块化智能交互与个性化定制即将开源
AI妹 3 个月前 10 0

法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。这款高度模块化的语音模型以其智能对话、超低延迟和个性化定

法国Kyutai Unmute语音AI:模块化赋能LLM 智能个性且即将开源
AI妹 3 个月前 12 0

法國 AI 實驗室 Kyutai 近日推出了一款革命性的語音 AI 系統 Unmute,爲文本大語言模型(LLM)賦予了強大的語音交互能力。這款高度模塊化的語音模型以其智能對話、超低延遲和個性化定

法国Kyutai发布Unmute音声AI:模块式设计+智能交互+个性化定制
AI妹 3 个月前 11 0

フランスのAI研究所Kyutaiは最近、画期的な音声AIシステム「Unmute」を発表しました。これはテキストの大規模言語モデル(LLM)に強力な音声インタラクション機能をもたらすものです。この非

开源AI工具WordPecker:个性化学习与沉浸式语音交互创新
AI妹 3 个月前 23 0

人工知能技術の急速な発展に伴い、言語学習ツールは知能化の革命を迎えています。AIbaseは最近、ネットワーク情報から、WordPeckerというオープンソースの言語学習アプリが注目を集めていること

    1 2