微软近日开源了名为VibeVoice的前沿语音 AI 模型家族,涵盖自动语音识别(ASR)和文本转语音(TTS)等多项能力。该项目以其强大的长音频处理、多说话人自然对话生成以及实时低延迟特性,迅速
Hume AI近日开源发布了其最新语音生成模型TADA(Text-Acoustic Dual Alignment),这是一款基于大语言模型的文本转语音(TTS)系统,采用创新的文本-声学双对齐架构
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量
一、前言 纳米AI的智能体为英语学习者和教育者带来了革命性的工具。本教程将详细指导您如何利用纳米AI的智能体,调用模型上下文协议(MCP),轻松制作包含中英双语对照、核心词汇解析以及配套MP3音
AI語音技術領域的先鋒企業ElevenLabs近日宣佈了兩項重大更新:全新的視頻到音樂生成流程以及專爲學生設計的AI學生包。這兩項創新不僅進一步鞏固了ElevenLabs在AI音頻領域的領先地位,
AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位,
法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。这款高度模块化的语音模型以其智能对话、超低延迟和个性化定
法國 AI 實驗室 Kyutai 近日推出了一款革命性的語音 AI 系統 Unmute,爲文本大語言模型(LLM)賦予了強大的語音交互能力。這款高度模塊化的語音模型以其智能對話、超低延遲和個性化定
フランスのAI研究所Kyutaiは最近、画期的な音声AIシステム「Unmute」を発表しました。これはテキストの大規模言語モデル(LLM)に強力な音声インタラクション機能をもたらすものです。この非
人工知能技術の急速な発展に伴い、言語学習ツールは知能化の革命を迎えています。AIbaseは最近、ネットワーク情報から、WordPeckerというオープンソースの言語学習アプリが注目を集めていること