关闭导航

包含标签"多模态能力"的内容

李沐团队Boson.ai发布开源TTS模型Higgs Audio v2 功能全性能优越

(注:标题含关键主体、事件、模型名及核心优势,符合30字左右要求)
AI妹 3 个月前 21 0

有名なAIスタートアップの李沐(リ・ム)と彼のチームBoson.aiは、最近新しいオープンソースのテキストから音声への変換(TTS)大規模モデル「Higgs Audio v2」をリリースしました。

李沐团队推出开源TTS大模型Higgs Audio v2 功能强大性能领先
AI妹 3 个月前 15 0

知名 AI 创业者李沐与他的团队 Boson.ai 最近推出了全新的开源文本转语音(TTS)大模型 ——Higgs Audio v2。这款模型不仅可以将文本转换为语音,还具备多语言对话生成、韵律自

开源AI Agent CLI工具DailiCode:多模型兼容功能丰富 提升开发效能
AI妹 3 个月前 14 0

近日,一款名爲DailiCode的開源AI Agent CLI工具在GitHub引發關注。作爲Gemini CLI的Fork版本,該工具以強大的多模型兼容性和豐富功能,爲開發者打造了高效便捷的命令

开源AI Agent CLI工具DailiCode:多模型兼容 助力开发效率提升
AI妹 3 个月前 15 0

近日,一款名为DailiCode的开源AI Agent CLI工具在GitHub引发关注。作为Gemini CLI的Fork版本,该工具以强大的多模型兼容性和丰富功能,为开发者打造了高效便捷的命令

OpenAI以认股权证获迪士尼经典IP 双方合作绑定AI娱乐未来
AI妹 4 个月前 18 0

一场颠覆传统授权模式的战略联姻,正在重塑AI与娱乐产业的边界。据知情人士透露,OpenAI与迪士尼达成一项极具创新性的合作:OpenAI以**认股权证**(warrants)而非现金,获得了迪士尼

Meta扎克伯格接管AI商业化 Avocado大模型2026闭源发布
AI妹 4 个月前 24 0

Meta首席执行官马克·扎克伯格已接管公司AI商业化路线图,内部确认代号为「Avocado」的新一代大模型将于 2026 年春季以闭源形式发布,仅提供API及托管服务,不再开放权重。 Meta

谷歌12月1日Gemini3接入搜索AI模式 同步上线Nano Banana Pro图像生成模型
AI妹 4 个月前 19 0

12月1日,谷歌宣布把最新大模型 Gemini3接入搜索“AI 模式”,首批覆盖近120个国家和地区,即刻向 AI Pro 与 Ultra 订阅用户开放 。同一天,配套的新一代生成式图像模型 Na

Anthropic发布Claude Opus4.5:推理对话升级 软件工程能力领跑
AI妹 4 个月前 22 0

Anthropic近日正式发布其迄今为止最强大的AI模型Claude Opus4.5。这一突破性升级标志着AI在推理、对话和软件工程领域的全新巅峰,预计将深刻影响开发者社区和企业级应用。Claud