关闭导航

包含标签"GitHub"的内容

阿里通义实验室开源ThinkSound 多模态AI音频生成赋能影视游戏等创作领域
AI妹 4 个月前 16 0

In July 2025, Alibaba's Tongyi Lab officially open-sourced its first audio generation model, Think

阿里巴巴通义实验室开源ThinkSound 多模态音频生成开启音效新革命
AI妹 4 个月前 13 0

2025年7月,阿里巴巴通義實驗室正式開源其首款音頻生成模型ThinkSound,爲視頻內容創作帶來革命性突破。這款多模態AI模型能夠基於視頻、文本或音頻輸入,生成高保真的音效與音景,完美適配畫面

阿里通义ThinkSound 2025开源 AI音声生成革新行业新方向
AI妹 4 个月前 12 0

2025年7月、アリババ・トングイラボはその初の音声生成モデル「ThinkSound」を正式にオープンソース化しました。このモデルは動画コンテンツ制作に革命をもたらし、画期的な突破を実現しました。

NVIDIA DiffusionRenderer:融合生成编辑能力 赋能3D视频创作新突破
AI妹 4 个月前 12 0

随着 AI 技术的迅猛发展,视频生成的质量正以惊人的速度提升,从最初模糊不清的片段发展到如今极具真实感的生成视频。然而,在这一进程中,缺乏对生成视频的控制和编辑能力,仍然是一个亟待解决的关键问题。

智源研究院发布RoboBrain2.0 32B及RoboOS2.0 开源推动身体智能技术助力复杂环境应用
AI妹 4 个月前 11 0

智源研究院は、身体知能システムの最新成果として、ロボットブレイン2.0 32Bバージョンおよび本体と小脳の協調フレームワークであるロボOS2.0単機版を正式に発表しました。ロボットブレイン2.0は

智源發佈RoboBrain2.0與RoboOS2.0 具身智能成果開源性能突破
AI妹 4 个月前 14 0

智源研究院正式發佈了具身智能系統的最新成果 ——RoboBrain2.032B 版本以及跨本體大小腦協同框架 RoboOS2.0單機版。RoboBrain2.0作爲一種 “通用具身大腦”,結合了感

Claude新增MCP工具目录 支持Web与桌面端简化AI工具集成
AI妹 4 个月前 16 0

近日,Anthropic旗下的AI助手Claude发布了一项重大更新:新增“应用和工具目录”,通过直观的界面支持用户快速链接和启用Model Context Protocol(MCP)服务。这一功

Willow Voice获420万美元天使轮融资 推动语音优先交互技术革新
AI妹 4 个月前 15 0

2025年7月15日 – 人工智能语音输入平台Willow Voice宣布成功完成420万美元天使轮融资,致力于推动语音优先交互技术的革新。本轮融资将用于优化其先进的语音输入技术,并加速实现打造通

Willow Voice获420万美元天使轮融资 致力语音优先交互技术革新
AI妹 4 个月前 16 0

2025年7月15日 – 人工智能語音輸入平臺Willow Voice宣佈成功完成420萬美元天使輪融資,致力於推動語音優先交互技術的革新。本輪融資將用於優化其先進的語音輸入技術,並加速實現打造通

字节跳动Seed团队联合港大复旦推出POLARIS 提升小模型数学推理媲美大模型
AI妹 4 个月前 13 0

近日,字节跳动Seed团队携手香港大学与复旦大学,共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略,成功将小模型的数学推理能力提升至与超大模型相媲美