OpenBMB 团队近日宣布,新一代多模态大模型 MiniCPM-V4.0 正式开源发布。该模型凭借其轻量级架构和卓越性能,被誉为“手机上的 GPT-4V”,有望为移动设备上的 AI
2025年5月19日、bilibili(Bサイト)は最新のアニメーションビデオ生成モデルである「Index-AniSora」をオープンソース化すると発表しました。この革新的な技術は、セカンドライフ
2025年5月19日,哔哩哔哩(B站)宣布开源其最新的动画视频生成模型——Index-AniSora,这一创新技术为二次元风格视频的生成带来了革命性的突破。Index-AniSora支持多种二次元
2025年5月19日,嗶哩嗶哩(B站)宣佈開源其最新的動畫視頻生成模型——Index-AniSora,這一創新技術爲二次元風格視頻的生成帶來了革命性的突破。Index-AniSora支持多種二次元
最近、通義大模型はCoGenAVを発表しました。これは音声と映像の同期というアイデアに基づいて音声認識技術を革新し、雑音干渉による問題を効果的に解決しています。 従来の音声認識技術はノイズ環境
近日,通义大模型发布CoGenAV,以音画同步理念创新语音识别技术,有效解决语音识别中噪声干扰的难题。 传统语音识别在噪声环境下表现欠佳,CoGenAV则另辟蹊径,通过学习audio-visua
近日,通義大模型發佈CoGenAV,以音畫同步理念創新語音識別技術,有效解決語音識別中噪聲干擾的難題。 傳統語音識別在噪聲環境下表現欠佳,CoGenAV則另闢蹊徑,通過學習audio-visua
Recently, the Alibaba Speech AI team announced the open-source release of ThinkSound, the world's
2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面
In July 2025, Alibaba's Tongyi Lab officially open-sourced its first audio generation model, Think