关闭导航

包含标签"文本-视觉-语音"的内容

Stream-Omni多模态大模型:创新模态对齐,支持文本视觉语音灵活交互
AI妹 1 个月前 9 0

在人工智能技术飞速发展的今天,中国科学院计算技术研究所自然语言处理团队推出了一款名为 Stream-Omni 的文本 - 视觉 - 语音多模态大模型。这一模型的核心亮点在于它能够同时支持多种模态的