关闭导航

包含标签"语音-文本映射机制"的内容

Stream-Omni多模态大模型:创新模态对齐,支持文本视觉语音灵活交互
AI妹 1 个月前 10 0

在人工智能技术飞速发展的今天,中国科学院计算技术研究所自然语言处理团队推出了一款名为 Stream-Omni 的文本 - 视觉 - 语音多模态大模型。这一模型的核心亮点在于它能够同时支持多种模态的