关闭导航

包含标签"视觉理解"的内容

Stream-Omni多模态大模型:创新模态对齐,支持文本视觉语音灵活交互
AI妹 1 个月前 10 0

在人工智能技术飞速发展的今天,中国科学院计算技术研究所自然语言处理团队推出了一款名为 Stream-Omni 的文本 - 视觉 - 语音多模态大模型。这一模型的核心亮点在于它能够同时支持多种模态的

中科院计算所创新推出Stream-Omni多模态大模型 灵活交互高效对齐助智能交互
AI妹 1 个月前 9 0

Today, with the rapid development of artificial intelligence technology, the Natural Language Proc

硅基流动上线月之暗面开源Kimi K2模型 1T参数128K上下文
AI妹 1 个月前 10 0

近日,硅基流动(SiliconCloud)平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T,激活参数为32B,在各项基准性能测试中表现不俗,能够与顶尖的商业模型相