关闭导航

包含标签"视觉理解"的内容

Meta FAIR发布五项AI感知领域前沿研究成果实现重大突破
AI妹 4 个月前 17 0

Meta人工智能研究團隊(FAIR)近日公開發布五項前沿研究成果,標誌着AI感知領域的重大突破。這些開源項目從視覺編碼器到3D空間理解,再到協作式推理框架,共同構建了通向高級機器智能(AMI)的關

腾讯混元开源全新统一多模态奖励模型 兼具长链推理与视觉思考能力
AI妹 4 个月前 19 0

近日,腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下,正式推出了全新研究成果 —— 统一多模态奖励模型(Unified Reward-Think),并宣布全面开源。这一创新模型不仅

云从科技从容V2.0以80.7分登顶全球知名OpenCompass多模态榜单彰显中国AI实力
AI妹 4 个月前 15 0

近日,云从科技自主研发的多模态大模型 “从容 V2.0” 在全球知名的 OpenCompass 多模态榜单上以高达80.7分的优异成绩脱颖而出,荣登榜首。这一成就标志着中国在人工智能领域的进一步突

中科院计算所Stream-Omni多模态大模型:文本视觉语音交互新突破
AI妹 4 个月前 15 0

在人工智能技術飛速發展的今天,中國科學院計算技術研究所自然語言處理團隊推出了一款名爲 Stream-Omni 的文本 - 視覺 - 語音多模態大模型。這一模型的核心亮點在於它能夠同時支持多種模態的

Stream-Omni多模态大模型:创新模态对齐,支持文本视觉语音灵活交互
AI妹 4 个月前 15 0

在人工智能技术飞速发展的今天,中国科学院计算技术研究所自然语言处理团队推出了一款名为 Stream-Omni 的文本 - 视觉 - 语音多模态大模型。这一模型的核心亮点在于它能够同时支持多种模态的

中科院计算所创新推出Stream-Omni多模态大模型 灵活交互高效对齐助智能交互
AI妹 4 个月前 13 0

Today, with the rapid development of artificial intelligence technology, the Natural Language Proc

硅基流动上线月之暗面开源Kimi K2模型 1T参数128K上下文
AI妹 4 个月前 13 0

近日,硅基流动(SiliconCloud)平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T,激活参数为32B,在各项基准性能测试中表现不俗,能够与顶尖的商业模型相