视觉理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"视觉理解"的内容

Meta发布五项AI感知前沿成果构建高级机器智能关键路径

Meta发布五项AI感知前沿成果构建高级机器智能关键路径

AI妹 5 个月前 18 0

Meta人工智能研究团队（FAIR）近日公开发布五项前沿研究成果，标志着AI感知领域的重大突破。这些开源项目从视觉编码器到3D空间理解，再到协作式推理框架，共同构建了通向高级机器智能(AMI)的关

动态字节潜在变换器 Locate3D解码器 Meta人工智能研究团队合成数据零样本分类

查看详情

Meta FAIR发布五项AI感知领域前沿研究成果实现重大突破

Meta FAIR发布五项AI感知领域前沿研究成果实现重大突破

AI妹 5 个月前 19 0

Meta人工智能研究團隊（FAIR）近日公開發布五項前沿研究成果，標誌着AI感知領域的重大突破。這些開源項目從視覺編碼器到3D空間理解，再到協作式推理框架，共同構建了通向高級機器智能(AMI)的關

感知语言模型高级机器智能 PLM-VideoBench Meta Locate3D 动态字节潜在变换器

查看详情

腾讯混元开源全新统一多模态奖励模型兼具长链推理与视觉思考能力

腾讯混元开源全新统一多模态奖励模型兼具长链推理与视觉思考能力

AI妹 5 个月前 22 0

近日，腾讯混元在与上海 AI Lab、复旦大学及上海创智学院的合作下，正式推出了全新研究成果 —— 统一多模态奖励模型（Unified Reward-Think），并宣布全面开源。这一创新模型不仅

长链推理能力评测工具图像生成腾讯混元开放态度

查看详情

云从科技从容V2.0以80.7分登顶全球知名OpenCompass多模态榜单彰显中国AI实力

云从科技从容V2.0以80.7分登顶全球知名OpenCompass多模态榜单彰显中国AI实力

AI妹 5 个月前 17 0

近日，云从科技自主研发的多模态大模型 “从容 V2.0” 在全球知名的 OpenCompass 多模态榜单上以高达80.7分的优异成绩脱颖而出，荣登榜首。这一成就标志着中国在人工智能领域的进一步突

云从科技智能化转型视觉感知认知理解智能安防

查看详情

中科院计算所Stream-Omni多模态大模型：文本视觉语音交互新突破

中科院计算所Stream-Omni多模态大模型：文本视觉语音交互新突破

AI妹 5 个月前 17 0

在人工智能技術飛速發展的今天，中國科學院計算技術研究所自然語言處理團隊推出了一款名爲 Stream-Omni 的文本 - 視覺 - 語音多模態大模型。這一模型的核心亮點在於它能夠同時支持多種模態的

语音文本语义一致性 GPT-4o架构 Stream-Omni 文本-视觉-语音多模态任意模态组合交互

查看详情

Stream-Omni多模态大模型：创新模态对齐，支持文本视觉语音灵活交互

Stream-Omni多模态大模型：创新模态对齐，支持文本视觉语音灵活交互

AI妹 5 个月前 17 0

在人工智能技术飞速发展的今天，中国科学院计算技术研究所自然语言处理团队推出了一款名为 Stream-Omni 的文本 - 视觉 - 语音多模态大模型。这一模型的核心亮点在于它能够同时支持多种模态的

实时文本转录文本-视觉-语音任意模态组合模态对齐 GPT-4o架构

查看详情

中科院计算所创新推出Stream-Omni多模态大模型灵活交互高效对齐助智能交互

中科院计算所创新推出Stream-Omni多模态大模型灵活交互高效对齐助智能交互

AI妹 5 个月前 16 0

Today, with the rapid development of artificial intelligence technology, the Natural Language Proc

语义一致性 arxiv 大语言模型语音层 Stream-Omni

查看详情

硅基流动上线月之暗面开源Kimi K2模型 1T参数128K上下文

硅基流动上线月之暗面开源Kimi K2模型 1T参数128K上下文

AI妹 5 个月前 17 0

近日，硅基流动（SiliconCloud）平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T，激活参数为32B，在各项基准性能测试中表现不俗，能够与顶尖的商业模型相

15.5T Tokens训练数据 Kimi-Dev-72B 逻辑推理 14元试用金视觉理解

查看详情

3



资讯姬

文章数量13535

总阅读量233.893k

总评论量0

会员数量2

本站由emlog驱动