Qwen2.5-VL - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"Qwen2.5-VL"的内容

CameraBench：赋能AI精准理解镜头运动的创新研究成果

CameraBench：赋能AI精准理解镜头运动的创新研究成果

AI妹 1 个月前 11 0

咱们天天聊 AI 多牛逼，能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过，当 AI 看视频的时候，它真的“看懂”了吗? 你可能会说:“当然了，都能识别猫猫狗狗、人山人海了!” 打住!识别物

Qwen2.5-VL 稳定性视频描述生成 VQA CameraBench

查看详情

AI镜头运动理解有新招！CameraBench数据集显威力

AI镜头运动理解有新招！CameraBench数据集显威力

AI妹 1 个月前 9 0

咱們天天聊 AI 多牛逼，能寫詩、能畫畫、還能跟你嘮嗑到天亮。但你有沒有想過，當 AI 看視頻的時候，它真的“看懂”了嗎? 你可能會說:“當然了，都能識別貓貓狗狗、人山人海了!” 打住!識別物

USC 动画 Arcing/Orbiting Tilt Vlog

查看详情

上海AI实验室发布开源科学多模态大模型Intern-S1赋能科研新突破

上海AI实验室发布开源科学多模态大模型Intern-S1赋能科研新突破

AI妹 1 个月前 9 0

在7月26日召开的2025世界人工智能大会（WAIC2025）上，上海人工智能实验室正式发布并开源了名为『书生』的科学多模态大模型 Intern-S1。这一全新的模型旨在克服传统科研方法在分析复杂

Qwen2.5-VL InternVL3 上海人工智能实验室 Intern-S1 多智能体虚拟疾病学家系统

查看详情

字节跳动开源多模态模型BAGEL：70亿参数性能卓越覆盖生成编辑

字节跳动开源多模态模型BAGEL：70亿参数性能卓越覆盖生成编辑

AI妹 1 个月前 10 0

字節跳動發佈了一款名爲 BAGEL 的開源多模態基礎模型，擁有70億個活躍參數，整體參數量達到140億。 BAGEL 在標準多模態理解基準測試中表現出色，超越了當前一些頂級開源視覺語言模型

70亿活跃参数 InternVL-2.5 多模态推理视觉变换器（ViT） BAGEL

查看详情

字节跳动开源BAGEL多模态模型：70亿活参超多项基准图生编优异

字节跳动开源BAGEL多模态模型：70亿活参超多项基准图生编优异

AI妹 1 个月前 8 0

字节跳动发布了一款名为 BAGEL 的开源多模态基础模型，拥有70亿个活跃参数，整体参数量达到140亿。 BAGEL 在标准多模态理解基准测试中表现出色，超越了当前一些顶级开源视觉语言模型

字节跳动三维操作图像生成开源多模态基础模型 Hugging Face

查看详情

字节跳动BAGEL多模态模型：MoE架构赋能性能超竞品开源受热捧

字节跳动BAGEL多模态模型：MoE架构赋能性能超竞品开源受热捧

AI妹 1 个月前 9 0

字節跳動SeedチームはHugging Faceプラットフォーム上で、混合専門家（MoE）アーキテクチャに基づくオープンソースのマルチモーダルベースモデル「BAGEL」を発表しました。総パラメータ

数兆トークン事前学習字节跳动Seed团队混合トランスフォーマー専門家(MoT) GAIA基准自由形式画像编辑

查看详情

字节跳动重磅发布BAGEL：MoE架构开源多模态模型性能领先同类多任务

字节跳动重磅发布BAGEL：MoE架构开源多模态模型性能领先同类多任务

AI妹 1 个月前 9 0

字節跳動Seed團隊在Hugging Face平臺重磅發佈BAGEL，一款基於混合專家（MoE）架構的開源多模態基礎模型，擁有14億總參數和7億活躍參數。BAGEL在數萬億token的交錯多模態數

内容创作 InternVL-2.5 双编码器设计 GitHub 多模态基础模型

查看详情

字节跳动开源70亿参数多模态模型BAGEL 性能超越主流视觉语言模型

字节跳动开源70亿参数多模态模型BAGEL 性能超越主流视觉语言模型

AI妹 1 个月前 10 0

字节跳动近日正式发布其最新开源多模态基础模型——BAGEL（Big Advanced Generalized Embodied Learner），以70亿个有效参数的规模，开启多模态AI模型的新阶

通用人工智能图像理解图像生成视觉语言模型开源多模态基础模型

查看详情

字节跳动发布70亿参数开源多模态模型BAGEL 性能超主流VLM生成能力强

字节跳动发布70亿参数开源多模态模型BAGEL 性能超主流VLM生成能力强

AI妹 1 个月前 9 0

字節跳動は最近、最新のオープンソース多モーダル基礎モデルである「BAGEL（Big Advanced Generalized Embodied Learner）」を正式に発表しました。70億個の有

下一个标记预测世界建模混合Transformer-专家结构 Discord VLM

查看详情

阿里千问视觉模型SpatialBench夺魁能力领先竞品且部分已开源

阿里千问视觉模型SpatialBench夺魁能力领先竞品且部分已开源

AI妹 1 个月前 15 0

阿里千问视觉模型在第三方空间推理榜单SpatialBench夺得前两名:Qwen3-VL13.5分、Qwen2.5-VL12.9分，大幅领先Gemini3.0Pro Preview（9.6分）与G

视觉编程分子生物学 Gemini2.5-Pro 密集模型 Gemini3.0Pro Preview

查看详情



资讯姬

文章数量9896

总阅读量87.79k

总评论量1

会员数量2

最新评论

emlog1 个月前

发表在：欢迎使用emlog

这是系统生成的演示评论

本站由emlog驱动