多模态理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"多模态理解"的内容

字节跳动开源多模态模型BAGEL 70亿参数性能超顶尖支持图像生成编辑

字节跳动开源多模态模型BAGEL 70亿参数性能超顶尖支持图像生成编辑

AI妹 5 个月前 15 0

字節跳動は、70億のアクティブなパラメータを持ち、全体で140億のパラメータを持つオープンソースのマルチモーダル基礎モデル「BAGEL」を発表しました。 BAGELは、標準的なマルチモー

多模态生成 BAGEL 多模态推理图像生成字节跳动

查看详情

字节跳动开源多模态模型BAGEL：70亿参数性能卓越覆盖生成编辑

字节跳动开源多模态模型BAGEL：70亿参数性能卓越覆盖生成编辑

AI妹 5 个月前 16 0

字節跳動發佈了一款名爲 BAGEL 的開源多模態基礎模型，擁有70億個活躍參數，整體參數量達到140億。 BAGEL 在標準多模態理解基準測試中表現出色，超越了當前一些頂級開源視覺語言模型

混合变换器专家(MoT) 视觉变换器（ViT） 70亿活跃参数 InternVL-2.5 BAGEL

查看详情

TCL与阿里云全栈AI合作研发半导体显示大模型加速制造智能化升级

TCL与阿里云全栈AI合作研发半导体显示大模型加速制造智能化升级

AI妹 5 个月前 16 0

TCL 集团与阿里云达成全栈 AI 战略合作，聚焦半导体显示和智能终端领域，共同研发垂直行业专业大模型，加速制造业智能化转型。TCL 创始人李东生与阿里云 CEO 吴泳铭共同见证签约。此次合作

通义千问系列模型智能检索制造业智能化转型 TCL集团星智X-Intelligence

查看详情

MMaDA多模态大模型三大核心创新助力性能全面超越主流AI模型表现卓越

MMaDA多模态大模型三大核心创新助力性能全面超越主流AI模型表现卓越

AI妹 5 个月前 14 0

最近，普林斯顿大学、字节跳动、清华大学和北京大学联手搞了个大事情，推出了一款名为 MMaDA 的多模态大模型! 这可不是普通的 AI，它号称能让 AI 拥有“深度思考”的能力，还能在文本、图像、甚

LLAMA-3-7B Mixed Long CoT 扩散模型 Qwen2-7B 图像修复

查看详情

MMaDA多模态大模型：统一架构+三大黑科技，超越GPT-4等主流模型

MMaDA多模态大模型：统一架构+三大黑科技，超越GPT-4等主流模型

AI妹 5 个月前 17 0

最近，普林斯頓大學、字節跳動、清華大學和北京大學聯手搞了個大事情，推出了一款名爲 MMaDA 的多模態大模型! 這可不是普通的 AI，它號稱能讓 AI 擁有“深度思考”的能力，還能在文本、圖像、甚

混合长链式思考微调文本到图像生成北京大学 UniGRPO 多模態大模型

查看详情

MMaDA多模态大模型：三大黑科技赋能深思考性能超越GPT-4等

MMaDA多模态大模型：三大黑科技赋能深思考性能超越GPT-4等

AI妹 5 个月前 19 0

最近、プリンストン大学、字節跳動、清華大学、北京大学が協力して、多モーダル大規模モデルの「MMaDA」を発表しました！これは普通のAIではありません。このAIは「深い思考」を行う能力があり、テキス

MMaDA 文本推理论证多模态大模型扩散模型 Mixed Long CoT

查看详情

vivo发布BlueLM-2.5-3B边缘侧多模态模型高效且GUI理解能力优异

vivo发布BlueLM-2.5-3B边缘侧多模态模型高效且GUI理解能力优异

AI妹 5 个月前 18 0

最近、vivo AI Labは最新のエッジ側マルチモーダルモデルであるBlueLM-2.5-3Bを発表しました。このモデルはコンパクトで効率的であり、グラフィカルユーザーインターフェース（GUI）

文本处理能力中文应用截图数据 vivo AI Lab GUI理解 BlueLM-2.5-3B

查看详情

谷歌Gemini2.5Flash-Lite稳定版正式发布速度快成本低定价优势显著

谷歌Gemini2.5Flash-Lite稳定版正式发布速度快成本低定价优势显著

AI妹 5 个月前 20 0

近日，谷歌正式宣布其最新的 Gemini2.5Flash-Lite 模型已进入稳定版本（GA）。这一版本被称为是速度最快、成本最低的模型，标志着谷歌在人工智能领域的又一重要进展。Gemini2.5

Google搜索结合定价策略每百万输出token0.40美元 URL上下文功能 gemini-2.5-flash-lite

查看详情

谷歌Gemini2.5Flash-Lite稳定版发布低价高效支持百万token上下文

谷歌Gemini2.5Flash-Lite稳定版发布低价高效支持百万token上下文

AI妹 5 个月前 17 0

近日，谷歌正式宣佈其最新的 Gemini2.5Flash-Lite 模型已進入穩定版本（GA）。這一版本被稱爲是速度最快、成本最低的模型，標誌着谷歌在人工智能領域的又一重要進展。Gemini2.5

每百万输出0.4美元可控思考预算代码执行速度最快成本最低模型 Gemini2.5Flash-Lite

查看详情

WAIC2025生数科技发布Vidu Q1 参考生视频功能破商业化瓶颈

WAIC2025生数科技发布Vidu Q1 参考生视频功能破商业化瓶颈

AI妹 5 个月前 20 0

在WAIC2025世界人工智能大会上，生数科技重磅发布Vidu Q1"参考生视频"功能，通过算法创新彻底颠覆传统视频制作流程，为视频生成领域带来突破性进展。告别分镜，一键直出视频 "参考生视

参考生视频影视清华大学骆怡航扩散模型

查看详情

3



资讯姬

文章数量13543

总阅读量238.071k

总评论量0

会员数量2

本站由emlog驱动