图像理解 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"图像理解"的内容

昆仑万维开源Skywork UniPic轻量多模态模型集成理解生成编辑三大功能

昆仑万维开源Skywork UniPic轻量多模态模型集成理解生成编辑三大功能

AI妹 5 个月前 34 0

昆仑万维正式推出了自回归路线的「多模态统一预训练模型 Skywork UniPic」，并将其开源。这款模型在一个系统中集成了图像理解、文本生成图像（T2I）和图像编辑三大核心功能，标志着人工智能技

GPT-4o范式指令遵循开源图像理解数据构建

查看详情

昆仑万维开源Skywork UniPic多模态模型 1.5B轻量集成图像功能高性能

昆仑万维开源Skywork UniPic多模态模型 1.5B轻量集成图像功能高性能

AI妹 5 个月前 16 0

崑崙萬維正式推出了自迴歸路線的「多模態統一預訓練模型 Skywork UniPic」，並將其開源。這款模型在一個系統中集成了圖像理解、文本生成圖像（T2I）和圖像編輯三大核心功能，標誌着人工智能技

端到端预训练轻量级模型开源多阶段训练自回归路线

查看详情

腾讯发布X-Omni多模态AI模型图像生成理解与长文本渲染实现突破

腾讯发布X-Omni多模态AI模型图像生成理解与长文本渲染实现突破

AI妹 5 个月前 18 0

騰訊研究團隊發佈了全新的多模態AI模型X-Omni，該模型在圖像生成和理解領域實現了重大突破，特別是在長文本渲染方面表現出色，有效解決了傳統AI模型在圖片文字生成中的準確性問題。長期以來，AI

腾讯研究团队图像理解统一多模态建模分类器自由引导技术长文本渲染

查看详情

腾讯X-Omni多模态AI模型长文渲染获关键突破性能优于GPT-4o等主流模型

腾讯X-Omni多模态AI模型长文渲染获关键突破性能优于GPT-4o等主流模型

AI妹 5 个月前 16 0

騰訊の研究チームは、新たなマルチモーダルAIモデルX-Omniを発表しました。このモデルは、画像生成と理解の分野で大きな突破を遂げており、特に長文レンダリングにおいて優れた性能を発揮し、従来のAI

强化学习 LLaVA-One Vision 分类器自由引导技术长文渲染 GPT-4o

查看详情

腾讯X-Omni多模态AI模型：图像生成理解突破，长文本渲染精准高效领先

腾讯X-Omni多模态AI模型：图像生成理解突破，长文本渲染精准高效领先

AI妹 5 个月前 17 0

Tencent research team has released a new multimodal AI model, X-Omni, which has achieved significa

腾讯多模态AI模型 OCRBench 离散自回归模型统一建模 Unified Reward

查看详情

腾讯X-Omni多模态AI模型：图像生成理解与长文本渲染实现重大突破

腾讯X-Omni多模态AI模型：图像生成理解与长文本渲染实现重大突破

AI妹 5 个月前 14 0

腾讯研究团队发布了全新的多模态AI模型X-Omni，该模型在图像生成和理解领域实现了重大突破，特别是在长文本渲染方面表现出色，有效解决了传统AI模型在图片文字生成中的准确性问题。长期以来，AI

多模态AI模型图像理解分类器自由引导技术长文本渲染语义图像分词器

查看详情

OpenAI o4-mini携强化微调上线低数据降门槛加速AI专业领域转型

OpenAI o4-mini携强化微调上线低数据降门槛加速AI专业领域转型

AI妹 5 个月前 25 0

5月8日，OpenAI o4-mini攜強化微調正式上線。這兩項技術的結合徹底改變了AI專業化的成本結構和技術門檻，讓企業能以少量訓練數據將通用AI迅速轉變爲特定領域的專家系統。從通用智能到專

监督式微调 SWE-bench Verified 法规解读评分器金融领域应用

查看详情

OpenAI o4-mini携强化微调上线低数据定制专家AI降低成本门槛

OpenAI o4-mini携强化微调上线低数据定制专家AI降低成本门槛

AI妹 5 个月前 20 0

5月8日，OpenAI o4-mini携强化微调正式上线。这两项技术的结合彻底改变了AI专业化的成本结构和技术门槛，让企业能以少量训练数据将通用AI迅速转变为特定领域的专家系统。从通用智能到专

工具调用定制化模型代码执行低数据需求图像理解

查看详情

苹果FastVLM模型：解决VLMs高分辨率痛点速度提升85倍性能更优异且高效。

苹果FastVLM模型：解决VLMs高分辨率痛点速度提升85倍性能更优异且高效。

AI妹 5 个月前 17 0

蘋果最近又搞了個大新聞，偷偷摸摸地發佈了一個叫 FastVLM 的模型。聽名字可能有點懵，但簡單來說，這玩意兒就是讓你的 iPhone 瞬間擁有了“火眼金睛”，不僅能看懂圖片裏的各種複雜信息，還能

两阶段训练法 DocVQA 苹果 TextVQA FastVLM

查看详情

腾讯混元推出统一多模态奖励模型并宣布全面开源

腾讯混元推出统一多模态奖励模型并宣布全面开源

AI妹 5 个月前 16 0

近日，騰訊混元在與上海 AI Lab、復旦大學及上海創智學院的合作下，正式推出了全新研究成果 —— 統一多模態獎勵模型（Unified Reward-Think），並宣佈全面開源。這一創新模型不僅

长链推理能力图像生成开源评测工具 Unified Reward-Think

查看详情

2



资讯姬

文章数量13543

总阅读量238.009k

总评论量0

会员数量2

本站由emlog驱动