关闭导航

包含标签"图像理解"的内容

昆仑万维开源Skywork UniPic多模态模型 1.5B轻量集成图像功能高性能
AI妹 1 个月前 10 0

崑崙萬維正式推出了自迴歸路線的「多模態統一預訓練模型 Skywork UniPic」,並將其開源。這款模型在一個系統中集成了圖像理解、文本生成圖像(T2I)和圖像編輯三大核心功能,標誌着人工智能技

腾讯发布X-Omni多模态AI模型 图像生成理解与长文本渲染实现突破
AI妹 1 个月前 11 0

騰訊研究團隊發佈了全新的多模態AI模型X-Omni,該模型在圖像生成和理解領域實現了重大突破,特別是在長文本渲染方面表現出色,有效解決了傳統AI模型在圖片文字生成中的準確性問題。 長期以來,AI

腾讯X-Omni多模态AI模型长文渲染获关键突破 性能优于GPT-4o等主流模型
AI妹 1 个月前 9 0

騰訊の研究チームは、新たなマルチモーダルAIモデルX-Omniを発表しました。このモデルは、画像生成と理解の分野で大きな突破を遂げており、特に長文レンダリングにおいて優れた性能を発揮し、従来のAI

腾讯X-Omni多模态AI模型:图像生成理解突破,长文本渲染精准高效领先
AI妹 1 个月前 8 0

Tencent research team has released a new multimodal AI model, X-Omni, which has achieved significa

腾讯X-Omni多模态AI模型:图像生成理解与长文本渲染实现重大突破
AI妹 1 个月前 9 0

腾讯研究团队发布了全新的多模态AI模型X-Omni,该模型在图像生成和理解领域实现了重大突破,特别是在长文本渲染方面表现出色,有效解决了传统AI模型在图片文字生成中的准确性问题。 长期以来,AI

OpenAI o4-mini携强化微调上线 低数据降门槛加速AI专业领域转型
AI妹 1 个月前 12 0

5月8日,OpenAI o4-mini攜強化微調正式上線。這兩項技術的結合徹底改變了AI專業化的成本結構和技術門檻,讓企業能以少量訓練數據將通用AI迅速轉變爲特定領域的專家系統。 從通用智能到專

OpenAI o4-mini携强化微调上线 低数据定制专家AI降低成本门槛
AI妹 1 个月前 11 0

5月8日,OpenAI o4-mini携强化微调正式上线。这两项技术的结合彻底改变了AI专业化的成本结构和技术门槛,让企业能以少量训练数据将通用AI迅速转变为特定领域的专家系统。 从通用智能到专

苹果FastVLM模型:解决VLMs高分辨率痛点 速度提升85倍性能更优异且高效。
AI妹 1 个月前 9 0

蘋果最近又搞了個大新聞,偷偷摸摸地發佈了一個叫 FastVLM 的模型。聽名字可能有點懵,但簡單來說,這玩意兒就是讓你的 iPhone 瞬間擁有了“火眼金睛”,不僅能看懂圖片裏的各種複雜信息,還能

腾讯混元推出统一多模态奖励模型并宣布全面开源
AI妹 1 个月前 8 0

近日,騰訊混元在與上海 AI Lab、復旦大學及上海創智學院的合作下,正式推出了全新研究成果 —— 統一多模態獎勵模型(Unified Reward-Think),並宣佈全面開源。這一創新模型不僅

MiniCPM-V4.0多模态模型正式开源:4B参数端侧流畅同级SOTA
AI妹 1 个月前 10 0

 魔搭ModelScope社区宣布,面壁小钢炮新一代多模态模型MiniCPM-V4.0正式开源。凭借4B参数量,该模型在OpenCompass、OCRBench、MathVista等多个