关闭导航

包含标签"图像"的内容

谷歌发布Gemini Embedding2 支持多模态内容统一语义向量映射
AI妹 1 个月前 2 0

谷歌近日发布原生多模态嵌入模型 Gemini Embedding2,该模型可将文本、图像、视频、音频以及 PDF 文档统一映射到同一语义向量空间,旨在简化复杂的 AI 数据处理流程,并提升多模态检

谷歌推出Gemini Embedding2原生多模态嵌入模型 实现跨媒体深度理解与高效检索
AI妹 1 个月前 2 0

谷歌正式推出全新 Gemini Embedding2模型。作为谷歌首个原生多模态嵌入模型,它打破了传统模型仅支持单一数据类型的局限,能够将文本、图像、视频、音频和文档同时映射到同一个数学向量空间中

“万卷·丝绸之路2.0”多语言多模态语料库由上海AI所正式开源
AI妹 3 个月前 12 0

上海人工知能研究所が公開した「万巻・シルクロード2.0」多言語多モーダル語料庫が正式にオープンソース化されました。この語料庫は、既存のアラビア語、ロシア語、韓国語、ベトナム語、タイ語の5言語に加え

商汤日日新V6多模态大模型:6000亿参数显技术优势与AI竞争潜力
AI妹 3 个月前 13 0

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。尽管在2023年之前,商汤主要聚焦

Claude artifacts功能升级 支持多格式上传与AI应用深度协作
AI妹 3 个月前 14 0

近日,AI技术领域迎来一项重要更新。Claude artifacts(Claude神器)功能得到了进一步增强, пользователи(用户)如今可以上传PDF、图像、代码文件等多种格式的数据,

Claude artifacts功能升级:支持多格式上传及与AI应用深度协作
AI妹 3 个月前 17 0

近日,AI技術領域迎來一項重要更新。Claude artifacts(Claude神器)功能得到了進一步增強, пользователи(用戶)如今可以上傳PDF、圖像、代碼文件等多種格式的數據,

腾讯开源WeKnora:多模态文档理解检索工具助力各行业高效信息处理
AI妹 3 个月前 11 0

In the era of information explosion, processing complex documents has always been a challenge for

谷歌推出SynthID Detector 可识别自家AI生成内容并检测水印
AI妹 3 个月前 14 0

谷歌最近在其 Google I/O 活動上宣佈了一款名爲 SynthID Detector 的新工具,旨在幫助用戶檢查內容是否由其 AI 工具生成。 谷歌 DeepMind 的 Pushmeet

谷歌发布开源框架LMEval,助力大语言多模态模型高效标准化评测工具
AI妹 3 个月前 18 0

近日,谷歌正式發佈了開源框架 LMEval,旨在爲大語言模型(LLM)和多模態模型提供標準化的評測工具。這一框架的推出,不僅簡化了跨平臺模型性能比較,還支持文本、圖像和代碼等多領域的評估,展現了谷

vLLM发布全模态推理框架vLLM-Omni 解耦架构提效开源
AI妹 4 个月前 24 0

vLLM团队发布首个“全模态”推理框架vLLM-Omni,将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs,开发者可立即pip安装并调用