关闭导航

包含标签"图像"的内容

“万卷·丝绸之路2.0”多语言多模态语料库由上海AI所正式开源
AI妹 1 个月前 9 0

上海人工知能研究所が公開した「万巻・シルクロード2.0」多言語多モーダル語料庫が正式にオープンソース化されました。この語料庫は、既存のアラビア語、ロシア語、韓国語、ベトナム語、タイ語の5言語に加え

商汤日日新V6多模态大模型:6000亿参数显技术优势与AI竞争潜力
AI妹 1 个月前 9 0

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。尽管在2023年之前,商汤主要聚焦

Claude artifacts功能升级 支持多格式上传与AI应用深度协作
AI妹 1 个月前 9 0

近日,AI技术领域迎来一项重要更新。Claude artifacts(Claude神器)功能得到了进一步增强, пользователи(用户)如今可以上传PDF、图像、代码文件等多种格式的数据,

Claude artifacts功能升级:支持多格式上传及与AI应用深度协作
AI妹 1 个月前 10 0

近日,AI技術領域迎來一項重要更新。Claude artifacts(Claude神器)功能得到了進一步增強, пользователи(用戶)如今可以上傳PDF、圖像、代碼文件等多種格式的數據,

腾讯开源WeKnora:多模态文档理解检索工具助力各行业高效信息处理
AI妹 1 个月前 7 0

In the era of information explosion, processing complex documents has always been a challenge for

谷歌推出SynthID Detector 可识别自家AI生成内容并检测水印
AI妹 1 个月前 8 0

谷歌最近在其 Google I/O 活動上宣佈了一款名爲 SynthID Detector 的新工具,旨在幫助用戶檢查內容是否由其 AI 工具生成。 谷歌 DeepMind 的 Pushmeet

谷歌发布开源框架LMEval,助力大语言多模态模型高效标准化评测工具
AI妹 1 个月前 10 0

近日,谷歌正式發佈了開源框架 LMEval,旨在爲大語言模型(LLM)和多模態模型提供標準化的評測工具。這一框架的推出,不僅簡化了跨平臺模型性能比較,還支持文本、圖像和代碼等多領域的評估,展現了谷

vLLM发布全模态推理框架vLLM-Omni 解耦架构提效开源
AI妹 1 个月前 18 0

vLLM团队发布首个“全模态”推理框架vLLM-Omni,将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs,开发者可立即pip安装并调用