图像 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"图像"的内容

谷歌发布Gemini Omni多模态AI模型提升跨模态交互效率与实时性

谷歌发布Gemini Omni多模态AI模型提升跨模态交互效率与实时性

AI妹 20 天前 1 0

谷歌在 5 月 19 日正式发布了其最新的 Gemini Omni 模型，标志着其在人工智能领域的一次重大突破。作为 Gemini 模型家族的最新成员，Gemini Omni 将多模态技术提升到了

文本视频谷歌准确性 Gemini Omni

查看详情

谷歌发布Gemini Embedding2 支持多模态内容统一语义向量映射

谷歌发布Gemini Embedding2 支持多模态内容统一语义向量映射

AI妹 2 个月前 5 0

谷歌近日发布原生多模态嵌入模型 Gemini Embedding2，该模型可将文本、图像、视频、音频以及 PDF 文档统一映射到同一语义向量空间，旨在简化复杂的 AI 数据处理流程，并提升多模态检

原生音频处理语义搜索 pplx-embed-v1 单一文本语义表示图像

查看详情

谷歌推出Gemini Embedding2原生多模态嵌入模型实现跨媒体深度理解与高效检索

谷歌推出Gemini Embedding2原生多模态嵌入模型实现跨媒体深度理解与高效检索

AI妹 3 个月前 5 0

谷歌正式推出全新 Gemini Embedding2模型。作为谷歌首个原生多模态嵌入模型，它打破了传统模型仅支持单一数据类型的局限，能够将文本、图像、视频、音频和文档同时映射到同一个数学向量空间中

视频检索增强生成(RAG) 大规模数据聚类图像文档

查看详情

“万卷·丝绸之路2.0”多语言多模态语料库由上海AI所正式开源

“万卷·丝绸之路2.0”多语言多模态语料库由上海AI所正式开源

AI妹 5 个月前 14 0

上海人工知能研究所が公開した「万巻・シルクロード2.0」多言語多モーダル語料庫が正式にオープンソース化されました。この語料庫は、既存のアラビア語、ロシア語、韓国語、ベトナム語、タイ語の5言語に加え

文本塞尔维亚语 ms-swift 音声俄语

查看详情

商汤日日新V6多模态大模型：6000亿参数显技术优势与AI竞争潜力

商汤日日新V6多模态大模型：6000亿参数显技术优势与AI竞争潜力

AI妹 5 个月前 16 0

在过去的两年里，人工智能领域的关注点逐渐转向了大模型的技术发展，而商汤科技作为一家成立不到十年的公司，凭借其在计算机视觉领域的技术积累，正迅速转型，迎接这一浪潮。尽管在2023年之前，商汤主要聚焦

赛博朋克 Gemini2.0Pro Midjourney 6000亿参数多模态大模型理解与生成能力

查看详情

Claude artifacts功能升级支持多格式上传与AI应用深度协作

Claude artifacts功能升级支持多格式上传与AI应用深度协作

AI妹 5 个月前 16 0

近日，AI技术领域迎来一项重要更新。Claude artifacts（Claude神器）功能得到了进一步增强， пользователи(用户)如今可以上传PDF、图像、代码文件等多种格式的数据，

PDF 多格式数据上传 AI技术 Claude3.5Sonnet 多模态数据

查看详情

Claude artifacts功能升级：支持多格式上传及与AI应用深度协作

Claude artifacts功能升级：支持多格式上传及与AI应用深度协作

AI妹 5 个月前 20 0

近日，AI技術領域迎來一項重要更新。Claude artifacts（Claude神器）功能得到了進一步增強， пользователи(用戶)如今可以上傳PDF、圖像、代碼文件等多種格式的數據，

细节优化 PDF 代码文件图像 Claude artifacts

查看详情

腾讯开源WeKnora：多模态文档理解检索工具助力各行业高效信息处理

腾讯开源WeKnora：多模态文档理解检索工具助力各行业高效信息处理

AI妹 5 个月前 13 0

In the era of information explosion, processing complex documents has always been a challenge for

医疗知识助手模块化架构知识图谱 GitHub 多模态处理

查看详情

谷歌推出SynthID Detector 可识别自家AI生成内容并检测水印

谷歌推出SynthID Detector 可识别自家AI生成内容并检测水印

AI妹 5 个月前 15 0

谷歌最近在其 Google I/O 活動上宣佈了一款名爲 SynthID Detector 的新工具，旨在幫助用戶檢查內容是否由其 AI 工具生成。谷歌 DeepMind 的 Pushmeet

Pushmeet Kohli SynthID水印音频视频 Imagen

查看详情

谷歌发布开源框架LMEval，助力大语言多模态模型高效标准化评测工具

谷歌发布开源框架LMEval，助力大语言多模态模型高效标准化评测工具

AI妹 5 个月前 21 0

近日，谷歌正式發佈了開源框架 LMEval，旨在爲大語言模型（LLM）和多模態模型提供標準化的評測工具。這一框架的推出，不僅簡化了跨平臺模型性能比較，還支持文本、圖像和代碼等多領域的評估，展現了谷

标准化评测 AI行业透明化跨平台模型比较文本开源框架

查看详情

1



资讯姬

文章数量13527

总阅读量227.543k

总评论量0

会员数量2

本站由emlog驱动