在代理型 AI 熱潮持續升溫之際,企業檢索增強生成 (RAG) 依然扮演着至關重要的角色。近日,緊抓市場對代理日益增長的興趣,專注於企業級 AI 應用的 Cohere 發佈了其最新嵌入模型 Embed 4。該模型在 Embed 3 的多模態能力基礎上進行了顯著增強,尤其在處理非結構化數據方面表現突出,並擁有高達 128,000 個 token 的超長上下文窗口,理論上能夠爲約 200 頁的文檔生成嵌入。

性能躍升:更長上下文與多模態增強
Cohere 在官方博客中指出,現有嵌入模型在理解複雜的多模態企業數據方面存在天然缺陷,導致企業需要進行繁瑣的數據預處理才能獲得有限的準確性提升。Embed 4 的出現旨在解決這一痛點,助力企業及其員工高效挖掘隱藏在海量、難以搜索信息中的關鍵洞察。
企業級應用:安全高效,適用多種場景
據介紹,企業可以在虛擬私有云或內部技術堆棧上部署 Embed 4,以增強數據安全性。通過生成嵌入,企業能夠將各類文檔或其他數據轉化爲 RAG 用例所需的數值表示,供 AI 代理在響應用戶提示時進行參考,從而提高答案的準確性,避免“幻覺”現象。
Embed 4 聲稱在金融、醫療保健和製造業等監管嚴格的行業表現出色。Cohere 強調,該模型充分考慮了受監管行業的安全需求,並對企業級應用有着深刻的理解。此外,Embed 4 經過“嘈雜的現實世界數據”訓練,即使面對企業數據中常見的拼寫錯誤和格式問題,依然能夠保持較高的準確性。更值得一提的是,該模型在搜索掃描文檔和手寫文件方面表現優異,無需複雜的預處理流程,顯著節省了企業的時間和運營成本。Embed 4 的應用場景廣泛,涵蓋投資者演示、盡職調查文件、臨牀試驗報告、維修指南和產品文檔等。與之前的版本一樣,該模型支持超過 100 種語言。
Cohere 的客戶 Agora 已在其 AI 搜索引擎中採用 Embed 4,並發現該模型能夠有效展示相關產品。Agora 創始人 Param Jaggi 表示,電商數據複雜,包含圖像和多方面文本描述,而 Embed 4 能夠以統一的嵌入形式呈現產品,從而加快搜索速度並提高內部工具的效率。
賦能代理:提升準確性與效率
Cohere 認爲,Embed 4 等模型將極大地改善代理的應用場景,並有望成爲企業級代理和 AI 助手的“最佳搜索引擎”。該公司強調,Embed 4 不僅在跨數據類型的準確性方面表現強大,還具備企業級的效率,能夠擴展以滿足大型組織的需求,並能創建壓縮數據嵌入以降低存儲成本。
值得關注的是,Qodo 的 Qodo-Embed-1-1.5B 和 MongoDB 近期收購的 Voyage AI 的模型也屬於 Embed 4 的競爭對手。

emlog2 个月前
发表在:欢迎使用emlog这是系统生成的演示评论