近日,OpenAI 發佈了一款名爲 HealthBench 的開源評估框架,旨在測量大型語言模型(LLMs)在真實醫療場景中的表現和安全性。此框架的開發得到了來自60個國家和26個醫學專業的262
According to The Science and Technology News on the STAR Market, the parent company of the intelli
The OpenBMB team recently announced the official open-source release of the new multimodal l
騰訊近日正式開源基於大語言模型的文檔理解與檢索工具WeKnora,這款專爲處理複雜多模態文檔設計的工具,爲企業知識管理、學術研究和行業應用提供了強大的技術底座,標誌着文檔處理技術向智能化和模塊化方
腾讯近日正式开源基于大语言模型的文档理解与检索工具WeKnora,这款专为处理复杂多模态文档设计的工具,为企业知识管理、学术研究和行业应用提供了强大的技术底座,标志着文档处理技术向智能化和模块化方
マイクロソフト研究院は、現在のAIエージェントシステムのトレーニングにおいて直面している汎用性と柔軟性の課題を解決することを目的とした新たな強化学習トレーニングフレームワーク「Agent Ligh
微軟研究院推出一款名爲Agent Lightning的全新強化學習訓練框架,旨在解決當前AI代理系統訓練過程中面臨的通用性和靈活性挑戰。該框架通過創新的解耦設計,能夠對不同架構的AI代理進行統一的
随着谷歌I/O开发者大会临近(5月20日至21日),业界传出重磅消息:谷歌正计划推出基于Gemini2.5的下一代AI搜索引擎,全面替换传统的搜索框界面。这一新模式已进入灰度测试阶段,标志着谷歌将
谷歌宣布正式向全球所有用户推出Gemini网页版对话搜索功能,标志着其基于Gemini2.5的AI搜索体验进入全面普及阶段。这一功能允许用户通过自然语言进行多轮对话式搜索,取代传统关键词查询,提供
微軟和Salesforce聯合研究發現,即使是最先進的AI語言模型在長時間對話中也會出現嚴重的可靠性問題。當用戶逐步表達需求時,系統性能平均下降39%,這一發現對AI助手的實際應用提出了重要警示。
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论