关闭导航

包含标签"LMArena"的内容

LMArena陷信任危机 研究指排名偏袒大厂 平台否认相关指控
AI妹 1 个月前 10 0

 人工智能领域知名的公共基准测试平台LMArena近日遭遇信任危机。一项新的研究指出,该平台的排名系统存在偏袒OpenAI、谷歌和Meta等大型供应商的结构性问题,其不透明的流程和头部企

谷歌Gemini2.5Deep Think向AI Ultra用户开放 获IMO金牌并行思考技术领先
AI妹 1 个月前 8 0

近日,谷歌DeepMind宣布其最强大的AI模型Gemini2.5Deep Think正式向Google AI Ultra订阅用户开放。这一模型不仅在2025年国际数学奥林匹克(IMO)竞赛中摘得

GPT-5登顶LMArena六大核心领域居首 重塑AI行业竞争格局
AI妹 1 个月前 9 0

AIBase消息,OpenAI的GPT-5在权威AI模型评测平台LMArena中创造历史,以最高Arena得分登顶排行榜首位,超越Google Gemini2.5Pro和Anthropic Cla

GPT-5获LMArena历史最高得分登顶 六大核心领域领先竞品重塑AI格局
AI妹 1 个月前 9 0

AIBaseメッセージ、OpenAIのGPT-5が権威あるAIモデル評価プラットフォームLMArenaで歴史的な記録を樹立し、最高のArenaスコアを獲得してランキング首位に登場しました。Goog

GPT-5登頂LMArena排行榜 六大領域領先重塑AI競爭格局
AI妹 1 个月前 8 0

AIBase消息,OpenAI的GPT-5在權威AI模型評測平臺LMArena中創造歷史,以最高Arena得分登頂排行榜首位,超越Google Gemini2.5Pro和Anthropic Cla

Cursor发布GPT-5限定免费及CLI工具 提升开发者AI编码体验
AI妹 1 个月前 7 0

 CursorがGPT-5の限定無料利用を発表 Cursorの公式声明およびインターネット上の情報によると、Cursorは有料プランのユーザーに対して一定量のGPT-5の無料利用権限を

谷歌Gemini2.5下一代AI搜索引擎灰度测试 备战I/O2025
AI妹 1 个月前 10 0

隨着谷歌I/O開發者大會臨近(5月20日至21日),業界傳出重磅消息:谷歌正計劃推出基於Gemini2.5的下一代AI搜索引擎,全面替換傳統的搜索框界面。這一新模式已進入灰度測試階段,標誌着谷歌將

DeepSeek两款趣味性命名神秘新模型登陆LmArena引发AI社区热议及业界广泛期待
AI妹 1 个月前 10 0

知名AI模型評測平臺LmArena近日發佈重大更新,上線了兩款全新的DeepSeek模型,分別以"非常祕密且有趣的模型"和"高度機密且快樂的機器人"這樣極具趣味性的名稱命名。這一神祕發佈立即在AI

LmArena重大更新上线DeepSeek两款趣味神秘命名新模型引AI社区广泛热议
AI妹 1 个月前 10 0

知名AI模型评测平台LmArena近日发布重大更新,上线了两款全新的DeepSeek模型,分别以"非常秘密且有趣的模型"和"高度机密且快乐的机器人"这样极具趣味性的名称命名。这一神秘发布立即在AI

谷歌Gemini3Flash发布:首个反超Pro的Flash 性能顶尖响应快三倍全球免费开放
AI妹 1 个月前 13 0

谷歌再次改写大模型性能与成本的边界。今日,公司正式发布新一代轻量级模型 Gemini3Flash——不仅响应速度达到前代三倍、近乎“零延迟”,更在多项高难度基准测试中反超同代旗舰Gemini3Pr