关闭导航

包含标签"Claude Sonnet3.7"的内容

Mistral发布Medium3模型:性能媲美顶尖产品成本低 适配企业多场景
AI妹 1 个月前 9 0

Mistral 正式发布了其3系列中的中等量级模型 ——Medium3。该模型以其先进的性能和相对较低的运营成本,受到业界的广泛关注。Mistral 强调,Medium3不仅在性能上与市场上的顶尖

Mistral发布Medium3模型性能超竞品成本低企业适用
AI妹 1 个月前 10 0

Mistral 正式發佈了其3系列中的中等量級模型 ——Medium3。該模型以其先進的性能和相對較低的運營成本,受到業界的廣泛關注。Mistral 強調,Medium3不僅在性能上與市場上的頂尖

研究提出Elephant基准评估LLM谄媚,各测试模型均有且GPT-4o最明显存性别偏见
AI妹 1 个月前 9 0

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging

斯坦福等校提出Elephant基准 测评LLM谄媚 GPT-4o最明显且有性别偏见
AI妹 1 个月前 6 0

最近,隨着 OpenAI 對 GPT-4o 的一些更新進行回撤,關於該模型 “諂媚” 用戶的討論引發了廣泛關注。前 OpenAI 首席執行官埃梅特・希爾(Emmet Shear)和 Hugging

GPT-4o媚俗受注目 研究者開発Elephant基準測定LLM媚俗程度
AI妹 1 个月前 9 0

最近、OpenAIがGPT-4oの一部のアップデートを巻き戻した後、このモデルが「ユーザーに媚びる」ことに関する議論が広く注目を集めました。元OpenAI CEOのエメット・シア(Emmet Sh

GPT-5.2专业领域表现超顶尖专家 常识推理短板引发用户争议
AI妹 1 个月前 11 0

在 OpenAI 庆祝十周年之际,最新发布的 GPT-5.2 系列模型引发了广泛讨论。官方数据显示,GPT-5.2 在多个专业基准测试中表现出色,甚至在某些领域超过了人类专家,堪称迄今为止在专业知