关闭导航

包含标签"GPQA Diamond"的内容

Anthropic初开发者大会发布Claude4系列 激化与OpenAI等的AI竞争
AI妹 1 个月前 9 0

初開発者大会で、Anthropicは「業界最高水準」と称される2つのAIモデルを発表し、OpenAIやGoogleとの競争を激化させました。 Anthropicは木曜日に開催された初の開発者大

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 9 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

谷歌Gemini3Flash发布:首个反超Pro的Flash 性能顶尖响应快三倍全球免费开放
AI妹 1 个月前 13 0

谷歌再次改写大模型性能与成本的边界。今日,公司正式发布新一代轻量级模型 Gemini3Flash——不仅响应速度达到前代三倍、近乎“零延迟”,更在多项高难度基准测试中反超同代旗舰Gemini3Pr

    1 2