关闭导航

包含标签"GPQA Diamond测试"的内容

微软推送GPT-5.2:性能飞跃,Copilot迈入深度逻辑推理时代
AI妹 21 天前 9 0

| 微软今日宣布正式向网页、Windows 及移动端用户推送 OpenAI 迄今为止最强大的模型系列——GPT-5.2。作为一次极具诚意的免费升级,GPT-5.2将以“智能增强版”模式与现有的 G

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 9 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越