关闭导航

包含标签"逻辑推理"的内容

GPT-5.2将上线 强化编程推理与长程任务 同步研发新模型应对竞争
AI妹 4 个月前 23 0

近日,开发者社区流传出关于 GPT-5.2的消息,引发了广泛关注和讨论。有截图显示,Cursor IDE 的模型下拉菜单中出现了 “gpt-5.2” 和 “gpt-5.2-thinking” 的选

阿里通义Qwen团队推出SAPO强化学习新方法 提升大语言模型稳定性与性能
AI妹 4 个月前 18 0

在大语言模型(LLM)发展的浪潮中,阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 ——Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标