关闭导航

包含标签" 记忆"的内容

MiniMax推出OctoCodingBench 评估编程智能体规则遵循能力
AI妹 6 天前 3 0

在人工智能领域的飞速发展中,编程智能体正逐渐成为开发者的重要助手。近日,AI 大模型公司 MiniMax 宣布推出一项全新的开源基准测试 ——OctoCodingBench,旨在评估编程智能体在代

新研究质疑阿里Qwen2.5数学高分:或因记忆训练数据而非真推理
AI妹 1 个月前 12 0

According to foreign media reports, a new study has raised doubts about the high math scores of Al