关闭导航

包含标签"刷榜"的内容

Meta Llama4数据美化丑闻致声誉受损 AI帝国未来走向成业界焦点
AI妹 8 天前 6 0

近日,Meta 的 Llama 4 项目曝出重大丑闻,前首席科学家杨立昆(Yann LeCun)在采访中承认,团队为了优化基准测试结果,确实对数据进行了 “美化”。这种行为引发了广泛的争议,显示出

中国网信办2025年7月24日起开展两个月专项行动打击自媒体虚假信息
AI妹 1 个月前 9 0

The Cyberspace Administration of China announced that starting from July 24, 2025, a two-month spe

红杉中国推出xbench AI基准测试工具 动态更新应对迭代保障评估公正全面
AI妹 1 个月前 10 0

隨着人工智能技術的迅速發展,尤其是大型模型的不斷進步,基準測試在評估 AI 能力時面臨着前所未有的挑戰。爲了應對這一現狀,紅杉中國於5月26日宣佈推出一款全新的 AI 基準測試工具 ——xbenc