关闭导航

包含标签"xbench"的内容

OpenSeeker-v2:纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源
AI妹 1 个月前 2 0

在当前的大模型(LLM)领域,深度搜索能力已成为顶尖智能体的“必杀技”。然而,这一赛道的游戏规则长期以来被资源雄厚的工业巨头所主导。传统的开发模式通常依赖于极其消耗资源的流水线,包括预训练、持续预

红杉中国发布新xbench AI基准测试工具 双轨评估及动态更新应对技术挑战
AI妹 5 个月前 21 0

With the rapid development of artificial intelligence technology, especially the continuous progre

红杉中国推出xbench AI基准测试工具 动态更新保障评估公正
AI妹 5 个月前 18 0

随着人工智能技术的迅速发展,尤其是大型模型的不断进步,基准测试在评估 AI 能力时面临着前所未有的挑战。为了应对这一现状,红杉中国于5月26日宣布推出一款全新的 AI 基准测试工具 ——xbenc

红杉中国推出xbench AI基准测试工具 动态更新应对迭代保障评估公正全面
AI妹 5 个月前 16 0

隨着人工智能技術的迅速發展,尤其是大型模型的不斷進步,基準測試在評估 AI 能力時面臨着前所未有的挑戰。爲了應對這一現狀,紅杉中國於5月26日宣佈推出一款全新的 AI 基準測試工具 ——xbenc

红杉中国发布新AI基准工具xbench 动态更新保障评估公平有效
AI妹 5 个月前 19 0

人工知能技術の急速な発展に伴い、特に大規模モデルの進化にともない、AI能力を評価するためのベンチマークテストはかつてない挑戦に直面しています。このような状況に対応するため、紅杉中国は5月26日、新