xbench - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"xbench"的内容

OpenSeeker-v2：纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源

OpenSeeker-v2：纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源

AI妹 1 个月前 2 0

在当前的大模型（LLM）领域，深度搜索能力已成为顶尖智能体的“必杀技”。然而，这一赛道的游戏规则长期以来被资源雄厚的工业巨头所主导。传统的开发模式通常依赖于极其消耗资源的流水线，包括预训练、持续预

BrowseComp-ZH 监督微调(SFT) 智能体开源 LLM

查看详情

红杉中国发布新xbench AI基准测试工具双轨评估及动态更新应对技术挑战

红杉中国发布新xbench AI基准测试工具双轨评估及动态更新应对技术挑战

AI妹 5 个月前 21 0

With the rapid development of artificial intelligence technology, especially the continuous progre

AGI AI benchmarking tool recruitment multimodal models GUI agents

查看详情

红杉中国推出xbench AI基准测试工具动态更新保障评估公正

红杉中国推出xbench AI基准测试工具动态更新保障评估公正

AI妹 5 个月前 18 0

随着人工智能技术的迅速发展，尤其是大型模型的不断进步，基准测试在评估 AI 能力时面临着前所未有的挑战。为了应对这一现状，红杉中国于5月26日宣布推出一款全新的 AI 基准测试工具 ——xbenc

红杉中国 xbench 智能体 AGI 多模态模型

查看详情

红杉中国推出xbench AI基准测试工具动态更新应对迭代保障评估公正全面

红杉中国推出xbench AI基准测试工具动态更新应对迭代保障评估公正全面

AI妹 5 个月前 16 0

隨着人工智能技術的迅速發展，尤其是大型模型的不斷進步，基準測試在評估 AI 能力時面臨着前所未有的挑戰。爲了應對這一現狀，紅杉中國於5月26日宣佈推出一款全新的 AI 基準測試工具 ——xbenc

AGI 题库泄露 xbench 刷榜双轨评估体系

查看详情

红杉中国发布新AI基准工具xbench 动态更新保障评估公平有效

红杉中国发布新AI基准工具xbench 动态更新保障评估公平有效

AI妹 5 个月前 19 0

人工知能技術の急速な発展に伴い、特に大規模モデルの進化にともない、AI能力を評価するためのベンチマークテストはかつてない挑戦に直面しています。このような状況に対応するため、紅杉中国は5月26日、新

AGI スマートエージェントマルチモーダルモデル二重軌道評価システム红杉中国

查看详情



资讯姬

文章数量13547

总阅读量240.914k

总评论量0

会员数量2

本站由emlog驱动