关闭导航

包含标签"基准测试"的内容

昆仑万维发布开源推理大模型Skywork MindLink表现优异性能卓越获多项测试冠军
AI妹 4 个月前 15 0

昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink,同时公布了72B模型权重、技术报告及代码仓库链接,引发行业广泛关注。 该模型通过创新性推理框架实现动态路径选择,可根据任

昆仑万维正式发布并开源Skywork MindLink推理大模型 基准测试获多项金牌引关注
AI妹 4 个月前 14 0

崑崙萬維正式發佈並開源了其最新推理大模型Skywork MindLink,同時公佈了72B模型權重、技術報告及代碼倉庫鏈接,引發行業廣泛關注。 該模型通過創新性推理框架實現動態路徑選擇,可根據任

Anthropic取消OpenAI对Claude访问 双方就服务条款争议各执一词
AI妹 4 个月前 12 0

Anthropic宣布已取消 OpenAI 对其 Claude 系列人工智能模型的访问权限。这一消息最早由《连线》杂志报道,消息人士透露,OpenAI 此前通过内部工具连接 Claude,以比较其

Anthropic以违反条款为由取消OpenAI Claude访问权 OpenAI称合规表失望
AI妹 4 个月前 11 0

Anthropic宣佈已取消 OpenAI 對其 Claude 系列人工智能模型的訪問權限。這一消息最早由《連線》雜誌報道,消息人士透露,OpenAI 此前通過內部工具連接 Claude,以比較其

通义千问开源Qwen-Image 图像生成模型技术突破与多场景应用
AI妹 4 个月前 16 0

通義千問は8月5日に、初めての画像生成基礎モデル「Qwen-Image」をオープンソースとしてリリースしました。この20Bパラメータを持つMMDiT(マルチモーダルディフュージョントランスフォーマ

字节跳动Seed1.5-VL多模态模型发布 性能对标Gemini2.5Pro仍存课题
AI妹 4 个月前 14 0

今日ますます激化する人工知能分野において、字節跳動の Seed チームは5月13日に正式に、最新のマルチモーダル大規模モデル「Seed1.5-VL」を発表しました。このモデルは、知能エージェント技

OpenAI打破非开源主义 发布两款GPT-oss开源语言模型
AI妹 4 个月前 11 0

OpenAIは2020年以来の非開源主義を打ち破り、正式に2つのオープンソース言語モデルであるGPT-oss-120bとGPT-oss-20bをリリースしました。この取り組みは、このAI大手がビジ

英伟达发布Cosmos-Reason1系列模型 提升AI物理推理及具身能力
AI妹 4 个月前 15 0

近日,英偉達發佈了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常識和具身推理方面的能力。隨着人工智能在語言處理、數學及代碼生成等領域取得顯著進展,如何將這些能力擴展到物理

英伟达Cosmos-Reason1模型增强AI物理与具身推理
AI妹 4 个月前 19 0

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理

红杉中国推出xbench AI基准测试工具 动态更新保障评估公正
AI妹 4 个月前 14 0

随着人工智能技术的迅速发展,尤其是大型模型的不断进步,基准测试在评估 AI 能力时面临着前所未有的挑战。为了应对这一现状,红杉中国于5月26日宣布推出一款全新的 AI 基准测试工具 ——xbenc