关闭导航

包含标签"基准测试"的内容

通义灵码Qwen3上线开源混合推理模型 支持主流IDE及多语言Agent能力升级
AI妹 4 个月前 21 0

通義靈碼團隊宣佈正式上線Qwen3,並開源了8款「混合推理模型」,這標誌着編程智能體的進一步發展。此次開源包括兩款MoE模型:Qwen3-235B-A22B(2350多億總參數、220多億激活參數

Moonshot AI开源Kimi-VL多模态模型 高效能处理长文档与多任务
AI妹 4 个月前 16 0

中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 4 个月前 17 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密

智谱发布GLM-4.5开源旗舰模型 专为Agent打造性能国产开源第一价格亲民
AI妹 4 个月前 15 0

近日,智谱正式推出了其最新旗舰模型 GLM-4.5,这款模型被称为 “专为 Agent 应用打造的基础模型”,并且在推理、代码生成以及智能体综合能力上达到了开源模型的 SOTA(State Of

阶跃AI“阶跃深研”上线:高效生成专业报告 测试表现行业领先
AI妹 4 个月前 14 0

階躍AI正式上線了其全新研究助手——“階躍深研”,該產品已在階躍AI App及stepfun.com平臺開放體驗,同時開啓內部邀請測試。這款智能工具專爲金融、諮詢、醫療、法律、政策及學術研究等領域

Qwen3开源发布:多模型性能卓越 支持119种语言助力全球研发
AI妹 4 个月前 16 0

在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。 此次发布的旗舰模型 Qwen3-235B-A22B

Mistral发布Medium3模型:性能媲美顶尖产品成本低 适配企业多场景
AI妹 4 个月前 16 0

Mistral 正式发布了其3系列中的中等量级模型 ——Medium3。该模型以其先进的性能和相对较低的运营成本,受到业界的广泛关注。Mistral 强调,Medium3不仅在性能上与市场上的顶尖

Mistral发布Medium3模型性能超竞品成本低企业适用
AI妹 4 个月前 15 0

Mistral 正式發佈了其3系列中的中等量級模型 ——Medium3。該模型以其先進的性能和相對較低的運營成本,受到業界的廣泛關注。Mistral 強調,Medium3不僅在性能上與市場上的頂尖

首个视觉语言模型统一基准IDP Leaderboard发布 评估多模型揭示文档处理挑战
AI妹 4 个月前 14 0

5月11日,智能文档处理领域迎来重大进展——首个针对视觉-语言模型的统一基准测试"IDP Leaderboard"正式推出。该基准通过16个数据集、9229份文档,全面评估了当前主流模型在OCR、

Anthropic撤回OpenAI云模型访问权 竞争与安全协作存争议
AI妹 4 个月前 15 0

『WIRED』雑誌の報道によると、AI企業のAnthropicはOpenAIがクラウドシリーズAIモデルへのアクセス権を撤回した。この決定は、人工知能分野における競合間の緊張関係が高まっていること