关闭导航

包含标签"GPQA测试"的内容

阿布扎TII发布Falcon H1R7B开源大模型 7亿参数打破越大越强传统
AI妹 14 天前 8 0

阿布扎技术创新研究院(TII)近期推出了全新的开源大型语言模型 ——Falcon H1R7B。这款模型在维持紧凑的7亿参数规模的同时,展现了行业领先的推理性能,显著挑战了 “越大越强” 的传统观念

OpenAI新推o3/o4-mini多模态模型 工具调用强性能卓越今起开放
AI妹 1 个月前 10 0

在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生

阿里通义千问Qwen3新模型开源 性能媲美GPT-4o等闭源且长文本处理提升
AI妹 1 个月前 8 0

7月30日,阿里巴巴的通義千問團隊正式推出了 Qwen3系列模型的最新成員 ——Qwen3-30B-A3B-Instruct-2507。這一全新的開源模型採用非思考模式(non-thinking

通义千问Qwen3-30B新模型开源 性能比肩GPT-4o等知名闭源模型
AI妹 1 个月前 9 0

7月30日,阿里巴巴的通义千问团队正式推出了 Qwen3系列模型的最新成员 ——Qwen3-30B-A3B-Instruct-2507。这一全新的开源模型采用非思考模式(non-thinking

OpenAI正式发布GPT-5模型 面向所有用户开放且多领域实力显著提升
AI妹 1 个月前 10 0

在今日凌晨的直播活动中,OpenAI正式推出了备受瞩目的GPT-5模型,宣称其为自家迄今为止最出色的模型,在编程、数学、写作、健康、视觉感知等多个领域均展现出顶尖实力。 OpenAI首席执行