关闭导航

包含标签"Humanity\'s Last Exam"的内容

OpenSeeker-v2:纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源
AI妹 1 个月前 2 0

在当前的大模型(LLM)领域,深度搜索能力已成为顶尖智能体的“必杀技”。然而,这一赛道的游戏规则长期以来被资源雄厚的工业巨头所主导。传统的开发模式通常依赖于极其消耗资源的流水线,包括预训练、持续预

月之暗面发布开源Kimi K2.6 编程长程任务Agent协作能力显著跨越
AI妹 1 个月前 4 0

国产大模型领域迎来重磅更新。4月21日,月之暗面(Moonshot AI)正式发布并开源了其最新旗舰模型 Kimi K2.6。这款模型在编程能力、长程任务处理以及多Agent(智能体)协作方面实现

Meta正式推出Muse Spark个人超级智能模型 多模态推理高效算力亮眼
AI妹 2 个月前 5 0

北京时间4月9日,Meta 正式推出个人超级智能模型 Muse Spark,标志着其全新 Muse 系列模型首款产品落地。该模型原生支持多模态、深度推理、工具调用、视觉思维链及多 Agent 协同

OpenAI发布GPT-5:解析特性价格版本能力及业界看法汇总
AI妹 5 个月前 21 0

AIBase | 2025年8月8日報道 2025年8月7日,OpenAI正式發佈了其最新一代人工智能模型GPT-5,這一發布標誌着生成式AI領域的又一里程碑。作爲OpenAI迄今爲止最強大

GPT-5正式发布:特性、价格、能力解析及业界看法综合报道
AI妹 5 个月前 22 0

AIBase | 2025年8月8日报道 2025年8月7日,OpenAI正式发布了其最新一代人工智能模型GPT-5,这一发布标志着生成式AI领域的又一里程碑。作为OpenAI迄今为止最强大

OpenAI发布GPT-5:能力升级与阶梯式价格体系详解
AI妹 5 个月前 20 0

AIBase | 2025年8月8日報道 2025年8月7日、OpenAIは最新の人工知能モデルであるGPT-5を正式に発表しました。このリリースは生成型AI分野における新たな出来事です。O

谷歌发布基于Gemini3Pro的新Deep Research代理 对抗AI幻觉与OpenAI激烈竞争
AI妹 6 个月前 25 0

谷歌周四发布了基于最先进基础模型Gemini3Pro的"重新构想"版Gemini Deep Research研究代理。这款新型智能体不仅保留了生成研究报告的核心功能,更重要的是通过全新交互API,