Humanity's Last Exam - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"Humanity\'s Last Exam"的内容

OpenSeeker-v2：纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源

OpenSeeker-v2：纯学术团队SFT训练超越工业模型的顶尖搜索智能体开源

AI妹 1 个月前 2 0

在当前的大模型（LLM）领域，深度搜索能力已成为顶尖智能体的“必杀技”。然而，这一赛道的游戏规则长期以来被资源雄厚的工业巨头所主导。传统的开发模式通常依赖于极其消耗资源的流水线，包括预训练、持续预

监督微调(SFT) OpenSeeker-v2 ReAct架构知识图谱工具集

查看详情

月之暗面发布开源Kimi K2.6 编程长程任务Agent协作能力显著跨越

月之暗面发布开源Kimi K2.6 编程长程任务Agent协作能力显著跨越

AI妹 1 个月前 4 0

国产大模型领域迎来重磅更新。4月21日，月之暗面（Moonshot AI）正式发布并开源了其最新旗舰模型 Kimi K2.6。这款模型在编程能力、长程任务处理以及多Agent(智能体)协作方面实现

Agent集群架构推理效率长程任务处理 gpt-5.4 Mac本地部署

查看详情

Meta正式推出Muse Spark个人超级智能模型多模态推理高效算力亮眼

Meta正式推出Muse Spark个人超级智能模型多模态推理高效算力亮眼

AI妹 2 个月前 5 0

北京时间4月9日，Meta 正式推出个人超级智能模型 Muse Spark，标志着其全新 Muse 系列模型首款产品落地。该模型原生支持多模态、深度推理、工具调用、视觉思维链及多 Agent 协同

Muse Spark 营养成分分析原生多模态架构 Contemplating模式 Llama4Maverick

查看详情

OpenAI发布GPT-5：解析特性价格版本能力及业界看法汇总

OpenAI发布GPT-5：解析特性价格版本能力及业界看法汇总

AI妹 5 个月前 21 0

AIBase | 2025年8月8日報道 2025年8月7日，OpenAI正式發佈了其最新一代人工智能模型GPT-5，這一發布標誌着生成式AI領域的又一里程碑。作爲OpenAI迄今爲止最強大

5000小时安全测试快速响应数学问题 SDK支持低成木模型

查看详情

GPT-5正式发布：特性、价格、能力解析及业界看法综合报道

GPT-5正式发布：特性、价格、能力解析及业界看法综合报道

AI妹 5 个月前 22 0

AIBase | 2025年8月8日报道 2025年8月7日，OpenAI正式发布了其最新一代人工智能模型GPT-5，这一发布标志着生成式AI领域的又一里程碑。作为OpenAI迄今为止最强大

正面评价 HealthBench Hard Sam Altman 幻觉率降低开发者API定价

查看详情

OpenAI发布GPT-5：能力升级与阶梯式价格体系详解

OpenAI发布GPT-5：能力升级与阶梯式价格体系详解

AI妹 5 个月前 20 0

AIBase | 2025年8月8日報道 2025年8月7日、OpenAIは最新の人工知能モデルであるGPT-5を正式に発表しました。このリリースは生成型AI分野における新たな出来事です。O

Microsoft GPT-5nano 並列ツール呼び出しマルチモーダル対応 Pro層

查看详情

谷歌发布基于Gemini3Pro的新Deep Research代理对抗AI幻觉与OpenAI激烈竞争

谷歌发布基于Gemini3Pro的新Deep Research代理对抗AI幻觉与OpenAI激烈竞争

AI妹 6 个月前 25 0

谷歌周四发布了基于最先进基础模型Gemini3Pro的"重新构想"版Gemini Deep Research研究代理。这款新型智能体不仅保留了生成研究报告的核心功能，更重要的是通过全新交互API，

Gemini Deep Research研究代理科技巨头AI竞争谷歌财经企业尽职调查 Humanity's Last Exam

查看详情



资讯姬

文章数量13598

总阅读量244.059k

总评论量0

会员数量2

本站由emlog驱动