关闭导航

包含标签"推理能力"的内容

WSU研究:ChatGPT处理复杂科学论断准确率低且前后矛盾需谨慎
AI妹 27 天前 1 0

华盛顿州立大学(WSU)近日发布的一项研究揭示,尽管 ChatGPT 的回答语气充满自信,但在处理复杂科学论断时,其表现更接近于“随机猜测”。研究指出,该模型不仅准确率有限,而且在面对同一问题时经

腾讯混元3.0大模型4月正式发布 强力升级+龙虾革命构建AI交互新生态
AI妹 27 天前 2 0

在 AI 赛道的长跑中, 腾讯 正在以前所未有的力度加速冲刺。据最新消息,在3月18日下午的财报会议上, 腾讯 官方透露,新一代

腾讯确认稳步推进微信AI智能体 生态联通与技术挑战成研发核心方向
AI妹 27 天前 1 0

在 3 月 18 日举行的腾讯财报电话会议上,腾讯总裁刘炽平正式回应了关于“微信 AI 智能体”的研发传闻。他确认,腾讯正稳步推进这款深度嵌入微信生态的 AI 产品,旨在通过对话式交互,为 14

英伟达300亿或为OpenAI最后投资 IPO在即双方专属算力紧密合作存微妙博弈
AI妹 1 个月前 2 0

英伟达(NVIDIA)首席执行官黄仁勋近日在摩根士丹利举办的科技、媒体与电信大会上,就外界高度关注的投资传闻给出了明确回应。他表示,英伟达近期向 OpenAI 注入的300亿美元资金“很可能是最后

OpenAI 2月5日发布GPT-5.3-Codex,性能升级并招聘工程师扩大市场影响

(注:标题涵盖核心要素:主体OpenAI、时间2月5日、产品GPT-5.3-Codex、性能升级、招聘动作及市场目标,符合30字左右要求)
AI妹 2 个月前 90 0

当地时间 2 月 5 日,OpenAI 推出了其最新的编码模型 ——GPT-5.3-Codex。这款模型在之前的版本 GPT-5.2-Codex 的基础上进行了重大升级,不仅提升了编码性能,还融合

人类终极考试HLE:最新一代AI如GPT-4o面对专业难题真实能力不足
AI妹 2 个月前 68 0

最近一项名为 “人类终极考试”(HLE)的测试结果让我们重新审视 AI 的真实能力。根据《自然》杂志的报道,GPT-4o 在这 2500 道由全球专家出题的测试中,仅获得了可怜的 2.7 分(满分

Sam Altman警示AI代理安全风险 GPT-5舍文采求逻辑 OpenAI首放缓员工增长
AI妹 2 个月前 31 0

OpenAI 首席执行官 Sam Altman 近日在开发者交流中发出严厉警告,称 AI 代理的强大功能与极高便利性,正诱使人类在缺乏安全基础设施的情况下赋予其过高控制权。奥特曼甚至以身说法,承认

深度求索拟推DeepSeek-V4 增强代码能力及长上下文处理且超Claude与GPT系列
AI妹 3 个月前 14 0

据《The Information》报道,深度求索计划于2月中旬(农历新年前后)推出其下一代旗舰大模型 DeepSeek-V4。此款新模型旨在显著增强代码生成和长代码上下文处理能力,为开发者提供更

AI赛道热度飙升 MiniMax上市暴涨 资本青睐技术商业化潜力企业
AI妹 3 个月前 27 0

人工智能赛道在资本市场的热度达到新高点。一边是A股AI大模型概念股全线飘红,引力传媒强势涨停,易点天下盘中触及20%的创业板涨停板,润泽科技涨幅超15%,天龙集团、电广传媒、博瑞传播等多只个股涨幅

清华上海AI Lab提出GenPRM 大幅提升大模型过程监督推理能力
AI妹 3 个月前 16 0

在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题