数学推理 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"数学推理"的内容

Harmonic推出亚里士多德AI机器人数学推理无幻觉并获1亿B轮融资

Harmonic推出亚里士多德AI机器人数学推理无幻觉并获1亿B轮融资

AI妹 5 个月前 18 0

Harmonic 是一家由 Robinh ood CEO 弗拉德・特涅夫（Vlad Tenev）共同創辦的人工智能初創公司，近日宣佈推出其 iOS 和 Android 平臺的 AI 聊天機器人應用

IMO 数学推理 API 形式验证 iOS应用

查看详情

DeepSeek-Prover-V2：数学推理新突破，AGI关键一步及ProverBench数据集发布

DeepSeek-Prover-V2：数学推理新突破，AGI关键一步及ProverBench数据集发布

AI妹 5 个月前 16 0

在人工智能领域，最近一项重磅技术发布引发广泛关注 ——DeepSeek-Prover-V2。这一模型不仅在推理性能上取得了显著提升，还被誉为通向人工通用智能（AGI）的关键一步。DeepSeek-

671B参数模型 32K上下文长度 AGI 递归与强化学习 DeepSeek-Prover-V2

查看详情

DeepSeek-Prover-V2：创新训练方法，提升数学推理，迈向AGI关键一步

DeepSeek-Prover-V2：创新训练方法，提升数学推理，迈向AGI关键一步

AI妹 5 个月前 20 0

在人工智能領域，最近一項重磅技術發佈引發廣泛關注 ——DeepSeek-Prover-V2。這一模型不僅在推理性能上取得了顯著提升，還被譽爲通向人工通用智能（AGI）的關鍵一步。DeepSeek-

递归与强化学习 671B参数模型 DeepSeek-Prover-V2 数学推理 AIME竞赛

查看详情

阿里通义千问Qwen3新模型开源性能媲美GPT-4o等闭源且长文本处理提升

阿里通义千问Qwen3新模型开源性能媲美GPT-4o等闭源且长文本处理提升

AI妹 5 个月前 15 0

7月30日，阿里巴巴的通義千問團隊正式推出了 Qwen3系列模型的最新成員 ——Qwen3-30B-A3B-Instruct-2507。這一全新的開源模型採用非思考模式（non-thinking

Arena-Hard v2 GPQA测试非思考模式 Qwen3-30B-A3B-Instruct-2507 长文本处理256K

查看详情

通义千问Qwen3-30B新模型开源性能比肩GPT-4o等知名闭源模型

通义千问Qwen3-30B新模型开源性能比肩GPT-4o等知名闭源模型

AI妹 5 个月前 17 0

7月30日，阿里巴巴的通义千问团队正式推出了 Qwen3系列模型的最新成员 ——Qwen3-30B-A3B-Instruct-2507。这一全新的开源模型采用非思考模式（non-thinking

计算成本降低 Qwen3系列代码生成 GPQA测试非思考模式

查看详情

谷歌Gemini2.5Deep Think开放订阅获IMO金牌展跨领域强推理能力

谷歌Gemini2.5Deep Think开放订阅获IMO金牌展跨领域强推理能力

AI妹 5 个月前 19 0

近日，谷歌DeepMind宣佈其最強大的AI模型Gemini2.5Deep Think正式向Google AI Ultra訂閱用戶開放。這一模型不僅在2025年國際數學奧林匹克（IMO）競賽中摘得

AI模型基准测试数学推理跨领域知识 LiveCodeBench V6 2025国际数学奥林匹克(IMO)

查看详情

Self-Refine方法：驱动大语言模型自我优化多任务输出质量平均提升20%

Self-Refine方法：驱动大语言模型自我优化多任务输出质量平均提升20%

AI妹 5 个月前 16 0

Self-Refine方法因其通過自我批評與反思顯著提升大語言模型（LLM）輸出質量，再度成爲AI研究熱點(https://arxiv.org/abs/2303.17651)。這一創新框架讓單一L

简单性三步循环 Self-Refine 自给自足设计 Chain-of-Thought

查看详情

MiniCPM-V4.0开源：轻量高性能多模态模型开启手机AI应用新篇章

MiniCPM-V4.0开源：轻量高性能多模态模型开启手机AI应用新篇章

AI妹 5 个月前 17 0

The OpenBMB team recently announced the official open-source release of the new multimodal l

iOS app Cookbook SigLIP2-400M 4.1B参数轻量化模型

查看详情

GPT-5登顶LMArena六大核心领域居首重塑AI行业竞争格局

GPT-5登顶LMArena六大核心领域居首重塑AI行业竞争格局

AI妹 5 个月前 16 0

AIBase消息，OpenAI的GPT-5在权威AI模型评测平台LMArena中创造历史，以最高Arena得分登顶排行榜首位，超越Google Gemini2.5Pro和Anthropic Cla

Google Gemini2.5Pro 创意能力通用智能困难提示处理视觉任务

查看详情

GPT-5获LMArena历史最高得分登顶六大核心领域领先竞品重塑AI格局

GPT-5获LMArena历史最高得分登顶六大核心领域领先竞品重塑AI格局

AI妹 5 个月前 15 0

AIBaseメッセージ、OpenAIのGPT-5が権威あるAIモデル評価プラットフォームLMArenaで歴史的な記録を樹立し、最高のArenaスコアを獲得してランキング首位に登場しました。Goog

GPT-5 视觉任务竞争格局数学推理创造力

查看详情

4



资讯姬

文章数量13543

总阅读量238.009k

总评论量0

会员数量2

本站由emlog驱动