关闭导航

包含标签" 推論能力"的内容

清華・上海AI LabのGenPRM、少量データでGPT-4oを超える推論能力
AI妹 1 个月前 8 0

人工知能分野において、OpenAIのo1モデルとDeepSeekのR1モデルが注目を集める中、大規模言語モデル(LLM)の推論能力とテスト時拡張(TTS)技術は多くの研究者の関心を集めています。し

阿里通义WebShaper形式化驱动 GAIA测试超Claude3.5及GPT-4o开源领先
AI妹 1 个月前 9 0

アリババ・トンイラボ(Tongyi Lab)は最近、WebAgentシリーズの第4弾オープンソースツール「WebShaper」を発表しました。この画期的なフレームワークは、「形式化駆動型」という情

8月5-7日AIチェス選手権開催 トップAIモデルが推論能力を競う
AI妹 1 个月前 8 0

人工知能の分野において、将棋やチェスなどの戦略的なゲームはモデルの推論能力をテストする重要な舞台となっています。最近、Google DeepMindとKaggleは8月5日から7日にかけてAIチェ

Anthropic正式发布Claude4系列 编码推理能力显著升级获认证引行业关注与热议
AI妹 1 个月前 8 0

人工知能分野における先駆者であるAnthropicは、2025年5月22日に正式にClaude4シリーズモデルを発表しました。このシリーズにはClaude Opus4とClaude Sonnet4