关闭导航

包含标签"逻辑推理"的内容

昆仑万维发布Skywork-R1V3.0开源多模态模型 MMMU评测领先闭源跨模态能力强
AI妹 1 个月前 10 0

近日,昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0,宣称在多模态推理方面达到了前所未有的高度,甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略,使得其在复杂

开源模型Skywork-R1V3.0多模态推理能力突出 MMMU得分领先闭源模型
AI妹 1 个月前 8 0

Recently, Kuaizhi Wanyi officially released its brand-new open-source model Skywork-R1V3.0, claimi

xAI发布Grok4:性能升级挑战顶尖模型,实时数据引争议
AI妹 1 个月前 11 0

xAI正式推出其最新旗艦AI模型Grok4,標誌着人工智能領域的又一重大突破。據官方消息,Grok4於太平洋時間7月9日晚8點通過xAI官方賬號的直播活動全球發佈,引發了業界和用戶的廣泛關注。AI

vivo發布BlueLM-2.5-3B端側多模態模型 具備GUI理解與優異推理能力
AI妹 1 个月前 7 0

近日,vivo AI Lab 發佈了其最新的端側多模態模型 ——BlueLM-2.5-3B。這款模型不僅小巧高效,更具備了理解圖形用戶界面(GUI)的能力,標誌着人工智能在處理文本和圖像方面邁出了

硅基流动上线月之暗面开源Kimi K2模型 1T参数128K上下文
AI妹 1 个月前 10 0

近日,硅基流动(SiliconCloud)平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T,激活参数为32B,在各项基准性能测试中表现不俗,能够与顶尖的商业模型相

Google DeepMind与伦敦大学研究揭示大语言模型面对反对意见容易放弃正确答案
AI妹 1 个月前 15 0

最近,Google DeepMind 與倫敦大學的研究揭示了大語言模型(LLMs)在面對反對意見時的 “軟弱” 表現。比如,像 GPT-4o 這樣的先進模型,有時會顯得非常自信,但一旦遇到質疑,它

科大讯飞星火X1升级版7月25日上线 综合幻觉治理多语言能力提升
AI妹 1 个月前 9 0

近日,科大訊飛通過其官方公衆號宣佈,備受關注的訊飛星火 X1升級版將於7月25日正式上線。這款深度推理大模型依託全國產算力進行訓練,升級後的星火 X1將爲用戶帶來一系列令人期待的功能和性能提升。

GPT-5.2将上线 强化编程推理与长程任务 同步研发新模型应对竞争
AI妹 1 个月前 17 0

近日,开发者社区流传出关于 GPT-5.2的消息,引发了广泛关注和讨论。有截图显示,Cursor IDE 的模型下拉菜单中出现了 “gpt-5.2” 和 “gpt-5.2-thinking” 的选

阿里通义Qwen团队推出SAPO强化学习新方法 提升大语言模型稳定性与性能
AI妹 1 个月前 15 0

在大语言模型(LLM)发展的浪潮中,阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 ——Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标