关闭导航

包含标签"逻辑推理"的内容

百度文心大模型X1Turbo成国内首个获信通院4+最高评级 多项能力满分
AI妹 4 个月前 14 0

在5月20日舉行的百度 AI Day 上,中國信息通信研究院(信通院)公佈了最新的大模型推理能力評估結果,令衆多科技愛好者爲之振奮。百度的文心大模型 X1Turbo 成爲國內首個獲得 “4+ 級”

百度文心大模型X1Turbo获信通院国内首个4+级最高推理能力评级
AI妹 4 个月前 16 0

在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。百度的文心大模型 X1Turbo 成为国内首个获得 “4+ 级”

云从科技从容V2.0以80.7分登顶全球知名OpenCompass多模态榜单彰显中国AI实力
AI妹 4 个月前 15 0

近日,云从科技自主研发的多模态大模型 “从容 V2.0” 在全球知名的 OpenCompass 多模态榜单上以高达80.7分的优异成绩脱颖而出,荣登榜首。这一成就标志着中国在人工智能领域的进一步突

昆仑万维发布Skywork-R1V3.0开源多模态模型 MMMU评测领先闭源跨模态能力强
AI妹 4 个月前 14 0

近日,昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0,宣称在多模态推理方面达到了前所未有的高度,甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略,使得其在复杂

开源模型Skywork-R1V3.0多模态推理能力突出 MMMU得分领先闭源模型
AI妹 4 个月前 12 0

Recently, Kuaizhi Wanyi officially released its brand-new open-source model Skywork-R1V3.0, claimi

xAI发布Grok4:性能升级挑战顶尖模型,实时数据引争议
AI妹 4 个月前 14 0

xAI正式推出其最新旗艦AI模型Grok4,標誌着人工智能領域的又一重大突破。據官方消息,Grok4於太平洋時間7月9日晚8點通過xAI官方賬號的直播活動全球發佈,引發了業界和用戶的廣泛關注。AI

vivo發布BlueLM-2.5-3B端側多模態模型 具備GUI理解與優異推理能力
AI妹 4 个月前 13 0

近日,vivo AI Lab 發佈了其最新的端側多模態模型 ——BlueLM-2.5-3B。這款模型不僅小巧高效,更具備了理解圖形用戶界面(GUI)的能力,標誌着人工智能在處理文本和圖像方面邁出了

硅基流动上线月之暗面开源Kimi K2模型 1T参数128K上下文
AI妹 4 个月前 13 0

近日,硅基流动(SiliconCloud)平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T,激活参数为32B,在各项基准性能测试中表现不俗,能够与顶尖的商业模型相

Google DeepMind与伦敦大学研究揭示大语言模型面对反对意见容易放弃正确答案
AI妹 4 个月前 19 0

最近,Google DeepMind 與倫敦大學的研究揭示了大語言模型(LLMs)在面對反對意見時的 “軟弱” 表現。比如,像 GPT-4o 這樣的先進模型,有時會顯得非常自信,但一旦遇到質疑,它

科大讯飞星火X1升级版7月25日上线 综合幻觉治理多语言能力提升
AI妹 4 个月前 13 0

近日,科大訊飛通過其官方公衆號宣佈,備受關注的訊飛星火 X1升級版將於7月25日正式上線。這款深度推理大模型依託全國產算力進行訓練,升級後的星火 X1將爲用戶帶來一系列令人期待的功能和性能提升。