关闭导航

包含标签"GRPO"的内容

AI能自主推理并搜索信息!Search-R1技术使成绩提升41%
AI妹 1 个月前 9 0

最近、AI界で衝撃的な技術が登場しました——言語モデルが自らインターネットで情報を検索できるようになったのです!試験の点数が41%も向上しただけでなく、「推論しながら検索する」という究極の形態も実

AI黑科技Search-R1可自主搜资料 边推理边查成绩暴涨41%
AI妹 1 个月前 9 0

最近AI圈炸出一項黑科技——讓語言模型學會自己上網查資料!不僅考試分數暴漲41%,還解鎖了"邊推理邊搜索"的究極形態。今天帶你們圍觀這場學術界的"作弊式進化",看完保證你想給自家AI辦張網吧會員卡

昆仑万维开源Skywork-R1V2.0 多模态推理领跑中文场景刷新开源SOTA
AI妹 1 个月前 7 0

4月24日,崑崙萬維宣佈正式開源其多模態推理模型Skywork-R1V2.0(以下簡稱R1V2.0)。這一升級版本在視覺與文本推理能力上均實現了顯著提升,特別是在高考理科難題的深度推理和通用任務場

昆仑万维开源Skywork-R1V2.0 多模态推理性能提升助力AGI与生态发展
AI妹 1 个月前 9 0

On April 24th, Kunlun Wanwei announced the official open-sourcing of its multi-modal reasoning mod

昆仑万维开源Skywork-R1V2.0 多模态模型性能跃升引领中文场景
AI妹 1 个月前 8 0

4月24日、昆侖万維は、多様なモダリティ推論モデルSkywork-R1V2.0(以下R1V2.0)の正式オープンソース化を発表しました。このアップグレード版は、視覚とテキストの推論能力の両方を大幅

Omni-R1音频问答模型:基于Qwen2.5-Omni+GRPO优化,创MMAU新纪录文本推理关键
AI妹 1 个月前 7 0

最近,一项来自 MIT CSAIL、哥廷根大学、IBM 研究所等机构的研究团队提出了一个名为 Omni-R1的全新音频问答模型。该模型在 Qwen2.5-Omni 的基础上,通过一种名为 GRPO

Omni-R1音声问答模型:GRPO优化创MMAU新纪录,文本推理成性能提升关键
AI妹 1 个月前 7 0

最近、MIT CSAIL、ゲッティンゲン大学、IBM研究所など複数の機関からなる研究チームが、新たな音声質問応答モデル「Omni-R1」を発表しました。このモデルは、Qwen2.5-Omniをベー

Meta新J1系列模型:革新技术提升AI判断能力且表现卓越
AI妹 1 个月前 7 0

最近、Meta社は新しいJ1シリーズのモデルを発表しました。これはAIの判断能力を向上させるための革新的な技術です。強化学習と合成データを使ったトレーニング手法を取り入れることで、J1モデルは判断

阿里巴巴发布QwenLong-L1-32B 长上下文推理模型实现重大技术突破
AI妹 1 个月前 7 0

阿里巴巴今日正式發佈QwenLong-L1-32B,這是一款專爲長上下文推理設計的大型語言模型,標誌着AI長文本處理能力的重大突破。該模型在性能表現上超越了o3-mini和Qwen3-235B-A

阿里巴巴発表QwenLong-L1-32B 長文推論LLM技術革新で業界影響深め

(注:字数約32字、關鍵情報「阿里發布模型」「長文推論LLM」「技術革新」「業界影響」を包含)
AI妹 1 个月前 7 0

アリババは本日、長文の推論を専門とする大規模言語モデルであるQwenLong-L1-32Bを正式に発表しました。これはAIの長文処理能力において大きなブレークスルーを示しています。このモデルは、o

    1 2