关闭导航

包含标签"泛化能力"的内容

3D-R1新型模型发布 成提升3D场景理解推理泛化能力里程碑
AI妹 3 个月前 13 0

 在人工智能领域,视觉语言模型(VLM)近年来取得了显著进展,尤其是在二维视觉理解方面。随着这一领域的不断发展,研究人员们开始将目光投向3D 场景理解。然而,由于高质量空间数据的稀缺和静

3D-R1新型基础模型显著助力3D场景理解推理与泛化能力提升
AI妹 3 个月前 14 0

 在人工智能領域,視覺語言模型(VLM)近年來取得了顯著進展,尤其是在二維視覺理解方面。隨着這一領域的不斷髮展,研究人員們開始將目光投向3D 場景理解。然而,由於高質量空間數據的稀缺和靜

Flow-GRPO:在线RL赋能流匹配图像生成模型提升复杂任务表现
AI妹 3 个月前 18 0

家人们,今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了,它就像是给图像生成模型打了一针 “超级进化剂”,直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎

阶跃星辰正式开源4.8B参数Step1X-3D 高保真可控且CLIP-Score最高的3D大模型
AI妹 3 个月前 12 0

階躍星辰正式發佈並開源了3D大模型Step1X-3D。這一模型的推出,標誌着階躍星辰在多模態方向上的最新成果,繼圖像、視頻、語音、音樂等模態後,進一步拓展了AI技術的應用邊界。 Step1X-3

GPT-5 GitHub Copilot公開プレビュー、AIプログラミング補助の新時代開幕
AI妹 3 个月前 15 0

AIBaseメッセージ、2025年8月7日、OpenAIは最新の旗艦モデルGPT-5がGitHub Copilotで公開プレビューを開始したことを発表しました。これは、AIプログラミング補助ツール

阿里Qwen推出WorldPM系列偏好模型 开源赋能全球开发者
AI妹 3 个月前 15 0

阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

阿里Qwen推出WorldPM偏好模型系列 开源赋能全球开发者
AI妹 3 个月前 14 0

阿里巴巴旗下Qwen團隊宣佈推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

ZeroSearch框架:通义实验室北大团队推出 无需真实搜索降88%成本激活检索能力
AI妹 3 个月前 18 0

最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大

训练干预提升循环模型长序列泛化能力 未探索状态假说给出新解释
AI妹 3 个月前 14 0

在深度学习的领域,循环神经网络(RNN)和 Transformer 模型各有千秋。近期研究发现,线性循环模型(如 Mamba)凭借其优越的序列处理能力,正在逐渐挑战 Transformer 的地位

字节跳动Seed团队推出GR-3 VLA模型 机器人操作能力实现突破性进展
AI妹 3 个月前 14 0

近日,字節跳動Seed團隊正式推出全新Vision-Language-Action Model(VLA)模型GR-3,該模型在機器人操作領域展現出突破性能力,不僅能理解包含抽象概念的語言指令,還可