关闭导航

包含标签"泛化能力"的内容

3D-R1新型基础模型显著助力3D场景理解推理与泛化能力提升
AI妹 1 个月前 9 0

 在人工智能領域,視覺語言模型(VLM)近年來取得了顯著進展,尤其是在二維視覺理解方面。隨着這一領域的不斷髮展,研究人員們開始將目光投向3D 場景理解。然而,由於高質量空間數據的稀缺和靜

Flow-GRPO:在线RL赋能流匹配图像生成模型提升复杂任务表现
AI妹 1 个月前 10 0

家人们,今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了,它就像是给图像生成模型打了一针 “超级进化剂”,直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎

阶跃星辰正式开源4.8B参数Step1X-3D 高保真可控且CLIP-Score最高的3D大模型
AI妹 1 个月前 8 0

階躍星辰正式發佈並開源了3D大模型Step1X-3D。這一模型的推出,標誌着階躍星辰在多模態方向上的最新成果,繼圖像、視頻、語音、音樂等模態後,進一步拓展了AI技術的應用邊界。 Step1X-3

GPT-5 GitHub Copilot公開プレビュー、AIプログラミング補助の新時代開幕
AI妹 1 个月前 11 0

AIBaseメッセージ、2025年8月7日、OpenAIは最新の旗艦モデルGPT-5がGitHub Copilotで公開プレビューを開始したことを発表しました。これは、AIプログラミング補助ツール

阿里Qwen推出WorldPM系列偏好模型 开源赋能全球开发者
AI妹 1 个月前 10 0

阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

阿里Qwen推出WorldPM偏好模型系列 开源赋能全球开发者
AI妹 1 个月前 10 0

阿里巴巴旗下Qwen團隊宣佈推出全新偏好建模模型系列——WorldPM,包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

ZeroSearch框架:通义实验室北大团队推出 无需真实搜索降88%成本激活检索能力
AI妹 1 个月前 10 0

最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大

训练干预提升循环模型长序列泛化能力 未探索状态假说给出新解释
AI妹 1 个月前 9 0

在深度学习的领域,循环神经网络(RNN)和 Transformer 模型各有千秋。近期研究发现,线性循环模型(如 Mamba)凭借其优越的序列处理能力,正在逐渐挑战 Transformer 的地位

字节跳动Seed团队推出GR-3 VLA模型 机器人操作能力实现突破性进展
AI妹 1 个月前 8 0

近日,字節跳動Seed團隊正式推出全新Vision-Language-Action Model(VLA)模型GR-3,該模型在機器人操作領域展現出突破性能力,不僅能理解包含抽象概念的語言指令,還可

中国深度求索发布DeepSeek-V3.2系列模型 含DSA架构与Agent优先能力
AI妹 1 个月前 19 0

12月1日 — 中国人工智能初创公司深度求索(DeepSeek AI)发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Sp

    1 2