泛化能力 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"泛化能力"的内容

CTM连续思维机器：神经时序同步驱动的类生物智能AI新探索

CTM连续思维机器：神经时序同步驱动的类生物智能AI新探索

AI妹 5 个月前 18 0

人工智能领域最近迎来了一项引人关注的新进展。总部位于东京的 Sakana AI 发表了一篇题为《连续思维机器》（Continuous Thought Machines）的论文，提出了一种旨在让机器

时间动态连续思维机器涌现特性 ImageNet-1K图像分类深度学习

查看详情

3D-R1模型：合成数据集等创新提升3D场景理解推理泛化能力，成效显著

3D-R1模型：合成数据集等创新提升3D场景理解推理泛化能力，成效显著

AI妹 5 个月前 17 0

In the field of artificial intelligence, vision-language models (VLMs) have made significant

视觉语言模型动态视角选择 Scene-30K 奖励函数 3D-R1

查看详情

3D-R1新型模型发布成提升3D场景理解推理泛化能力里程碑

3D-R1新型模型发布成提升3D场景理解推理泛化能力里程碑

AI妹 5 个月前 16 0

在人工智能领域，视觉语言模型（VLM）近年来取得了显著进展，尤其是在二维视觉理解方面。随着这一领域的不断发展，研究人员们开始将目光投向3D 场景理解。然而，由于高质量空间数据的稀缺和静

3D视觉语言模型强化学习动态视图选择 Scene-30K合成数据集 3D-R1

查看详情

3D-R1新型基础模型显著助力3D场景理解推理与泛化能力提升

3D-R1新型基础模型显著助力3D场景理解推理与泛化能力提升

AI妹 5 个月前 17 0

在人工智能領域，視覺語言模型（VLM）近年來取得了顯著進展，尤其是在二維視覺理解方面。隨着這一領域的不斷髮展，研究人員們開始將目光投向3D 場景理解。然而，由於高質量空間數據的稀缺和靜

奖励函数 3D视觉语言模型 3D-R1 高质量合成数据集强化学习

查看详情

Flow-GRPO：在线RL赋能流匹配图像生成模型提升复杂任务表现

Flow-GRPO：在线RL赋能流匹配图像生成模型提升复杂任务表现

AI妹 5 个月前 22 0

家人们，今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了，它就像是给图像生成模型打了一针 “超级进化剂”，直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎

T2I 降噪减少策略 KL约束流匹配 SD3.5-M

查看详情

阶跃星辰正式开源4.8B参数Step1X-3D 高保真可控且CLIP-Score最高的3D大模型

阶跃星辰正式开源4.8B参数Step1X-3D 高保真可控且CLIP-Score最高的3D大模型

AI妹 5 个月前 14 0

階躍星辰正式發佈並開源了3D大模型Step1X-3D。這一模型的推出，標誌着階躍星辰在多模態方向上的最新成果，繼圖像、視頻、語音、音樂等模態後，進一步拓展了AI技術的應用邊界。 Step1X-3

泛化能力 ModelScope 几何模块 SD-XL模型 3D原生两阶段架构

查看详情

GPT-5 GitHub Copilot公開プレビュー、AIプログラミング補助の新時代開幕

GPT-5 GitHub Copilot公開プレビュー、AIプログラミング補助の新時代開幕

AI妹 5 个月前 18 0

AIBaseメッセージ、2025年8月7日、OpenAIは最新の旗艦モデルGPT-5がGitHub Copilotで公開プレビューを開始したことを発表しました。これは、AIプログラミング補助ツール

模型局限性 AGI愿景免费访问前端开发技术民主化

查看详情

阿里Qwen推出WorldPM系列偏好模型开源赋能全球开发者

阿里Qwen推出WorldPM系列偏好模型开源赋能全球开发者

AI妹 5 个月前 17 0

阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM，包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

泛化能力 72亿参数 Hugging Face 偏好建模对抗性评估

查看详情

阿里Qwen推出WorldPM偏好模型系列开源赋能全球开发者

阿里Qwen推出WorldPM偏好模型系列开源赋能全球开发者

AI妹 5 个月前 16 0

阿里巴巴旗下Qwen團隊宣佈推出全新偏好建模模型系列——WorldPM，包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和

强化学习 WorldPM-72B-RLHFLow 监督微调规模化定律阿里巴巴Qwen团队

查看详情

ZeroSearch框架：通义实验室北大团队推出无需真实搜索降88%成本激活检索能力

ZeroSearch框架：通义实验室北大团队推出无需真实搜索降88%成本激活检索能力

AI妹 5 个月前 20 0

最近，通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架，这一新技术可以在不需要真实搜索的情况下，激活大语言模型的检索能力，并且训练成本降低了惊人的88%。这一突破为大

泛化能力模拟微调大语言模型北京大学 API调用成本

查看详情

2



资讯姬

文章数量13543

总阅读量238.009k

总评论量0

会员数量2

本站由emlog驱动