关闭导航

包含标签"强化学习"的内容

WORLDMEM框架Hugging Face开源 记忆驱动世界模拟新突破
AI妹 1 个月前 9 0

この度、WORLDMEMフレームワークがHugging Faceプラットフォームで正式にオープンソースとして公開されました。これは、長期的整合性を持つ世界シミュレーション技術における重要なブレーク

AI自主上网查资料 Search-R1技术助成绩暴涨41%
AI妹 1 个月前 8 0

最近AI圈炸出一项黑科技——让语言模型学会自己上网查资料!不仅考试分数暴涨41%,还解锁了"边推理边搜索"的究极形态。今天带你们围观这场学术界的"作弊式进化",看完保证你想给自家AI办张网吧会员卡

AI黑科技Search-R1可自主搜资料 边推理边查成绩暴涨41%
AI妹 1 个月前 10 0

最近AI圈炸出一項黑科技——讓語言模型學會自己上網查資料!不僅考試分數暴漲41%,還解鎖了"邊推理邊搜索"的究極形態。今天帶你們圍觀這場學術界的"作弊式進化",看完保證你想給自家AI辦張網吧會員卡

OpenAI o3/o4-mini模型幻觉率达33%/48% 较前代大幅上升
AI妹 1 个月前 10 0

最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个

Grok里程碑式更新:新增视觉处理、多语言音频及语音实时搜索等功能
AI妹 1 个月前 10 0

由xAI打造的生成式人工智能聊天機器人Grok迎來了一次里程碑式的更新,其功能全面升級,不僅新增了視覺處理能力,還實現了多語言音頻處理以及語音模式下的實時搜索功能。這一更新標誌着Grok在多模態A

xAI的Grok迎来里程碑更新:视觉处理、多语言音频及语音实时搜索核心亮点功能上线全面赋能多模态智能交互升级新体验
AI妹 1 个月前 9 0

由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功能。这一更新标志着Grok在多模态A

字节跳动PHD-Transformer:高效支持2M上下文LLM长序列预训练
AI妹 1 个月前 9 0

字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transforme

清华交大联合研究挑战纯RL提升大模型推理能力的传统观点
AI妹 1 个月前 10 0

【研究顛覆】 清華大學與上海交通大學聯合發表的最新論文,對業界普遍認爲"純強化學習(RL)能提升大模型推理能力"的觀點提出了挑戰性反駁。研究發現,引入強化學習的模型在某些任務中的表現,反而遜色於

清华上交联合研究挑战传统认知:纯RL难增强大模型推理能力学界热议
AI妹 1 个月前 11 0

【Research Upends Conventional Wisdom】 A recent joint paper from Tsinghua University and Shanghai

字节跳动PHD-Transformer:高效预训练长序列 支持2M上下文提升LLM训练效率
AI妹 1 个月前 8 0

字節跳動宣佈推出高效預訓練長度縮放技術(Efficient Pretraining Length Scaling),通過創新的Parallel Hidden Decoding Transforme