关闭导航

包含标签"强化学习"的内容

清华交大研究反驳纯RL提升大模型推理能力 实验揭示关键局限
AI妹 1 个月前 11 0

【研究颠覆】 清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于

字节跳动Seed团队PHD-Transformer:新策略突破预训练长度限制有效解决KV缓存问题
AI妹 1 个月前 10 0

近日,字节跳动的 Seed 团队在人工智能领域再传佳音,推出了一种新型的 PHD-Transformer(Parallel Hidden Decoding Transformer),这项创新突破了

UCLA與Meta AI推出d1框架 強化學習提升擴散式大語言模型推理能力
AI妹 1 个月前 10 0

在人工智能領域,UCLA 和 Meta AI 的研究人員聯合推出了一種名爲 d1的新框架,該框架通過強化學習技術顯著提升了擴散式大語言模型(dLLMs)的推理能力。雖然傳統的自迴歸模型如 GPT

d1框架结合强化学习 显著提升扩散式大语言模型推理能力与应用潜力
AI妹 1 个月前 11 0

在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT

Moonshot AI开源Kimi-VL多模态模型 高效能处理长文档与多任务
AI妹 1 个月前 10 0

中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长

Moonshot AI开源Kimi-VL模型:多模态高效处理长文档及复杂推理任务
AI妹 1 个月前 10 0

中國初創公司 Moonshot AI 最近推出了一款名爲 Kimi-VL 的開源模型。該模型在處理圖像、文本和視頻方面表現出色,以其高效的性能引起了廣泛關注。Kimi-VL 最大的亮點在於其處理長

Hugging Face发布新款SO-101机器人手臂 起价100美元并收购Pollen Robotics
AI妹 1 个月前 9 0

來自人工智能初創公司 Hugging Face 的最新消息,該公司剛剛發佈了一款可編程的3D 打印機器人手臂,名爲 SO-101,起價爲100美元。這款新手臂可以進行物品的拾取與放置等基本操作,進

阿里Qwen3:通义千问最新开源大模型,混合推理多模态全场景覆盖
AI妹 1 个月前 12 0

Qwen3是什么? 阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密

阿里Qwen3:通义千问最新开源大模型 混合推理多模態赋能全场景
AI妹 1 个月前 10 0

Qwen3是什麼? 阿里Qwen3是通義千問系列的最新一代開源大語言模型(LLM),於2025年4月29日正式發佈。作爲全球首個支持“混合推理”的模型,Qwen3包含8款不同規模的模型,涵蓋稠密

中美科技竞争下美国顶尖AI研究员亚历克斯·兰博加盟清华大学
AI妹 1 个月前 9 0

在中美科技竞争加剧的背景下,中国清华大学成功吸引了一位来自美国的顶尖人工智能(AI)研究员 —— 亚历克斯・兰博(Alex Lamb)。他曾在微软研究院担任高级研究员,现已确认将在即将到来的秋季学