关闭导航

包含标签"SFT"的内容

d1框架结合强化学习 显著提升扩散式大语言模型推理能力与应用潜力
AI妹 1 个月前 9 0

在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT

CameraBench:赋能AI精准理解镜头运动的创新研究成果
AI妹 1 个月前 11 0

咱们天天聊 AI 多牛逼,能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过,当 AI 看视频的时候,它真的“看懂”了吗? 你可能会说:“当然了,都能识别猫猫狗狗、人山人海了!” 打住!识别物

AI镜头运动理解有新招!CameraBench数据集显威力
AI妹 1 个月前 9 0

咱們天天聊 AI 多牛逼,能寫詩、能畫畫、還能跟你嘮嗑到天亮。但你有沒有想過,當 AI 看視頻的時候,它真的“看懂”了嗎? 你可能會說:“當然了,都能識別貓貓狗狗、人山人海了!” 打住!識別物

阿里巴巴GitHub开源革新自律检索AI WebAgent 含双模块及多步推理功能
AI妹 1 个月前 9 0

アリババは GitHub で、革新的な自律型検索 AI エージェントである WebAgent を公開しました。この AI エージェントは、エンドツーエンドの情報検索と複数ステップの推論能力を持ち、