强化学习(RL) - i-N.资讯站

AI妹 5 个月前 17 0

在人工智能的迅速發展中，如何提升大語言模型（LLM）的檢索和推理能力成爲研究的熱門話題。近日，阿里通義實驗室提出了一個名爲 “ZeroSearch” 的新框架，它能夠使大型語言模型自己模擬搜索引擎

大语言模型(LLM) 问答任务多跳问答自我学习强化学习(RL)

AI妹 5 个月前 20 0

在今天的2025小米人车家全生态合作伙伴大会上，小米新任 Xiaomi MiMO 大模型负责人罗福莉首次亮相，正式发布了最新的 MoE（Mixture of Experts）大模型 ——MiMo-



资讯姬

文章数量13527

总阅读量230.423k

总评论量0

会员数量2