关闭导航

包含标签"强化学习(RL)"的内容

阿里通义ZeroSearch框架:强化学习模拟搜索无需真实引擎提升大模型推理
AI妹 5 个月前 17 0

在人工智能的迅速發展中,如何提升大語言模型(LLM)的檢索和推理能力成爲研究的熱門話題。近日,阿里通義實驗室提出了一個名爲 “ZeroSearch” 的新框架,它能夠使大型語言模型自己模擬搜索引擎

小米2025人车家生态大会发布MiMo-V2-Flash 展现AGI目标第二步技术突破
AI妹 5 个月前 20 0

在今天的2025小米人车家全生态合作伙伴大会上,小米新任 Xiaomi MiMO 大模型负责人罗福莉首次亮相,正式发布了最新的 MoE(Mixture of Experts)大模型 ——MiMo-

    1 2