关闭导航

包含标签"长上下文任务"的内容

线性循环模型(如Mamba)挑战Transformer 新训练干预解锁长序列泛化潜力
AI妹 1 个月前 8 0

在深度學習的領域,循環神經網絡(RNN)和 Transformer 模型各有千秋。近期研究發現,線性循環模型(如 Mamba)憑藉其優越的序列處理能力,正在逐漸挑戰 Transformer 的地位