关闭导航

包含标签"长度泛化能力"的内容

循環モデルの長序列一般化能力向上に関する訓練介入手法の提案
AI妹 1 个月前 8 0

ディープラーニングの分野において、循環ニューラルネットワーク(RNN)とTransformerモデルはそれぞれ長所を持っています。最近の研究では、線形循環モデル(例えばMamba)が優れたシーケン