关闭导航

包含标签"训练干预"的内容

Anthropic推出个性向量技术 可有效监控控制语言模型个性特征
AI妹 1 个月前 10 0

Anthropic普近日宣布了一项新技术 —— 个性向量,旨在监测、控制和预防大型语言模型中的特定个性特征。随着语言模型在实际应用中的广泛使用,部分模型表现出不可预测的个性特征,比如 ChatGP

Anthropic个性向量技术:监控控制语言模型个性并预防不良特征
AI妹 1 个月前 10 0

Anthropic普近日宣佈了一項新技術 —— 個性向量,旨在監測、控制和預防大型語言模型中的特定個性特徵。隨着語言模型在實際應用中的廣泛使用,部分模型表現出不可預測的個性特徵,比如 ChatGP

训练干预提升循环模型长序列泛化能力 未探索状态假说给出新解释
AI妹 1 个月前 9 0

在深度学习的领域,循环神经网络(RNN)和 Transformer 模型各有千秋。近期研究发现,线性循环模型(如 Mamba)凭借其优越的序列处理能力,正在逐渐挑战 Transformer 的地位

线性循环模型(如Mamba)挑战Transformer 新训练干预解锁长序列泛化潜力
AI妹 1 个月前 7 0

在深度學習的領域,循環神經網絡(RNN)和 Transformer 模型各有千秋。近期研究發現,線性循環模型(如 Mamba)憑藉其優越的序列處理能力,正在逐漸挑戰 Transformer 的地位