关闭导航

包含标签"全注意力模型"的内容

ACL2025最佳论文:DeepSeek等提出NSA机制 长文本处理提速11倍
AI妹 1 个月前 9 0

在剛剛結束的 ACL2025頒獎典禮上,由 DeepSeek 的梁文鋒博士作爲通訊作者,與北京大學等機構聯合發表的研究論文榮獲最佳論文獎。這次會議規模空前,投稿數量幾乎翻倍,達到了8360篇,競爭

DeepSeek梁文锋团队获ACL2025最佳论文 NSA机制让长文本处理提速11倍
AI妹 1 个月前 9 0

在刚刚结束的 ACL2025颁奖典礼上,由 DeepSeek 的梁文锋博士作为通讯作者,与北京大学等机构联合发表的研究论文荣获最佳论文奖。这次会议规模空前,投稿数量几乎翻倍,达到了8360篇,竞争