关闭导航

包含标签"長文処理"的内容

DeepSeek梁文鋒团队ACL2025获最优论文奖 NSA机制革新长文处理
AI妹 1 个月前 8 0

先日終了したACL2025の授賞式において、DeepSeekの梁文鋒博士が共同著者として、北京大学などの機関と共同で発表された研究論文が最優秀論文賞を受賞しました。この会議は過去最大規模となり、提

Anthropic Claude功能改善提案:百万上下文等升级及未来发展展望
AI妹 1 个月前 9 0

最近、Anthropic 社が開発するAIモデル「Claude」の機能改善に関する提案が広く注目を集めています。この提案は、上下文ウィンドウの拡張、メモリ機能の強化、サポートされるファイル形式の拡

Hugging Face发布SmolLM3:3B参数性能比肩4B,支持长文多语言
AI妹 1 个月前 10 0

最近、Hugging Faceは新たにオープンソースの言語モデル「SmolLM3」を正式リリースしました。このモデルは3Bパラメータを持つ軽量な大規模言語モデル(LLM)で、優れた性能と効率的な設

2025年主要开源大模型架构特征与技术趋势深度解析
AI妹 1 个月前 13 0

近年、大規模言語モデル(LLM)の急速な発展により、人工知能技術の境界が広がり、特にオープンソース分野において、モデルアーキテクチャのイノベーションが業界の注目を集めています。AIbaseは最近の