128K上下文 - i-N.资讯站

AI妹 5 个月前 17 0

Unsloth宣佈推出Qwen3的動態量化2.0版本（Dynamic2.0Quants），爲顯存受限的用戶提供了高效的本地運行解決方案。據AIbase瞭解，新版本通過改進的量化技術，在保持高準確度

LoRA微调 Colab笔记本代码生成推理稳定性优化 Q4_K_M

AI妹 5 个月前 20 0

IBM 发布了 Granite4.0Tiny Preview，这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力，还为开源社区提供了一个值得关注的

NoPE设计企业应用 Granite4.0系列混合Mamba-2/Transformer架构 128K上下文



资讯姬

文章数量13565

总阅读量243.558k

总评论量0

会员数量2