关闭导航

包含标签" 128K上下文"的内容

Unsloth Qwen3动态量化2.0:智能层选低显存高效本地运行技术突破
AI妹 1 个月前 11 0

Unsloth宣佈推出Qwen3的動態量化2.0版本(Dynamic2.0Quants),爲顯存受限的用戶提供了高效的本地運行解決方案。據AIbase瞭解,新版本通過改進的量化技術,在保持高準確度

IBM发布Granite4.0Tiny Preview 高效混合架构支持无约束长上下文
AI妹 1 个月前 8 0

IBM 发布了 Granite4.0Tiny Preview,这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力,还为开源社区提供了一个值得关注的