关闭导航

包含标签"量化版本"的内容

蚂蚁百灵大模型Ling-2.6-flash开源 多量化版本提升推理与智能体能力
AI妹 1 个月前 2 0

蚂蚁集团旗下的百灵大模型今日宣布,正式开源其最新成员Ling-2.6-flash。该模型同步推出了BF16、FP8、INT4 等多个量化版本,旨在为全球开发者提供更灵活的硬件适配选择,进一步降低A

阿里通义开源Qwen3-VL双子星 开启多模态检索语义对齐新纪元
AI妹 5 个月前 14 0

当图文、视频、图表甚至UI界面都能被统一“理解”并精准匹配,多模态信息检索的边界正在被彻底重构。今日,阿里通义实验室正式开源Qwen3-VL-Embedding与Qwen3-VL-Reranker

Unsloth AI实现Kimi K2 1.8bit量化 大幅压缩体积降低部署成本
AI妹 5 个月前 19 0

7月14日,Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,大幅压缩模型体积并降低部署成本。根据AIbase报道,这一技术突破使Kimi K2从原始

Unsloth AI量化Kimi K2至1.8bit 体积减80%性能稳引行业关注
AI妹 5 个月前 22 0

7月14日,Unsloth AI宣佈成功將Moonshot AI的Kimi K2模型量化爲1.8bit版本,大幅壓縮模型體積並降低部署成本。根據AIbase報道,這一技術突破使Kimi K2從原始