关闭导航

包含标签"部署成本降低"的内容

阿里巴巴开源国内首个混合推理通义千问3模型 降本增效性能提升显
AI妹 1 个月前 10 0

阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R

Liquid AI开源LFM2边缘模型 高效隐私特性引领行业新方向
AI妹 1 个月前 10 0

Liquid AI 宣布正式开源其下一代 Liquid Foundation Models(LFM2),这一突破性举措在人工智能领域掀起热议。作为专为边缘设备优化的高效混合模型,LFM2在速度、能

Unsloth AI成功1.8bit量子化Kimi K2 体积大减性能不减
AI妹 1 个月前 10 0

7月14日、Unsloth AIはMoonshot AIのKimi K2モデルを1.8bitバージョンに量子化することに成功し、モデルの体積を大幅に圧縮し、導入コストを削減しました。AIbaseの