关闭导航

包含标签"每秒40 Tokens"的内容

M4 MacBook Pro本地部署Qwen3.5-9B 打造高效离线AI工作流
AI妹 29 天前 1 0

随着苹果 M4 芯片的普及,如何在不依赖云端算力的情况下,在本地顺畅运行大语言模型(LLM)成为了开发者关注的焦点。近日,开发者 jola 分享了其在 24GB 内存版本的 M4 MacBook

Kimi开放平台发布K2高速版 输出速度提升至每秒40Tokens优化体验满足实时需求
AI妹 5 个月前 17 0

Kimi開放平臺發佈Kimi K2 高速版。新款模型命名爲kimi-k2-turbo-preview,參數規模與現有kimi-k2 保持一致,但輸出速度由每秒10 Tokens提升至每秒40 To

Kimi开放平台发布K2高速版 输出速度显著提升至每秒40Tokens优化用户体验
AI妹 5 个月前 19 0

Kimi开放平台发布Kimi K2 高速版。新款模型命名为kimi-k2-turbo-preview,参数规模与现有kimi-k2 保持一致,但输出速度由每秒10 Tokens提升至每秒40 To