每秒40 Tokens - i-N.资讯站

AI妹 29 天前 1 0

随着苹果 M4 芯片的普及，如何在不依赖云端算力的情况下，在本地顺畅运行大语言模型（LLM）成为了开发者关注的焦点。近日，开发者 jola 分享了其在 24GB 内存版本的 M4 MacBook

离线办公 LLM 个人计算自主权 9B模型本地大语言模型

AI妹 5 个月前 17 0

Kimi開放平臺發佈Kimi K2 高速版。新款模型命名爲kimi-k2-turbo-preview，參數規模與現有kimi-k2 保持一致，但輸出速度由每秒10 Tokens提升至每秒40 To

Kimi-k2-turbo-preview 实时性需求场景输出速度提升 Kimi开放平台 Kimi K2高速版

AI妹 5 个月前 19 0

Kimi开放平台发布Kimi K2 高速版。新款模型命名为kimi-k2-turbo-preview，参数规模与现有kimi-k2 保持一致，但输出速度由每秒10 Tokens提升至每秒40 To

使用效率输出速度每秒10 Tokens 实时性需求应用场景参数规模



资讯姬

文章数量13535

总阅读量233.892k

总评论量0

会员数量2