关闭导航

包含标签"预填充阶段"的内容

Moonshot AI与清华联合提出PrfaaS 大幅提升大模型推理性能
AI妹 1 个月前 3 0

大语言模型(LLM)的推理性能瓶颈正在被新技术打破。近日,Moonshot AI(月之暗面)与清华大学研究团队联合提出了一种名为**预填充即服务(PrfaaS)**的新型架构。该研究旨在通过优化算

Moonshot AI与清华团队推出PrfaaS架构 突破LLM推理瓶颈提升服务性能
AI妹 1 个月前 4 0

随着大型语言模型(LLM)在推理过程中对计算资源的需求不断增加,传统的服务架构面临瓶颈。Moonshot AI 与清华大学的研究团队最近推出了一种新架构 —— 预填充即服务(PrfaaS),旨在打

DeepSeek关联公司新专利:创新大语言模型部署方法提升系统性能
AI妹 5 个月前 17 0

近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。这项专利的公布,标志着该公司在人工智能领域的又一重要

DeepSeek关联公司公开大语言模型部署专利 创新方法优化资源提升性能
AI妹 5 个月前 18 0

近日,DeepSeek 的關聯公司 —— 杭州深度求索人工智能基礎技術研究有限公司,公開了一項名爲 “一種大語言模型的部署方法及系統” 的專利。這項專利的公佈,標誌着該公司在人工智能領域的又一重要