关闭导航

包含标签"吞吐量提升"的内容

无问芯穹完成超7亿元融资 居中国AI原生基础设施融资规模之首
AI妹 1 个月前 2 0

5月7日,AI基础设施领军企业无问芯穹正式宣布完成超7亿元融资,规模位居中国AI原生基础设施公司之首。 本轮融资由杭州高新金投集团与惠远资本联合领投,国兴资本、秦淮数据、广发乾和、AEF Ne

Moonshot AI与清华联合提出PrfaaS 大幅提升大模型推理性能
AI妹 1 个月前 4 0

大语言模型(LLM)的推理性能瓶颈正在被新技术打破。近日,Moonshot AI(月之暗面)与清华大学研究团队联合提出了一种名为**预填充即服务(PrfaaS)**的新型架构。该研究旨在通过优化算

阶跃星辰发布Step3多模态推理大模型 7月31日开源并成立模芯生态联盟
AI妹 5 个月前 18 0

在2025世界人工智能大會(WAIC2025)前夕,階躍星辰在上海發佈了其新一代基礎大模型 ——Step3。這款模型不僅在智能性上取得突破,還兼顧了推理效率,旨在爲企業和開發者提供最優質的應用方案

DeepSeek关联公司新专利:创新大语言模型部署方法提升系统性能
AI妹 5 个月前 18 0

近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。这项专利的公布,标志着该公司在人工智能领域的又一重要

DeepSeek关联公司公开大语言模型部署专利 创新方法优化资源提升性能
AI妹 5 个月前 19 0

近日,DeepSeek 的關聯公司 —— 杭州深度求索人工智能基礎技術研究有限公司,公開了一項名爲 “一種大語言模型的部署方法及系統” 的專利。這項專利的公佈,標誌着該公司在人工智能領域的又一重要

腾讯云Hunyuan-A13B模型API发布 MoE架构高性价比成优势
AI妹 5 个月前 17 0

このたび、騰訊クラウドの公式ウェブサイトでは、騰訊・ホンイェンA13BモデルのAPIサービスが正式にリリースされ、入力料金は100万トークンあたり0.5元、出力料金は100万トークンあたり2元と設

腾讯混元A13B模型API上线 高性价比MoE架构赋能多场景AI应用普及
AI妹 5 个月前 14 0

近日,騰訊雲官網正式上線了騰訊混元A13B模型的API服務,輸入價格定爲每百萬Tokens0.5元,輸出價格則爲每百萬Tokens2元,這一舉措迅速在開發者社區中引發了熱烈反響。 作爲業界首個1