TensorRT - i-N.资讯站

AI妹 2 个月前 3 0

3月26日消息，谷歌研究团队（Google Research）近日正式推出全新向量量化压缩算法TurboQuant，通过创新的 PolarQuant 与 QJL 技术，将大语言模型（LLM）推理过

键值缓存（KV Cache） RabbiQ GloVe 向量量化压缩算法 Needle In A Haystack

AI妹 4 个月前 33 0

在AI算力自主可控的国家战略驱动下，国产GPU赛道再迎重磅玩家。AI推理专用GPU芯片公司曦望（Sunrise）宣布，成立一年内已完成近 30 亿元人民币融资，创下国内AI芯片初创企业早期融资规模

推理优先策略编译器下一代推理GPU芯片研发头部VC/PE 驱动



资讯姬

文章数量13533

总阅读量232.256k

总评论量0

会员数量2