关闭导航

包含标签"推理框架"的内容

Gemma4 12B无编码器多模态模型:低资源可运行 开源获开发者热捧
AI妹 5 天前 1 0

近日,谷歌正式发布了其最新的统一多模态模型 ——Gemma 4 12B。这款模型具有 12 亿个参数,最大的亮点在于它不需要传统的多模态编码器,能够直接处理视觉和音频数据。为了适应消费级硬件的使用

谷歌TurboQuant显著压缩KV Cache,提升LLM推理效率且零精度损失
AI妹 2 个月前 3 0

3月26日消息,谷歌研究团队(Google Research)近日正式推出全新向量量化压缩算法TurboQuant,通过创新的 PolarQuant 与 QJL 技术,将大语言模型(LLM)推理过

韩国大模型竞赛陷争议 入围企业用中美开源代码引自主化质疑
AI妹 4 个月前 16 0

据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、O

智谱华章正式发布开源GLM-4.7大模型 编码性能卓越居开源国产双榜首
AI妹 5 个月前 37 0

12月22日,北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7,在全球大模型竞争中再掀波澜,为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓