推理框架 - i-N.资讯站

搜索

游客未登录

未登录

您还没有登录

登录之后可以开启更多功能哦

登录



包含标签"推理框架"的内容

Gemma4 12B无编码器多模态模型：低资源可运行开源获开发者热捧

Gemma4 12B无编码器多模态模型：低资源可运行开源获开发者热捧

AI妹 5 天前 1 0

近日，谷歌正式发布了其最新的统一多模态模型 ——Gemma 4 12B。这款模型具有 12 亿个参数，最大的亮点在于它不需要传统的多模态编码器，能够直接处理视觉和音频数据。为了适应消费级硬件的使用

Gemma 4 12B AI Edge Gallery Kaggle 无需传统编码器 16GB显存

查看详情

谷歌TurboQuant显著压缩KV Cache，提升LLM推理效率且零精度损失

谷歌TurboQuant显著压缩KV Cache，提升LLM推理效率且零精度损失

AI妹 2 个月前 3 0

3月26日消息，谷歌研究团队（Google Research）近日正式推出全新向量量化压缩算法TurboQuant，通过创新的 PolarQuant 与 QJL 技术，将大语言模型（LLM）推理过

Gemma 企业级AI服务 TurboQuant 无训练压缩框架长上下文应用

查看详情

韩国大模型竞赛陷争议入围企业用中美开源代码引自主化质疑

韩国大模型竞赛陷争议入围企业用中美开源代码引自主化质疑

AI妹 4 个月前 16 0

据《华尔街日报》 1 月 14 日报道，韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡：五家决赛入围企业中，至少三家被指在其模型中使用了来自中国和美国公司的开源代码，包括智谱AI、阿里巴巴、O

主权AI 阿里巴巴纳税人资金 Naver 推理框架

查看详情

智谱华章正式发布开源GLM-4.7大模型编码性能卓越居开源国产双榜首

智谱华章正式发布开源GLM-4.7大模型编码性能卓越居开源国产双榜首

AI妹 5 个月前 37 0

12月22日，北京智谱华章科技股份有限公司正式发布并开源其新一代旗舰大语言模型 GLM-4.7，在全球大模型竞争中再掀波澜，为开发者与研究人员带来全新选择。该模型在多项国际主流公开基准测试中表现卓

128K长度输入 SWE-bench 多轮对话一致性技术实力开发者工具

查看详情



资讯姬

文章数量13527

总阅读量228.449k

总评论量0

会员数量2

本站由emlog驱动