关闭导航

包含标签"视觉数据处理"的内容

Gemma4 12B无编码器多模态模型:低资源可运行 开源获开发者热捧
AI妹 5 天前 1 0

近日,谷歌正式发布了其最新的统一多模态模型 ——Gemma 4 12B。这款模型具有 12 亿个参数,最大的亮点在于它不需要传统的多模态编码器,能够直接处理视觉和音频数据。为了适应消费级硬件的使用