全球开源大模型生态迎来架构层面的颠覆性突破。谷歌于6月3日正式发布了全新统一多模态模型 Gemma412B 。该模型最大的创新在于彻底取消了传统多模态模型必不可少
近日,谷歌正式发布了其最新的统一多模态模型 ——Gemma 4 12B。这款模型具有 12 亿个参数,最大的亮点在于它不需要传统的多模态编码器,能够直接处理视觉和音频数据。为了适应消费级硬件的使用
Google日前正式发布全新开源大模型Gemma412B,标志着端侧全模态AI迎来突破性进展。该模型颠覆了传统多模态模型依赖视觉和音频外部编码器的复杂链路,创新性地采用“Unified”无编码器架
NVIDIA 近期推出了 Cosmos DiffusionRenderer,这是一个旨在实现高质量图像和视频重光源及去光源的新型视频扩散框架。此技术是 NVIDIA 原有 DiffusionRen
NVIDIA 近期推出了 Cosmos DiffusionRenderer,這是一個旨在實現高質量圖像和視頻重光源及去光源的新型視頻擴散框架。此技術是 NVIDIA 原有 DiffusionRen
微軟近日宣佈,通過其 Windows AI Foundry 平臺,正式向 Windows11用戶提供 OpenAI 最新發佈的免費開源大模型 gpt-oss-20b。這意味着用戶無需依
微软近日宣布,通过其 Windows AI Foundry 平台,正式向 Windows11用户提供 OpenAI 最新发布的免费开源大模型 gpt-oss-20b。这意味着用户无需依
阿里巴巴通义实验室近日重磅开源全新图像生成模型 Z-Image,该模型凭借仅 6B 的参数规模,实现了高效的图像生成与编辑,其视觉质量已接近国际领先商业模型的三倍参数级别(约20B)。Z-Imag