关闭导航

包含标签"DSA稀疏注意力机制"的内容

深度求索DeepSeek-V4模型上线开源 1M长上下文双版本适配Agent生态
AI妹 1 个月前 4 0

 深度求索(DeepSeek)今日宣布其全新系列模型 DeepSeek-V4 预览版本正式上线并同步开源。该系列模型通过结构创新,实现了1M(一百万字)

GLM-5国产AI大模型发布:支持七大国产芯片 编程能力全球领先
AI妹 3 个月前 4 0

在刚刚过去的春节假期中,国产 AI 大模型迎来了密集的发布潮,其中智谱科技推出的 GLM-5 模型备受瞩目。作为目前热度最高的 AI 模型之一,GLM-5 不仅在技术上实现了重大突破,还首次全面支