关闭导航

包含标签"128K上下文"的内容

阿里云通义千问Qwen3系列发布:覆盖全场景性能领先部署支持丰富
AI妹 1 个月前 10 0

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备

Unsloth推出Qwen3动态量化2.0 低显存高效长上下文本地运行受社区广泛好评
AI妹 1 个月前 10 0

Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度

IBM Granite4.0Tiny Preview:高效混合架构 支持无约束长上下文处理
AI妹 1 个月前 8 0

IBM 發佈了 Granite4.0Tiny Preview,這是即將推出的 Granite4.0系列語言模型中最小的一款的預覽版本。該模型不僅具備高效的計算能力,還爲開源社區提供了一個值得關注的

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 8 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

Hugging Face发布SmolLM3:3B参数性能直逼4B的开源轻量语言模型
AI妹 1 个月前 9 0

近日,Hugging Face正式推出全新開源語言模型 SmolLM3,一款擁有3B參數的輕量級大語言模型(LLM),以其卓越性能和高效設計引發行業廣泛關注。SmolLM3不僅在多項基準測試中超越

月之暗面发布开源Kimi K2模型:1T参数MoE架构 代码与Agent能力卓越
AI妹 1 个月前 10 0

月之暗面公司正式发布了其最新力作——Kimi K2模型,并同步宣布开源。这款基于MoE架构的基础模型,凭借其强大的代码能力、卓越的通用Agent任务处理能力,一经发布便在AI领域引起了广泛关注。

月之暗面开源万亿参数Kimi K2 代码与Agent能力领先开源领域
AI妹 1 个月前 8 0

月之暗面公司正式發佈了其最新力作——Kimi K2模型,並同步宣佈開源。這款基於MoE架構的基礎模型,憑藉其強大的代碼能力、卓越的通用Agent任務處理能力,一經發布便在AI領域引起了廣泛關注。

月之暗面开源Kimi K2模型 回应API速度问题并优化服务支持128K上下文
AI妹 1 个月前 7 0

7月11日,月之暗面正式发布了具备更强代码能力和通用Agent任务处理能力的Kimi K2模型,并同步选择将其开源。这款基于MoE架构的基础模型总参数达1T,激活参数为32B,一经推出便受到广泛关

月之暗面开源Kimi K2模型 回应API速度慢问题并推进优化提升
AI妹 1 个月前 10 0

7月11日,月之暗面正式發佈了具備更強代碼能力和通用Agent任務處理能力的Kimi K2模型,並同步選擇將其開源。這款基於MoE架構的基礎模型總參數達1T,激活參數爲32B,一經推出便受到廣泛關

Mistral AI发布Devstral2系列开源编码模型 性能刷新纪录工具同步开源
AI妹 1 个月前 13 0

Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verif

    1 2