关闭导航

包含标签"YaRN技术"的内容

阿里Qwen3-235B-A22B模型HuggingChat上线 技术突破赋能开源AI生态
AI妹 1 个月前 9 0

由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A

阿里Qwen3-235B-A22B模型HuggingChat上线 技术实力再突破
AI妹 1 个月前 10 0

由阿里巴巴云开发的 Qwen3-235B-A22B 模型正式在 HuggingChat 平台上线。这一开源大型语言模型以其强大的推理能力、灵活的模式切换和高效的性能表现,迅速成为业界关注的焦点。A

Unsloth推出Qwen3动态量化2.0 低显存高效长上下文本地运行受社区广泛好评
AI妹 1 个月前 10 0

Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度

Hugging Face开源SmolLM3:3B参数性能直逼4B,多优势赋能多场景
AI妹 1 个月前 9 0

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越

Hugging Face发布SmolLM3:3B参数性能直逼4B的开源轻量语言模型
AI妹 1 个月前 10 0

近日,Hugging Face正式推出全新開源語言模型 SmolLM3,一款擁有3B參數的輕量級大語言模型(LLM),以其卓越性能和高效設計引發行業廣泛關注。SmolLM3不僅在多項基準測試中超越

阿里云Qwen3-Coder AI编程大模型开源 能力达开源顶尖水平
AI妹 1 个月前 11 0

7月23日,阿里雲正式宣佈其最新的AI編程大模型Qwen3-Coder全面開源,這一舉措迅速在智能編程領域掀起熱潮。Qwen3-Coder憑藉其卓越的代碼生成和Agent能力,在Agentic C

阿里云开源Qwen3-Coder AI编程大模型 达开源顶尖水平
AI妹 1 个月前 8 0

7月23日,阿里云正式宣布其最新的AI编程大模型Qwen3-Coder全面开源,这一举措迅速在智能编程领域掀起热潮。Qwen3-Coder凭借其卓越的代码生成和Agent能力,在Agentic C