由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A
阿里巴巴通义千问团队推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型(SLM)技
在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化
emlog1 个月前
发表在:欢迎使用emlog这是系统生成的演示评论