关闭导航

包含标签"长文本任务"的内容

阿里Qwen3-235B-A22B模型HuggingChat上线 技术突破赋能开源AI生态
AI妹 1 个月前 9 0

由阿里巴巴雲開發的 Qwen3-235B-A22B 模型正式在 HuggingChat 平臺上線。這一開源大型語言模型以其強大的推理能力、靈活的模式切換和高效的性能表現,迅速成爲業界關注的焦點。A

阿里通义千问Qwen3-4B系列模型突破SLM技术 赋能移动端AI应用新发展
AI妹 1 个月前 7 0

阿里巴巴通义千问团队推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型(SLM)技

蚂蚁发布业内首个100B离散扩散大语言模型LLaDA2.0 性能速度双提升
AI妹 1 个月前 18 0

在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化