关闭导航

包含标签" 推理速度"的内容

腾讯WeDLM扩散语言模型:突破推理效率瓶颈 高效文本生成能力突出
AI妹 7 天前 4 0

腾讯微信 AI 团队发布了一种新型扩散语言模型框架 ——WeDLM(WeChat Diffusion Language Model)。该模型的设计旨在突破传统大型语言模型(如 GPT 系列)在并行

Unsloth Qwen3动态量化2.0:智能层选低显存高效本地运行技术突破
AI妹 1 个月前 11 0

Unsloth宣佈推出Qwen3的動態量化2.0版本(Dynamic2.0Quants),爲顯存受限的用戶提供了高效的本地運行解決方案。據AIbase瞭解,新版本通過改進的量化技術,在保持高準確度