关闭导航

包含标签"训练数据集"的内容

阿里发布QwenLong-L1-32B 长文本推理模型实现重大突破
AI妹 1 个月前 9 0

阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A

英伟达发布Nemotron3系列 混合架构提升AI代理效率 百万上下文Nano已上市
AI妹 1 个月前 13 0

英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系