关闭导航

包含标签"消费级显卡部署"的内容

阿里云通义千问Qwen3系列发布:覆盖全场景性能领先部署支持丰富
AI妹 1 个月前 10 0

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备

阿里巴巴开源通义万相Wan2.2 视频生成模型携MoE架构等多维度突破
AI妹 1 个月前 9 0

阿里巴巴今晚正式開源視頻生成模型"通義萬相Wan2.2",此次發佈包含三款核心模型:文生視頻(Wan2.2-T2V-A14B)、圖生視頻(Wan2.2-I2V-A14B)和統一視頻生成(Wan2.

字节跳动联合港大复旦推出POLARIS强化学习方法 提升小模型数学推理能力
AI妹 1 个月前 10 0

近日,字節跳動Seed團隊攜手香港大學與復旦大學,共同推出了創新的強化學習訓練方法——POLARIS。該方法通過精心設計的Scaling RL策略,成功將小模型的數學推理能力提升至與超大模型相媲美