关闭导航

包含标签"技术论文"的内容

Kimi发布注意力残差技术论文获马斯克点赞 引发行业广泛关注
AI妹 29 天前 1 0

近日,大模型初创公司Kimi(月之暗面)发布的最新技术论文《Attention Residuals: Rethinking depth-wise aggregation》引发行业广泛关注。特斯拉C

宇树科技开源OmniXtreme架构 双阶段训练解决人形机器人高动态物理运动难题
AI妹 1 个月前 2 0

宇树科技(Unitree)正式发布并开源了名为OmniXtreme的人形机器人运动控制架构,同步公开由创始人王兴兴署名的技术论文。该架构针对人形机器人在春晚等高动态场景下的极限动作表现,系统性地解

DeepSeek发布最新V3模型技术论文 探讨大模型扩展挑战与硬件设计思考
AI妹 3 个月前 15 0

近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。这篇长达14页的论文不仅

DeepSeek发布DeepSeek-V3技术论文 探讨大模型扩展挑战与硬件架构思考
AI妹 3 个月前 14 0

近日,DeepSeek 團隊發佈了關於其最新模型 DeepSeek-V3的一篇技術論文,重點討論了在大規模人工智能模型訓練中遇到的 “擴展挑戰” 以及與硬件架構相關的思考。這篇長達14頁的論文不僅