关闭导航

包含标签"PyTorch团队"的内容

Tri Dao团队用Python/CuTe-DSL推QuACK 无CUDA实现H100性能提升33%-50%
AI妹 1 个月前 10 0

据最新报道,Flash Attention 的共同作者 Tri Dao 与普林斯顿大学的两位博士生联合推出了一个名为 QuACK 的新内核库,令人瞩目的是,他们仅使用 Python 和 CuTe-