[T2-2-1][T2-2-2]长风破浪队 Susskind115 补充 #431

Susskind115 · 2025-09-08T04:07:46Z

与InfiniLM中的paged Attention机制对应的算子添加：
Paged Attention：使用非连续kvcache计算Attention。
Paged Caching：按分配的物理页表存储kvcache。

Susskind115 and others added 4 commits September 8, 2025 11:59

paged attn v1

59ce336

check paged attn

19ef94d

feat: 添加完整版Paged Attention算子

9e035d1

优化paged的寻址过程

084c896

PanZezhong1725 force-pushed the main branch from 7300e69 to 37c76a9 Compare October 22, 2025 02:23

Provide feedback