课程项目:AI 编译器 #7
kilinchange
announced in
Announcements
Replies: 3 comments
-
更新了领域调研主题和通过标准。 |
Beta Was this translation helpful? Give feedback.
0 replies
-
更新了【一、算子接入】各算子的精度标准 |
Beta Was this translation helpful? Give feedback.
0 replies
-
更新:
|
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
一、算子接入
导师:Ziminli,kilinchange
涉及仓库
InfiniTensor 仓库及分支:https://github.com/InfiniTensor/InfiniTensor/tree/refactor_kernels
统一算子库仓库及分支:https://github.com/PanZezhong1725/operators/tree/dev
开发流程
算子库接口文档示例.md,要求返回值信息详细描述错误码对应的错误情况,参考 cudnnConvolutionBackwardBias);
算子列表
通过标准(实现 cpu 算子即可,感兴趣可以选择更多硬件 kernel 实现)
优秀标准
代码达到合入标准。(即经过仓库维护者进行 pr review 且开发者根据 review comment 完成修改,最后由仓库维护者 approve 该 pr)
二、硬件适配
导师:kilinchange
涉及仓库
InfiniTensor 仓库及分支:https://github.com/InfiniTensor/InfiniTensor/tree/master
项目说明
已申请天数/沐曦硬件的学员尝试将 InfiniTensor 适配到各自硬件上,可能需要修改 runtime 相关实现。
通过标准
向仓库提 pr,且全部测试通过,并给出适配过程文档(在 pr comment 里上传文档附件)。
优秀标准
代码达到合入标准;或者两种硬件均适配完成。
三、领域调研
本选题希望大家把涉及的技术讲清楚,不用凑字数,突出重点就行,所以没有给大家定模板和字数要求。
可以参考
PagedAttention 介绍.pdf。
报告发送至 [email protected]。
论文研读
导师:kilinchange
OSDI, SOSP, PPoPP, SC, ATC, EuroSys, ASPLOS, PLDI, MLSys 会议 ML 相关 track。
从上述会议选取 AI 系统相关论文进行深入研读
trt tuning 机制调研
导师:Ziminli
调研 trt 的 tuning 机制以及操作流程。
通过标准
对上述主题进行调研,也可以自行选择 AI sys 领域新技术/框架进行调研,形成报告提交。(导师评价判断是否达到通过标准)
优秀标准
InfiniTensor 团队针对报告内容筛选出优秀报告。
Beta Was this translation helpful? Give feedback.
All reactions