OpenCL 2024 冬季作业 #8
YdrMaster
announced in
Announcements
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
本作业旨在扩展 operators-rs 项目中算子的浮点类型支持,通过添加 f16 类型实现增强模型的适配能力和性能优化。项目中已有完善的 f32 算子支持,并提供了 f16 算子实现的示例。作业的最终目标是:
作业任务
下载模型;
配置 InfiniLM 并验证 CPU 推理
PowerShell
Bash
验证 OpenCL 单精度浮点推理
将使用的算子库替换为 作业分支
修改
InfiniLM/Cargo.toml:L37
:验证推理(F32)
PowerShell
Bash
适配 f16 精度
通过标准
作业提交
在本项目种发起名为“提交作业”的 issue,内容包括:
附录
OpenCL 环境配置
见课件;
Android 手机 adb 推理调试
编译环境
operators-rs 调试
InfiniLM 调试
Beta Was this translation helpful? Give feedback.
All reactions