为解决不同 AI 芯片大规模落地应用,北京智源研究院联合众多科研机构、芯片企业、系统厂商、算法和软件相关单位等国内外机构共同发起并创立了 FlagOS 开源社区。
FlagOS 社区致力于打造面向多种 AI 芯片的统一、开源的系统软件栈,包括大型算子库、统一AI编译器、并行训推框架、统一通信库等核心开源项目, 构建「模型-系统-芯片」三层贯通的开放技术生态,通过“一次开发跨芯迁移”释放硬件计算潜力,打破不同芯片软件栈之间生态隔离,有效降低开发者的迁移成本。 FlagOS 社区构建人工智能软硬件生态,突破单一闭源垄断,推动AI硬件技术大范围落地发展,立足中国、拥抱全球合作。
| 组件 | 用途 | 代码仓 |
|---|---|---|
| FlagGems | 高性能通用AI算子库 | FlagGems |
| FlagTree | 统一AI编译器 | FlagTree |
| FlagScale | 统一并行训练和推理框架 | FlagScale |
| FlagCX | 统一通信库 | FlagCX |
| FlagPerf | 多芯片评测工具 | FlagPerf |
| FlagRelease | 大模型发布平台 | FlagRelease |
| KernelGen | 大模型辅助算子开发工具 | KernelGen |
| FlagOS-Robo | 具身智能训推一体化多芯片框架 | FlagOS-Robo |
| FlagOS skills | 支持 Agent 在特定领域完成任务的技能包 | FlagOS skills |
-
**KernelGen **: 为多芯片系统设计的下一代AI辅助内核工程工具
-
libtriton_jit: Triton JIT C++ 运行时,用于降低 Python 开销
-
Megatron-LM-FL: 大规模 Transformer 模型训练的 GPU 优化库
-
TransformerEngine-FL: Transformer 模型的 FP8 混合精度训练
-
vllm-FL: 基于 FlagOS 统一多芯片后端的 vLLM 插件,用于 LLM 服务
-
vllm-plugin-FL: 增强型 vLLM 插件,提供更好的多芯片支持
-
FlagDNN:面向多种后端芯片的神经网络计算库。
-
FlagBLAS:面向多种后端芯片的计算库,遵从 BLAS 标准接口。
-
FlagFFT:针对多种后端芯片开发的一组算法,用于将跨时域/空域与频域完成信号或数据的转换。
-
FlagSparse:稀疏矩阵运算算子(如 SpMV, gather, scatter, sparse formats 等),用于多种芯片后端。
-
FlagTensor:面向多芯片后端开发的一组高性能张量操作算子。
-
FlagAudio:可运行于多种芯片之上的一组高性能的音频数据处理算子。
- FlagOS Wiki & 文档: DeepWiki门户
- 最新v1.5版本: 发布公告
- ModelScope: FlagRelease模型
- Hugging Face: FlagRelease模型
- WiseModel: FlagRelease模型
- 微信公众号: FlagOpen
- 微信视频号: FlagOpen
准备好做贡献或想了解更多? 访问 FlagOS 社区仓库 获取:
- 📖 完整的贡献指南
- 💬 社区讨论和支持
- 🤝 参与方式
- 📚 资源和文档
我们欢迎来自社区的贡献!无论是点星、Fork还是提交Pull Request,您的参与都能帮助FlagOS变得更好。
- ⭐ 点击Star - 表示您的支持!
- 🔔 Watch - 获取我们最新版本的更新
- 🍴 Fork - 开始贡献!
请阅读并遵守我们的行为准则:
- 行为准则 (中文)
FlagOS及其所有组件均遵循Apache License 2.0许可。详见各代码仓。
FlagOS由芯片制造、系统软件和AI研究领域的领先组织联合支持。这一合作努力证明了构建一个开放、统一的AI系统软件生态,跨越多样化硬件平台的承诺。
加入我们,共同构建AI系统软件的未来!🚀