stellhub/blog-cn 是 StellHub 的中文技术文章仓库。
这里不会写泛泛而谈的技术科普,也不会堆砌概念。这个仓库更适合作为一个长期沉淀的工程知识库:记录云原生基础设施、中间件系统、微服务治理、可观测体系、可靠性工程、性能优化与 AI 基础设施方向的研究、设计和实践。
好的技术文章不应该只是“介绍是什么”,而应该解释“为什么这么设计、边界在哪里、落地时会踩什么坑”。
欢迎在 GitHub Discussions 中提出文章选题、反馈文章问题、分享真实工程实践,并讨论云原生、中间件、微服务治理、可观测性、可靠性工程、性能优化和 AI 基础设施。
推荐的话题分类和首批讨论模板维护在 DISCUSSIONS.md。
| 方向 | 内容范围 |
|---|---|
| 云原生 | Kubernetes、容器、部署模型、运行时、基础设施自动化 |
| 微服务治理 | 服务命名、路由、限流、熔断、重试、超时、灰度、治理规则设计 |
| 中间件 | 注册中心、配置中心、消息队列、API 网关、分布式协调、存储引擎 |
| 可观测性 | Metrics、Logs、Traces、OpenTelemetry、Prometheus、Grafana、Tempo |
| 可靠性工程 | SRE、SLI/SLO/SLA、容量规划、故障治理、稳定性建设、应急响应 |
| 网络与性能 | zero-copy、批量化、顺序 I/O、pipeline、序列化优化、吞吐量优化 |
| AI 基础设施 | LLM Gateway、Agent Runtime、模型服务、AI 原生中间件、工程化实践 |
我认为真正有价值的技术分享,至少要回答下面几个问题:
- 这个问题为什么会出现?
- 大型系统中通常怎么解决?
- 不同方案的代价和边界是什么?
- 落到代码、架构和运维层面应该怎么做?
- 生产环境中哪些做法是危险的?
因此,这里的文章会尽量保持:有判断、有结构、有工程细节、有取舍分析。
articles/
cloud-native/ # 云原生
microservices/ # 微服务治理
middleware/ # 中间件
observability/ # 可观测性
reliability/ # 可靠性工程
performance/ # 网络与性能优化
ai-infrastructure/ # AI 基础设施
assets/
covers/ # 文章封面
diagrams/ # 架构图、流程图
README.md
# 文章标题
## 背景
## 问题定义
## 核心概念
## 架构设计
## 实现细节
## 生产实践
## 常见误区
## 总结
## 参考资料- 云原生时代的微服务可观测规范
- 软件开发中的重试策略最佳实践
- StellHub 微服务可观测规范
- 面向超大型企业的微服务命名体系研究:一种五段式分层模型
- 谁杀死了这个请求?深度解析网络超时的分层治理与定位
- 大型企业跨语言微服务链路追踪技术调研方案
- 如何将系统吞吐量提升 10 倍?网络通信全链路优化指南
- 中间件站点可靠性工程研究
英文技术文章仓库在这里:
两个仓库不一定完全镜像。中文仓库更强调深度解释、工程语境和中文开发者阅读体验;英文仓库更适合国际化技术表达、项目介绍和对外传播。
- 不写没有判断的中立废话。
- 不把官方文档重新翻译一遍就当原创文章。
- 不只给结论,要解释约束、边界和代价。
- 能画图就画图,能给代码就给代码,能给链路就给链路。
- 涉及标准、协议、框架行为时,优先引用官方文档或权威资料。
- 所有内容尽量服务于真实系统的设计、排障、治理和演进。
- 建立稳定的文章分类体系
- 补充文章封面图和架构图
- 整理微服务治理与可观测性系列文章
- 整理中间件可靠性工程系列文章
- 为关键文章补齐权威参考资料
- 发布精选文章到 StellHub 官方站点
持续分享云原生、中间件、微服务治理、可观测性、可靠性工程、性能优化和 AI 基础设施方向的深度技术文章。
当前仓库协议尚未最终确定。
在引用、转载、翻译或二次分发之前,请以仓库后续补充的 License 为准。
StellHub · 研究现代软件背后那些看不见的基础设施