恩嗯随记

记录一下：K8s部署SkyWalking链路追踪

四月 11 2025

工作学习

K8s SkyWalking 链路追踪

57

本文详细介绍了在Kubernetes集群中部署SkyWalking链路追踪系统的完整流程。环境采用1个Master节点（4核6G）和2个Worker节点（4核8G），部署了SkyWalking OAP、UI、ElasticSearch等核心组件。通过Helm Chart进行部署配置，包含资源限制、存储配置等参数。后端应用集成SkyWalking agent，配置环境变量实现数据采集；前端应用通过Nginx提供服务。系统提供拓扑图、链路追踪等功能，帮助实现故障快速定位、性能瓶颈识别、服务依赖分析和容量规划，为微服务架构提供重要可观测性支持。

记录一下：Kubernetes Pod 资源配额与自动扩缩容实践

三月 10 2024

1

Kubernetes通过requests/limits实现资源隔离与弹性伸缩。requests为资源下界，影响Pod调度；limits为上界，CPU超限被限流，内存超限触发OOMKilled。推荐CPU requests:limits=1:2或1:1.5，内存=1:1.5或1:2。HPA基于CPU/内存利用率自动扩缩容，需配置min/max副本数、利用率阈值（如CPU 70%）、稳定化窗口防抖动，并定义扩缩策略。工作流程为Metrics Server采集指标→HPA Controller计算目标副本数→检查范围→应用策略→更新Deployment。常见问题包括HPA不生效（检查Metrics Server、等待数据）、Pod频繁扩缩（调整稳定化窗口）、新增Pod超载（优化容量与应用）。监控需通过kubectl describe hpa、top pod等命令排查。

记录一下：Redis Sentinel 哨兵机制详解与故障转移实践

十月 20 2023

2

Redis Sentinel通过监控、通知、自动故障转移三大核心机制解决单实例单点故障问题，实现高可用（HA）。其定期PING检测实例存活状态，通过Pub/Sub机制向客户端通知故障；主库故障时自动选举从库提升为新主，并同步其他从库。典型部署为三节点Sentinel集群加一主二从Redis架构，需合理配置监控超时、故障转移超时等参数。故障转移流程包括主观下线检测、客观下线确认、Raft算法选举Leader、选从提升、同步及事件通知。客户端需支持Sentinel模式实现读写分离。生产环境至少部署3个Sentinel节点，以保障秒级故障转移能力，是Redis高可用标准方案。

记录一下：从零搭建Kubernetes集群踩坑记录

十月 14 2023

工作学习

K8s Kubernetes 集群搭建 kubeadm Calico

10

本文记录了作者从传统运维转向Kubernetes（K8s）后，首次搭建测试集群的实践过程。环境采用1 Master+2 Node架构，配置均为4C8G CentOS7.9，选用K8s 1.24.6、Docker 20.10.21及Calico 3.24.0。核心步骤包括：关闭防火墙/SELinux/swap等基础配置；加载br_netfilter模块（避免后续报错）；安装Docker并配置；通过yum安装kubelet/kubeadm/kubectl；Master节点提前拉取镜像（注意CoreDNS镜像名称需手动修正）；执行初始化并配置kubectl；安装Calico时修改Pod网段；Node节点通过join命令入群；最终通过部署Nginx验证跨节点通信。过程中踩坑包括模块加载、镜像名称等，后续计划学习Helm、Ingress等进阶内容。

记录一下：MySQL 主从复制与 GTID 模式详解

九月 15 2023

3

MySQL主从复制中，GTID模式通过全局唯一事务ID解决了传统文件位置模式的数据一致性问题。传统模式在故障转移时难以确定同步位置、易产生数据分歧且需手动计算偏移量，而GTID凭借server-uuid:transaction-id的全局标识，自动跟踪已执行事务，实现故障转移时无需手动指定断点，并支持多源复制与自动转移。其核心在于GTID集合记录事务范围，配置需开启gtid-mode与enforce-gtid-consistency。生产环境建议优先采用GTID模式，配合Sentinel实现高可用，同时需关注从库延迟、复制中断等问题，通过并行复制、错误排查等手段保障稳定运行。