CI/CD 进阶实战与踩坑记录

前面把基础的 CI/CD 流水线跑通后，我又花了几天时间折腾了一些进阶功能。这篇记录一下代码扫描、全链路监控、灰度发布这些东西，以及中途遇到的一些坑。

从一个 Go 项目开始#

之前用的都是现成的 Nginx 镜像，这次想搞点真实的应用，就写了个简单的 Go Web 服务。

创建项目#

我本地的 Go 环境是 1.25，直接开干：

1
mkdir go-demo-app
2
cd go-demo-app
3
go mod init go-demo-app
4

5
go get github.com/prometheus/client_golang/prometheus/promhttp
6
go mod tidy

写代码#

main.go 很简单，就三个接口：

1
package main
2

3
import (
4
  "fmt"
5
  "net/http"
6
  "os"
7

8
  "github.com/prometheus/client_golang/prometheus/promhttp"
9
)
10

11
var version = "v1.0.0"
12

13
func main() {
14
  // 主页面
15
  http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
16
    hostname, _ := os.Hostname()
17
    fmt.Printf("Received request from %s\n", r.RemoteAddr)
18
    fmt.Fprintf(w, "<h1>Go Demo App</h1>")
19
    fmt.Fprintf(w, "<div>Version: <strong>%s</strong></div>", version)
20
    fmt.Fprintf(w, "<div>Hostname: %s</div>", hostname)
21
  })
22

23
  // 健康检查
24
  http.HandleFunc("/health", func(w http.ResponseWriter, r *http.Request) {
25
    w.WriteHeader(200)
26
    w.Write([]byte("ok"))
27
  })
28

29
  // Prometheus 监控指标
30
  http.Handle("/metrics", promhttp.Handler())
31

32
  fmt.Printf("Starting server on port 8080, version: %s\n", version)
33
  if err := http.ListenAndServe(":8080", nil); err != nil {
34
    fmt.Printf("Error starting server: %s\n", err)
35
  }
36
}

Dockerfile#

用的是多阶段构建，最终镜像只有十几 MB：

1
# 构建阶段
2
FROM reg.westos.org/library/golang:1.25-alpine AS builder
3

4
WORKDIR /app
5

6
# Go 代理加速
7
ENV GOPROXY=https://goproxy.cn,direct
8

9
COPY go.mod go.sum ./
10
RUN go mod download
11

12
COPY . .
13
RUN CGO_ENABLED=0 GOOS=linux go build -o go-demo-app .
14

15
# 运行阶段
16
FROM reg.westos.org/library/alpine:latest
17

18
WORKDIR /root/
19

20
COPY --from=builder /app/go-demo-app .
21

22
EXPOSE 8080
23

24
CMD ["./go-demo-app"]

因为 Kaniko 访问不了 DockerHub，我提前把基础镜像推到了 Harbor：

1
docker pull golang:1.25-alpine
2
docker pull alpine:latest
3

4
docker login reg.westos.org -u admin -p 12345
5

6
docker tag golang:1.25-alpine reg.westos.org/library/golang:1.25-alpine
7
docker tag alpine:latest reg.westos.org/library/alpine:latest
8

9
docker push reg.westos.org/library/golang:1.25-alpine
10
docker push reg.westos.org/library/alpine:latest

推送到 Gitea#

在 Gitea 创建 go-demo-app 仓库，然后推上去：

1
git init
2
git add .
3
git commit -m "Initial commit: Go app with metrics"
4
git branch -M main
5
git remote add origin http://192.168.100.10:30030/admin/go-demo-app.git
6
git push -u origin main

配置 Jenkins Pipeline#

在仓库根目录新建 Jenkinsfile，用来自动构建镜像：

1
pipeline {
2
  agent {
3
    kubernetes {
4
      yaml '''
5
      apiVersion: v1
6
      kind: Pod
7
      spec:
8
        hostAliases:
9
        - ip: "192.168.100.14"
10
          hostnames:
11
          - "reg.westos.org"
12
        containers:
13
        - name: kaniko
14
          image: gcr.io/kaniko-project/executor:debug
15
          command:
16
          - sleep
17
          - infinity
18
          volumeMounts:
19
          - name: registry-creds
20
            mountPath: /kaniko/.docker/
21
        volumes:
22
        - name: registry-creds
23
          secret:
24
            secretName: harbor-auth
25
            items:
26
              - key: .dockerconfigjson
27
                path: config.json
28
      '''
29
    }
30
  }
31

32
  environment {
33
    IMAGE_REPO = "reg.westos.org/library/go-demo-app"
34
    IMAGE_TAG = "v1.0.${BUILD_NUMBER}"
35
  }
36

37
  stages {
38
    stage('Checkout') {
39
      steps {
40
        checkout scm
41
      }
42
    }
43

44
    stage('Build & Push') {
45
      steps {
46
        container('kaniko') {
47
          sh """
48
            /kaniko/executor \
49
            --context `pwd` \
50
            --dockerfile `pwd`/Dockerfile \
51
            --destination ${IMAGE_REPO}:${IMAGE_TAG} \
52
            --destination ${IMAGE_REPO}:latest \
53
            --skip-tls-verify \
54
            --insecure
55
          """
56
        }
57
      }
58
    }
59

60
    stage('Update Manifest') {
61
        steps {
62
            echo "TODO: Update ArgoCD manifest with new tag ${IMAGE_TAG}"
63
        }
64
    }
65
  }
66
}

在 Jenkins 新建一个 Pipeline 任务，选择 “Pipeline from SCM”，指向 Gitea 的 go-demo-app 仓库，分支选 main。

跑一次构建，去 Harbor 看看镜像有没有生成。

准备 K8s 部署文件#

在 go-demo-app 仓库里新建 deploy/deployment.yaml：

1
apiVersion: apps/v1
2
kind: Deployment
3
metadata:
4
  name: go-demo-app
5
  namespace: default
6
  labels:
7
    app: go-demo-app
8
spec:
9
  replicas: 1
10
  selector:
11
    matchLabels:
12
      app: go-demo-app
13
  template:
14
    metadata:
15
      labels:
16
        app: go-demo-app
17
      annotations:
18
        prometheus.io/scrape: "true"
19
        prometheus.io/port: "8080"
20
        prometheus.io/path: "/metrics"
21
    spec:
22
      hostAliases:
23
      - ip: "192.168.100.14"
24
        hostnames:
25
        - "reg.westos.org"
26
      containers:
27
      - name: go-demo-app
28
        image: reg.westos.org/library/go-demo-app:latest
29
        imagePullPolicy: Always
30
        ports:
31
        - containerPort: 8080
32
        resources:
33
          limits:
34
            cpu: "500m"
35
            memory: "128Mi"
36
        readinessProbe:
37
          httpGet:
38
            path: /health
39
            port: 8080
40
          initialDelaySeconds: 5
41
          periodSeconds: 10
42
      imagePullSecrets:
43
      - name: harbor-auth
44

45
---
46
apiVersion: v1
47
kind: Service
48
metadata:
49
  name: go-demo-app-svc
50
  namespace: default
51
  labels:
52
    app: go-demo-app
53
spec:
54
  type: NodePort
55
  selector:
56
    app: go-demo-app
57
  ports:
58
  - name: http
59
    port: 8080
60
    targetPort: 8080
61
    nodePort: 30095

推送到 Gitea，然后在 ArgoCD 创建新应用 go-demo-app：

Repository URL: http://192.168.100.10:30030/admin/go-demo-app.git
Path: deploy
Sync Policy: Automatic，勾选 Prune 和 Self Heal

同步后访问 http://192.168.100.10:30095，能看到页面就算成功了。

实现 CI 闭环#

现在 Jenkins 每次构建出新镜像，还需要手动改 deployment.yaml 里的版本号，这太蠢了。我们让 Jenkins 自己去改。

修改 Jenkinsfile#

主要改动是加一个 git-tools 容器，用来提交代码：

1
pipeline {
2
  agent {
3
    kubernetes {
4
      yaml '''
5
      apiVersion: v1
6
      kind: Pod
7
      spec:
8
        hostAliases:
9
        - ip: "192.168.100.14"
10
          hostnames:
11
          - "reg.westos.org"
12
        containers:
13
        - name: kaniko
14
          image: gcr.io/kaniko-project/executor:debug
15
          command:
16
          - sleep
17
          - infinity
18
          volumeMounts:
19
          - name: registry-creds
20
            mountPath: /kaniko/.docker/
21
        - name: git-tools
22
          image: bitnami/git:latest
23
          command:
24
          - sleep
25
          - infinity
26
        volumes:
27
        - name: registry-creds
28
          secret:
29
            secretName: harbor-auth
30
            items:
31
              - key: .dockerconfigjson
32
                path: config.json
33
      '''
34
    }
35
  }
36

37
  environment {
38
    IMAGE_REPO = "reg.westos.org/library/go-demo-app"
39
    IMAGE_TAG = "v1.0.${BUILD_NUMBER}"
40
    GITEA_REPO = "192.168.100.10:30030/admin/go-demo-app.git"
41
  }
42

43
  stages {
44
    stage('Checkout') {
45
      steps {
46
        checkout scm
47
      }
48
    }
49

50
    stage('Build & Push') {
51
      steps {
52
        container('kaniko') {
53
          sh """
54
            /kaniko/executor \
55
            --context `pwd` \
56
            --dockerfile `pwd`/Dockerfile \
57
            --destination ${IMAGE_REPO}:${IMAGE_TAG} \
58
            --destination ${IMAGE_REPO}:latest \
59
            --skip-tls-verify \
60
            --insecure
61
          """
62
        }
63
      }
64
    }
65

66
    stage('Update Manifest') {
67
      steps {
68
        container('git-tools') {
69
          withCredentials([usernamePassword(credentialsId: 'gitea-auth', usernameVariable: 'GIT_USER', passwordVariable: 'GIT_PASS')]) {
70
            sh """
71
              git config --global user.email "jenkins@westos.org"
72
              git config --global user.name "Jenkins CI"
73
              git config --global --add safe.directory '*'
74

75
              git checkout main
76
              git pull origin main
77

78
              sed -i "s|image: ${IMAGE_REPO}:.*|image: ${IMAGE_REPO}:${IMAGE_TAG}|" deploy/deployment.yaml
79

80
              echo "Updated deployment.yaml:"
81
              grep "image:" deploy/deployment.yaml
82

83
              if git status --porcelain | grep deploy/deployment.yaml; then
84
                  git add deploy/deployment.yaml
85
                  git commit -m "Deploy: update image tag to ${IMAGE_TAG} [skip ci]"
86
                  git push http://${GIT_USER}:${GIT_PASS}@${GITEA_REPO} main
87
              else
88
                  echo "No changes to commit"
89
              fi
90
            """
91
          }
92
        }
93
      }
94
    }
95
  }
96
}

推送更新后跑一次构建，去 Gitea 看看 deployment.yaml 有没有自动更新版本号。如果有，去 ArgoCD 看 Pod 有没有重启。这样 CI 闭环就通了。

接入代码扫描 (SonarQube)#

为了显得专业一点，加个代码扫描。

安装 SonarQube#

1
helm repo add sonarqube https://SonarSource.github.io/helm-chart-sonarqube
2
helm repo update
3

4
kubectl create namespace sonarqube
5

6
cat <<EOF > sonar-values.yaml
7
community:
8
  enabled: true
9

10
service:
11
  type: NodePort
12
  nodePort: 30099
13

14
persistence:
15
  enabled: true
16
  storageClass: "nfs-client"
17
  size: 5Gi
18

19
elasticsearch:
20
  configureNode: false
21

22
monitoringPasscode: "westos_monitor_123"
23
EOF
24

25
helm install sonarqube sonarqube/sonarqube -n sonarqube -f sonar-values.yaml
26

27
kubectl get pods -n sonarqube -w

SonarQube 启动比较慢，等个 2-3 分钟。

配置 SonarQube#

访问 http://192.168.100.10:30099，默认账号 admin/admin，首次登录要改密码，我改成了 Admin123456789!。

创建项目：

Create a local project
Project display name: go-demo-app
Project Key: go-demo-app
Main branch name: main
选 “Follows the instance’s default”，点 Create

然后生成 Token，选 “Locally”，点 Generate，复制这个 Token（长这样：sqp_xxxx...）。

配置 Jenkins#

安装插件：SonarQube Scanner
添加凭证：
- Kind: Secret text
- Secret: 粘贴刚才的 Token
- ID: sonar-token
配置系统：
- Manage Jenkins → System → SonarQube servers
- 勾选 “Environment variables”
- Name: sonar-server
- Server URL: http://sonarqube-sonarqube.sonarqube.svc.cluster.local:9000
- Token: 选 sonar-token

修改 Jenkinsfile#

在 Pod Template 里加一个 sonar-cli 容器，然后在 Build 之前加一个 Code Analysis 阶段：

1
// Pod Template 里加这个容器
2
- name: sonar-cli
3
  image: sonarsource/sonar-scanner-cli:latest
4
  command:
5
  - sleep
6
  - infinity
7

8
// stages 里加这个阶段
9
stage('Code Analysis') {
10
    steps {
11
        container('sonar-cli') {
12
            withSonarQubeEnv('sonar-server') {
13
                sh """
14
                    sonar-scanner \
15
                      -Dsonar.projectKey=go-demo-app \
16
                      -Dsonar.sources=. \
17
                      -Dsonar.host.url=http://sonarqube-sonarqube.sonarqube.svc.cluster.local:9000 \
18
                      -Dsonar.login=$SONAR_AUTH_TOKEN
19
                """
20
            }
21
        }
22
    }
23
}

跑一次构建，成功后去 SonarQube 网页看看有没有扫描报告。

bc89b42fa4665e8f773dd677f5bedc8b

资源优化#

这时候我发现集群有点撑不住了，看了下节点资源：

1
kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml
2

3
kubectl patch deployment metrics-server -n kube-system --type='json' -p='[{"op": "add", "path": "/spec/template/spec/containers/0/args/-", "value": "--kubelet-insecure-tls"}]'
4

5
kubectl top nodes

结果：

1
NAME         CPU(cores)   CPU(%)   MEMORY(bytes)   MEMORY(%)
2
k8s-master   134m         6%       1227Mi          74%
3
k8s-node1    133m         6%       5524Mi          73%
4
k8s-node2    59m          2%       856Mi           11%

node1 快累死了，node2 在偷懒。再看看 Pod：

1
kubectl top pods -A --sort-by=memory

1
NAMESPACE     NAME                      CPU(cores)   MEMORY(bytes)
2
sonarqube     sonarqube-sonarqube-0     19m          2186Mi
3
jenkins       jenkins-0                 2m           1495Mi
4
kube-system   kube-apiserver-k8s-master 31m          494Mi

问题很明显：资源分配不均，而且 SonarQube 和 Jenkins 太吃内存了。

调整资源分配#

先把 node1 禁止调度，强制 SonarQube 和 Jenkins 重建到 node2：

1
kubectl cordon k8s-node1
2

3
kubectl delete pod sonarqube-sonarqube-0 -n sonarqube
4
kubectl delete pod -n jenkins -l app.kubernetes.io/name=jenkins
5

6
# 确认跑到 node2 了
7
kubectl -n sonarqube get pod -o wide
8
kubectl -n jenkins get pod -o wide
9

10
# 解封
11
kubectl uncordon k8s-node1

再看节点指标，平衡多了：

1
NAME         CPU(cores)   CPU(%)   MEMORY(bytes)   MEMORY(%)
2
k8s-master   130m         6%       1277Mi          77%
3
k8s-node1    68m          3%       1440Mi          19%
4
k8s-node2    145m         7%       883Mi           11%

限制内存占用#

修改 sonar-values.yaml，加上资源限制：

1
resources:
2
  requests:
3
    cpu: "200m"
4
    memory: "1Gi"
5
  limits:
6
    cpu: "1000m"
7
    memory: "1800Mi"
8

9
jvmCeOpts: "-Xmx1024m -Xms512m"
10
jvmOpts: "-Xmx1024m -Xms512m"

更新：

1
helm upgrade sonarqube sonarqube/sonarqube -n sonarqube -f sonar-values.yaml

修改 jenkins-manual.yaml：

1
controller:
2
  javaOpts: "-Xms512m -Xmx800m -Djenkins.install.runSetupWizard=false"
3

4
  resources:
5
    requests:
6
      cpu: "200m"
7
      memory: "512Mi"
8
    limits:
9
      cpu: "1000m"
10
      memory: "1280Mi"

更新：

1
helm upgrade jenkins jenkins/jenkins -n jenkins -f jenkins-manual.yaml

再看内存占用：

1
NAMESPACE     NAME                      CPU(cores)   MEMORY(bytes)
2
sonarqube     sonarqube-sonarqube-0     913m         767Mi
3
kube-system   kube-apiserver-k8s-master 53m          530Mi
4
jenkins       jenkins-0                 945m         328Mi

优化效果很明显，虽然还是有点卡，但至少不会整个节点崩溃了。

全链路监控#

接下来搞监控，用 Prometheus + Grafana + Loki。

部署 kube-prometheus-stack#

1
cat <<EOF > monitor-values.yaml
2
grafana:
3
  service:
4
    type: NodePort
5
    nodePort: 30000
6

7
prometheus:
8
  prometheusSpec:
9
    retention: 5d
10
    resources:
11
      requests:
12
        memory: 512Mi
13
        cpu: 200m
14
      limits:
15
        memory: 1Gi
16
        cpu: 1000m
17
    serviceMonitorSelectorNilUsesHelmValues: false
18
    serviceMonitorSelector: {}
19
    serviceMonitorNamespaceSelector: {}
20

21
alertmanager:
22
  alertmanagerSpec:
23
    replicas: 1
24

25
kubeStateMetrics:
26
  enabled: true
27
nodeExporter:
28
  enabled: true
29
EOF
30

31
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
32
helm repo update
33

34
kubectl create ns monitoring
35

36
helm install prometheus prometheus-community/kube-prometheus-stack \
37
  -n monitoring \
38
  -f monitor-values.yaml
39

40
kubectl get pods -n monitoring -w

监控 Jenkins#

在 Jenkins 安装插件 Prometheus metrics，重启后访问 http://192.168.100.10:30080/prometheus/ 能看到指标就行。

创建 jenkins-monitor.yaml：

1
apiVersion: monitoring.coreos.com/v1
2
kind: ServiceMonitor
3
metadata:
4
  name: jenkins
5
  namespace: monitoring
6
  labels:
7
    release: prometheus
8
spec:
9
  selector:
10
    matchLabels:
11
      app.kubernetes.io/instance: jenkins
12
  namespaceSelector:
13
    matchNames:
14
      - jenkins
15
  endpoints:
16
  - port: http
17
    path: /prometheus/
18
    interval: 15s

应用：

1
kubectl apply -f jenkins-monitor.yaml

访问 Grafana#

访问 http://192.168.100.10:30000，账号 admin，密码用命令查：

1
kubectl -n monitoring get secret prometheus-grafana \
2
  -o jsonpath="{.data.admin-password}" | base64 -d ; echo

我的密码是：sgbrApYRHjBKbJzdv7YbS1LgGZGqPAToqZ4x1NDj

进入 Grafana，左侧菜单 Dashboards → New → Import，输入 Dashboard ID 24357，数据源选 Prometheus，点 Import。

就能看到 Jenkins 的监控大盘了。

41296523d2e7871e17230893838f035e

也可以导入 16098 和 13105 看主机和 K8s 集群的信息。

632560302e3e4f84aeb5652c240c72e8

f37460f220035f8709ae67dd8e91c373

监控 Go 应用#

创建 app-monitor.yaml：

1
apiVersion: monitoring.coreos.com/v1
2
kind: ServiceMonitor
3
metadata:
4
  name: go-demo-app
5
  namespace: monitoring
6
  labels:
7
    release: prometheus
8
spec:
9
  selector:
10
    matchLabels:
11
      app: go-demo-app
12
  namespaceSelector:
13
    matchNames:
14
      - default
15
  endpoints:
16
  - port: http
17
    path: /metrics
18
    interval: 5s

应用：

1
kubectl apply -f app-monitor.yaml

在 Grafana 的 Explore 里搜索 go_goroutines 或 process_cpu_seconds_total，能看到图表就说明成功了。

日志聚合 (Loki)#

Grafana 已经装了，只需要装 Loki 和 Promtail。

1
helm repo add grafana https://grafana.github.io/helm-charts
2
helm repo update
3

4
kubectl create ns logging
5

6
cat <<EOF > loki-values.yaml
7
loki:
8
  enabled: true
9

10
  image:
11
    repository: grafana/loki
12
    tag: "2.9.3"  # 默认的 2.6 版本 Grafana 连不上
13
    pullPolicy: IfNotPresent
14

15
  config:
16
    auth_enabled: false
17

18
  commonConfig:
19
    replication_factor: 1
20

21
  storage:
22
    type: filesystem
23

24
  singleBinary:
25
    replicas: 1
26

27
  resources:
28
    requests:
29
      cpu: 100m
30
      memory: 256Mi
31
    limits:
32
      memory: 512Mi
33

34
promtail:
35
  enabled: true
36
  config:
37
    clients:
38
      - url: http://loki:3100/loki/api/v1/push
39
EOF
40

41
helm install loki grafana/loki-stack -n logging -f loki-values.yaml

配置 Grafana 数据源#

进入 Grafana → Connections → Data Sources → Add data source → 选择 Loki。

URL 填：http://loki.logging.svc.cluster.local:3100

点 Save & Test。

验证日志#

进入 Grafana → Explore → 数据源选 Loki。

Label filters 选 namespace = jenkins 或 default，点 Run query。

现在不仅能看到 CPU 曲线，还能在同一个页面看到 Pod 的日志，全链路可视化就实现了。

Argo Rollouts 灰度发布#

最后搞个灰度发布，实现无人值守自动上线。

安装 Argo Rollouts#

1
kubectl create namespace argo-rollouts
2

3
kubectl apply -n argo-rollouts -f https://github.com/argoproj/argo-rollouts/releases/latest/download/install.yaml
4

5
# 安装 kubectl 插件
6
curl -LO https://github.com/argoproj/argo-rollouts/releases/latest/download/kubectl-argo-rollouts-linux-amd64
7
chmod +x ./kubectl-argo-rollouts-linux-amd64
8
mv ./kubectl-argo-rollouts-linux-amd64 /usr/local/bin/kubectl-argo-rollouts
9

10
kubectl get pods -n argo-rollouts

创建 AnalysisTemplate#

在 go-demo-app 仓库的 deploy 目录下，新建 analysis.yaml：

1
apiVersion: argoproj.io/v1alpha1
2
kind: AnalysisTemplate
3
metadata:
4
  name: success-rate-check
5
  namespace: default
6
spec:
7
  args:
8
  - name: service-name
9
  metrics:
10
  - name: success-rate
11
    successCondition: result[0] == 1
12
    provider:
13
      prometheus:
14
        address: http://prometheus-kube-prometheus-prometheus.monitoring:9090
15
        query: |
16
          # 演示用的查询，永远返回 1
17
          # 生产环境应该改成真实的成功率查询
18
          vector(1)

将 Deployment 升级为 Rollout#

修改 deploy/deployment.yaml，主要改动：

apiVersion 改为 argoproj.io/v1alpha1
kind 改为 Rollout
replicas 改为 5（方便看灰度效果）
加上 strategy.canary 配置

1
apiVersion: argoproj.io/v1alpha1
2
kind: Rollout
3
metadata:
4
  name: go-demo-app
5
  namespace: default
6
  labels:
7
    app: go-demo-app
8
spec:
9
  replicas: 5
10
  selector:
11
    matchLabels:
12
      app: go-demo-app
13
  strategy:
14
    canary:
15
      steps:
16
      - setWeight: 20  # 先切 20% 流量
17
      - analysis:
18
          templates:
19
          - templateName: success-rate-check
20
          args:
21
          - name: service-name
22
            value: go-demo-app
23
      - pause: {duration: 30s}  # 人工观察 30 秒
24
      - setWeight: 50  # 再切 50% 流量
25
      - pause: {duration: 10s}
26
      - setWeight: 100  # 最后全量上线
27
  template:
28
    metadata:
29
      labels:
30
        app: go-demo-app
31
      annotations:
32
        prometheus.io/scrape: "true"
33
        prometheus.io/port: "8080"
34
        prometheus.io/path: "/metrics"
35
    spec:
36
      hostAliases:
37
      - ip: "192.168.100.14"
38
        hostnames:
39
        - "reg.westos.org"
40
      containers:
41
      - name: go-demo-app
42
        image: reg.westos.org/library/go-demo-app:latest
43
        imagePullPolicy: Always
44
        ports:
45
        - containerPort: 8080
46
        resources:
47
          limits:
48
            cpu: "200m"
49
            memory: "128Mi"
50
        readinessProbe:
51
          httpGet:
52
            path: /health
53
            port: 8080
54
          initialDelaySeconds: 5
55
          periodSeconds: 10
56
      imagePullSecrets:
57
      - name: harbor-auth
58
---
59
apiVersion: v1
60
kind: Service
61
metadata:
62
  name: go-demo-app-svc
63
  namespace: default
64
  labels:
65
    app: go-demo-app
66
spec:
67
  type: NodePort
68
  selector:
69
    app: go-demo-app
70
  ports:
71
  - name: http
72
    port: 8080
73
    targetPort: 8080
74
    nodePort: 30095

删除旧的 Deployment：

1
kubectl delete deployment go-demo-app

推送到 Gitea，去 ArgoCD 点 Sync。

模拟灰度发布#

开一个终端窗口，实时监控 Rollout 状态：

1
kubectl argo rollouts get rollout go-demo-app -n default -w

然后去 Jenkins 跑一次构建。

观察过程：

Step 1: 状态变为 Paused，新版本 Pod 启动 1 个（20%），旧版本 4 个
Analysis: 后台跑 AnalysisRun，连 Prometheus 查询 vector(1)
Pass: 如果 Prometheus 连接正常，Analysis 显示 Successful
Step 2: 权重自动增加到 50%
Complete: 最终权重变成 100%，旧版本 Pod 全部消失

163492a4e552faed921a6f7c10858de8

全部切为新版本

82815ed2de155af98b23e71eff469d7a

整个过程完全自动化，无需人工介入。这就是 GitOps + 灰度发布的魅力。

小结#

折腾了这么多天，从基础的 CI/CD 到代码扫描、全链路监控、灰度发布，整个云原生工具链算是体验了一遍。虽然中途遇到不少资源不足、配置错误的问题，但每次解决问题都能学到新东西。

最大的感受就是：云原生不是银弹，但确实能解决很多传统部署方式解决不了的问题。比如灰度发布，以前要写一堆脚本，现在一个 YAML 就搞定了。

Simple Blog

从一个 Go 项目开始#

创建项目#

写代码#

Dockerfile#

推送到 Gitea#

配置 Jenkins Pipeline#

准备 K8s 部署文件#

实现 CI 闭环#

修改 Jenkinsfile#

接入代码扫描 (SonarQube)#

安装 SonarQube#

配置 SonarQube#

配置 Jenkins#

修改 Jenkinsfile#

资源优化#

调整资源分配#

限制内存占用#

全链路监控#

部署 kube-prometheus-stack#

监控 Jenkins#

访问 Grafana#

监控 Go 应用#

日志聚合 (Loki)#

配置 Grafana 数据源#

验证日志#

Argo Rollouts 灰度发布#

安装 Argo Rollouts#

创建 AnalysisTemplate#

将 Deployment 升级为 Rollout#

模拟灰度发布#

小结#