aojea · March 18, 2024 05:54
diff --git a/README.md b/README.md
diff --git a/monitoring.yaml b/monitoring.yaml
 ---
 apiVersion: v1
 kind: Namespace
 metadata:
  name: monitoring
 ---
 apiVersion: v1
 kind: Service
 metadata:
  name: prometheus-service
  namespace: monitoring
  annotations:
      prometheus.io/scrape: 'true'
      prometheus.io/port:   '9090'
 spec:
  selector: 
    app: prometheus-server
  type: NodePort
  ports:
    - port: 8080
      targetPort: 9090 
 ---
 apiVersion: rbac.authorization.k8s.io/v1
 kind: ClusterRole
 metadata:
  name: prometheus
 rules:
 - apiGroups: [""]
  resources:
  - nodes
  - nodes/proxy
  - services
  - endpoints
  - pods
  verbs: ["get", "list", "watch"]
 - apiGroups:
  - extensions
  resources:
  - ingresses
  verbs: ["get", "list", "watch"]
 - nonResourceURLs: ["/metrics"]
  verbs: ["get"]
 ---
 apiVersion: rbac.authorization.k8s.io/v1
 kind: ClusterRoleBinding
 metadata:
  name: prometheus
 roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: prometheus
 subjects:
 - kind: ServiceAccount
  name: default
  namespace: monitoring
 ---
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: prometheus-server-conf
  labels:
    name: prometheus-server-conf
  namespace: monitoring
 data:
  prometheus.yml: |-
    global:
      scrape_interval: 5s
      evaluation_interval: 5s
    scrape_configs:
      - job_name: 'kubernetes-apiservers'
        kubernetes_sd_configs:
        - role: endpoints
        scheme: https
        tls_config:
          ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
        relabel_configs:
        - source_labels: [__meta_kubernetes_namespace, __meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
          action: keep
          regex: default;kubernetes;https

      - job_name: 'kubernetes-controller-manager'
        honor_labels: true
        scheme: https
        tls_config:
          ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          insecure_skip_verify: true
        bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
        static_configs:
          - targets:
            - 127.0.0.1:10257

      - job_name: 'kubernetes-nodes'
        scheme: https
        tls_config:
          ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
        kubernetes_sd_configs:
        - role: node
        relabel_configs:
        - action: labelmap
          regex: __meta_kubernetes_node_label_(.+)
        - target_label: __address__
          replacement: localhost:6443
        - source_labels: [__meta_kubernetes_node_name]
          regex: (.+)
          target_label: __metrics_path__
          replacement: /api/v1/nodes/${1}/proxy/metrics

      - job_name: 'kubernetes-cadvisor'
        scheme: https
        tls_config:
          ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
        kubernetes_sd_configs:
        - role: node
        relabel_configs:
        - action: labelmap
          regex: __meta_kubernetes_node_label_(.+)
        - target_label: __address__
          replacement: localhost:6443
        - source_labels: [__meta_kubernetes_node_name]
          regex: (.+)
          target_label: __metrics_path__
          replacement: /api/v1/nodes/${1}/proxy/metrics/cadvisor

      - job_name: cilium
        honor_labels: true
        kubernetes_sd_configs:
        - role: pod
        relabel_configs:
        - action: keep
          source_labels:
          - __meta_kubernetes_namespace
          - __meta_kubernetes_pod_name
          separator: '/'
          regex: 'kube-system/cilium.+'
        - source_labels:
          - __address__
          action: replace
          target_label: __address__
          regex: (.+?)(\\:\\d+)?
          replacement: $1:9962
 ---          
 apiVersion: v1
 kind: Pod
 metadata:
  name: prometheus
  namespace: monitoring
  labels:
    app: prometheus-server
 spec:
  hostNetwork: true
  nodeSelector:
    node-role.kubernetes.io/control-plane: ""
  tolerations:
  - key: CriticalAddonsOnly
    operator: Exists
  - effect: NoSchedule
    key: node-role.kubernetes.io/master
  - effect: NoSchedule
    key: node-role.kubernetes.io/control-plane
  containers:
    - name: prometheus
      image: prom/prometheus:v2.43.1
      args:
        - "--config.file=/etc/prometheus/prometheus.yml"
        - "--storage.tsdb.path=/prometheus/"
        - "--web.enable-admin-api"
      ports:
        - containerPort: 9090
      volumeMounts:
        - name: prometheus-config-volume
          mountPath: /etc/prometheus/
        - name: prometheus-storage-volume
          mountPath: /prometheus/
  volumes:
    - name: prometheus-config-volume
      configMap:
        defaultMode: 420
        name: prometheus-server-conf
    - name: prometheus-storage-volume
      emptyDir: {}
diff --git a/stress-pod.yaml b/stress-pod.yaml
 apiVersion: batch/v1
 kind: Job
 metadata:
  name: busybox2
 spec:
  completions: 200
  parallelism: 50
  template:
    spec:
      nodeName: kind-worker
      containers:
      - name: busybox
        image: busybox
        resources:
          requests:
            cpu: "1000m"
        command:
        - /bin/sh
        - -c
        - |
          echo "starting!"
          sleep 5s
          _term() {
            echo "trapped sigterm"
            sleep 99999s
          }
          trap _term TERM
      restartPolicy: Never
  backoffLimit: 4
	---
	apiVersion: v1
	kind: Namespace
	metadata:
	name: monitoring
	---
	apiVersion: v1
	kind: Service
	metadata:
	name: prometheus-service
	namespace: monitoring
	annotations:
	prometheus.io/scrape: 'true'
	prometheus.io/port: '9090'
	spec:
	selector:
	app: prometheus-server
	type: NodePort
	ports:
	- port: 8080
	targetPort: 9090
	---
	apiVersion: rbac.authorization.k8s.io/v1
	kind: ClusterRole
	metadata:
	name: prometheus
	rules:
	- apiGroups: [""]
	resources:
	- nodes
	- nodes/proxy
	- services
	- endpoints
	- pods
	verbs: ["get", "list", "watch"]
	- apiGroups:
	- extensions
	resources:
	- ingresses
	verbs: ["get", "list", "watch"]
	- nonResourceURLs: ["/metrics"]
	verbs: ["get"]
	---
	apiVersion: rbac.authorization.k8s.io/v1
	kind: ClusterRoleBinding
	metadata:
	name: prometheus
	roleRef:
	apiGroup: rbac.authorization.k8s.io
	kind: ClusterRole
	name: prometheus
	subjects:
	- kind: ServiceAccount
	name: default
	namespace: monitoring
	---
	apiVersion: v1
	kind: ConfigMap
	metadata:
	name: prometheus-server-conf
	labels:
	name: prometheus-server-conf
	namespace: monitoring
	data:
	prometheus.yml: \|-
	global:
	scrape_interval: 5s
	evaluation_interval: 5s
	scrape_configs:
	- job_name: 'kubernetes-apiservers'
	kubernetes_sd_configs:
	- role: endpoints
	scheme: https
	tls_config:
	ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
	bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
	relabel_configs:
	- source_labels: [__meta_kubernetes_namespace, __meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
	action: keep
	regex: default;kubernetes;https

	- job_name: 'kubernetes-controller-manager'
	honor_labels: true
	scheme: https
	tls_config:
	ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
	insecure_skip_verify: true
	bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
	static_configs:
	- targets:
	- 127.0.0.1:10257

	- job_name: 'kubernetes-nodes'
	scheme: https
	tls_config:
	ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
	bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
	kubernetes_sd_configs:
	- role: node
	relabel_configs:
	- action: labelmap
	regex: __meta_kubernetes_node_label_(.+)
	- target_label: __address__
	replacement: localhost:6443
	- source_labels: [__meta_kubernetes_node_name]
	regex: (.+)
	target_label: __metrics_path__
	replacement: /api/v1/nodes/${1}/proxy/metrics

	- job_name: 'kubernetes-cadvisor'
	scheme: https
	tls_config:
	ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
	bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
	kubernetes_sd_configs:
	- role: node
	relabel_configs:
	- action: labelmap
	regex: __meta_kubernetes_node_label_(.+)
	- target_label: __address__
	replacement: localhost:6443
	- source_labels: [__meta_kubernetes_node_name]
	regex: (.+)
	target_label: __metrics_path__
	replacement: /api/v1/nodes/${1}/proxy/metrics/cadvisor

	- job_name: cilium
	honor_labels: true
	kubernetes_sd_configs:
	- role: pod
	relabel_configs:
	- action: keep
	source_labels:
	- __meta_kubernetes_namespace
	- __meta_kubernetes_pod_name
	separator: '/'
	regex: 'kube-system/cilium.+'
	- source_labels:
	- __address__
	action: replace
	target_label: __address__
	regex: (.+?)(\\:\\d+)?
	replacement: $1:9962
	---
	apiVersion: v1
	kind: Pod
	metadata:
	name: prometheus
	namespace: monitoring
	labels:
	app: prometheus-server
	spec:
	hostNetwork: true
	nodeSelector:
	node-role.kubernetes.io/control-plane: ""
	tolerations:
	- key: CriticalAddonsOnly
	operator: Exists
	- effect: NoSchedule
	key: node-role.kubernetes.io/master
	- effect: NoSchedule
	key: node-role.kubernetes.io/control-plane
	containers:
	- name: prometheus
	image: prom/prometheus:v2.43.1
	args:
	- "--config.file=/etc/prometheus/prometheus.yml"
	- "--storage.tsdb.path=/prometheus/"
	- "--web.enable-admin-api"
	ports:
	- containerPort: 9090
	volumeMounts:
	- name: prometheus-config-volume
	mountPath: /etc/prometheus/
	- name: prometheus-storage-volume
	mountPath: /prometheus/
	volumes:
	- name: prometheus-config-volume
	configMap:
	defaultMode: 420
	name: prometheus-server-conf
	- name: prometheus-storage-volume
	emptyDir: {}
	apiVersion: batch/v1
	kind: Job
	metadata:
	name: busybox2
	spec:
	completions: 200
	parallelism: 50
	template:
	spec:
	nodeName: kind-worker
	containers:
	- name: busybox
	image: busybox
	resources:
	requests:
	cpu: "1000m"
	command:
	- /bin/sh
	- -c
	- \|
	echo "starting!"
	sleep 5s
	_term() {
	echo "trapped sigterm"
	sleep 99999s
	}
	trap _term TERM
	restartPolicy: Never
	backoffLimit: 4