Knative Auto Scaling 설정하기
KPA/HPA
- KPA(Knative Pod Autoscaler)
- Knative에서 제공하는 기본적인 Pod Autoscaler입니다.
- 0으로 스케일이 가능합니다.
concurrency
,rps
기준으로 Autoscaling을 지원합니다.
- HPA(Horizontal Pod Autoscaler)
- Kubernetes에서 제공하는 Pod Autoscaler입니다.
- 0으로 스케일이 불가능합니다.
cpu
,memory
,<custom-metric>
기준으로 Autoscaling을 지원합니다.- 확장프로그램 설치가 필요합니다.
- 전역 설정(Operator)
- Revision별 설정
apiVersion: operator.knative.dev/v1alpha1
kind: KnativeServing
spec:
config:
autoscaler:
pod-autoscaler-class: kpa.autoscaling.knative.dev # kpa.autoscaling.knative.dev|hpa.autoscaling.knative.dev
apiVersion: serving.knative.dev/v1
kind: Service
spec:
template:
metadata:
annotations:
autoscaling.knative.dev/class: kpa.autoscaling.knative.dev # kpa.autoscaling.knative.dev|hpa.autoscaling.knative.dev