1. TL;DR
온프레미스 클러스터 환경에 Kubeflow를 설치하려 한다. Kubeflow Bootstrap 이라는 툴을 활용해 설치 및 배포했다.
개발 환경
RKE2 1.27 (on-premise)
ArgoCD 3.X
2. 개요
Kubeflow 공식문서에서는 두 가지의 설치 방법을 제안한다.
Installing Kubeflow
1) Standalone Kubeflow Components
kubeflow의 component들 중 필요한 것들만 직접 골라서 설치하는 방법.
빠르게 환경을 구성한 후 외부 솔루션과의 차이점을 비교해보는 것이 목적이었기에 선택하지 않음.
2) Kubeflow Platform
주요 component들을 이미 묶어둔 패키지들. 각 관리형 쿠버네티스별로 다양한 package가 존재한다.
초기에는 deployKF
를 사용해 kubeflow를 배포하려 했었다.
사유는 아래와 같다.
- ArgoCD 호환성 - 가이드 문서까지 argoCD를 사용하는 것을 전제로 작성되어 좋았다.
- 유지보수가 쉬우리라고 판단됨
최종적으로 해당 플랫폼을 사용하지 않게 된 이유는 아래와 같다.
- 설치의 불편함 - 초기 구성을 위해 ArgoCD, Kubectl, jq 등이 설치된 shell 환경이 필수적이다.
- 설치 시 자체 버그 - instruction을 그대로 따랐으나 cert-manager의 pod가 생성되지 않은 상태에서 서로를 health-check하며 sync가 진행되지 않는 오류
- 레퍼런스를 찾기 힘듦
3. 설치
- helm chart 다운로드
- ArgoCD에서 applicatoin 등롣
- 설치
4. 실행(테스트)
- istio-ingressgateway 를 port-foward
example@email.com
/12341234
로 접속
'TIL > Monitoring(k8s, grafana)' 카테고리의 다른 글
[모니터링, k8s]RKE2 기반 k8s 모니터링 (0) | 2025.02.21 |
---|---|
[Grafana]pod 생성 시 user provisioning (0) | 2025.02.06 |
[Loki, K8s] 원인 불명의 Loki - CrashLoopBackOff 문제 해결 (EBS 용량 ) (0) | 2025.01.07 |
[K8s, Grafana] Loki 데이터량 확인 및 유지기간 설정 방법 확인(2.6.1) (0) | 2024.12.10 |
[RKE2] Too many open files 로 발생하는 crashLoopBackOff 에러 해결 (0) | 2024.12.01 |