TIL/Monitoring(k8s, grafana)

[AI, Kubeflow] Kubeflow bootstrap 소개

쓱쓱565 2025. 1. 24. 23:07

1. TL;DR

온프레미스 클러스터 환경에 Kubeflow를 설치하려 한다. Kubeflow Bootstrap 이라는 툴을 활용해 설치 및 배포했다.

개발 환경

RKE2 1.27 (on-premise)
ArgoCD 3.X

2. 개요

Kubeflow 공식문서에서는 두 가지의 설치 방법을 제안한다.
Installing Kubeflow

1) Standalone Kubeflow Components

kubeflow의 component들 중 필요한 것들만 직접 골라서 설치하는 방법.
빠르게 환경을 구성한 후 외부 솔루션과의 차이점을 비교해보는 것이 목적이었기에 선택하지 않음.

2) Kubeflow Platform

주요 component들을 이미 묶어둔 패키지들. 각 관리형 쿠버네티스별로 다양한 package가 존재한다.

초기에는 deployKF를 사용해 kubeflow를 배포하려 했었다.
사유는 아래와 같다.

  1. ArgoCD 호환성 - 가이드 문서까지 argoCD를 사용하는 것을 전제로 작성되어 좋았다.
  2. 유지보수가 쉬우리라고 판단됨

최종적으로 해당 플랫폼을 사용하지 않게 된 이유는 아래와 같다.

  1. 설치의 불편함 - 초기 구성을 위해 ArgoCD, Kubectl, jq 등이 설치된 shell 환경이 필수적이다.
  2. 설치 시 자체 버그 - instruction을 그대로 따랐으나 cert-manager의 pod가 생성되지 않은 상태에서 서로를 health-check하며 sync가 진행되지 않는 오류
  3. 레퍼런스를 찾기 힘듦

3. 설치

  1. helm chart 다운로드
  2. ArgoCD에서 applicatoin 등롣
  3. 설치

4. 실행(테스트)

  1. istio-ingressgateway 를 port-foward
  2. example@email.com / 12341234 로 접속