Closed RyanKor closed 2 years ago
- Component - MLFlow의 Run 파트 코드를 복사 붙여넣기 후, 실행하여 yaml 파일을 생성했습니다.
생성을 시도한 python 가상환경/kfp 패키지 버전 정보 및 생성된 yaml 파일을 첨부해주실 수 있나요?
예를 들어, python 3.9.6, kfp==1.8.10 에서 컴파일한 결과 yaml 파일은 다음과 같이 생성되었으며, 파이프라인 실행 결과도 정상적으로 실행되었습니다. (마지막 컴포넌트가 실패한 이유는 제가 테스트한 환경의 MLFLOW_S3_ENDPOINT_URL
, AWS_ACCESS_KEY_ID
, AWS_SECRET_ACCESS_KEY
가 다르기 때문에 발생한 것이므로 무시하셔도 됩니다.)
python 코드와 함게 생성된 yaml 내용이 함께 PR되면 좋을 것 같습니다.
좋은 의견입니다!
@anencore94 넵, 물론입니다.
하단이 생성된 yaml 코드입니다.
파이썬 버전은 3.8.10
이며, kfp는 1.8.9
입니다.
제 kubeflow 환경에서는 올려주신 pipeline 을 그대로 실행해도 동일하게 실행되네요. 테스트해보신 kubeflow, k8s cluster 환경 정보도 올려주실 수 있을까요?
@anencore94 Kubeflow는 1.4.0
이며, K8s 대신 k3s를 설치해서 1.21.7
을 사용하고 있습니다!
음 우선 해당 환경에서 잠깐 캐시를 끄고 (https://www.kubeflow.org/docs/components/pipelines/overview/caching/#disabling-caching-in-your-kubeflow-pipelines-deployment)
Load iris data 컴포넌트의 결과로 얻어진 Output data 를 다시 한 번 직접 다운받으셔서 데이터가 비어있는지 확인해보시겠어요?
@anencore94 감사합니다, 해결되었습니다!
1. 에러 재현
12. Component - MLFlow
의 Run 파트 코드를 복사 붙여넣기 후, 실행하여 yaml 파일을 생성했습니다.이후 생성된 yaml 파일을 kubeflow pipeline에 올려 실행하면, 다음과 같은 에러 화면을 마주하게 되었습니다.
13번 내용이 디버깅이라, 이후 내용을 보면서 데이터가 비어있는 것 같아 kubeflow에 올라와 있는 tgz 파일을 csv로 변환해 주피터 노트북에서 확인해봤으나, 데이터가 비어있는 상황은 아닌 것 같았습니다.
정황상 SVM 훈련을 위한 데이터는 존재하는 것 같은데, 해당 에러가 발생하는 부분을 특정할 수가 없어 (svm fit 부분이라 모델 훈련이 진행되는 위치라 짐작되나, 로컬 컴퓨터에서 kfp 설치 후
from kfp.components import InputPath, OutputPath, create_component_from_func
가 실행되지 않아 유독 디버깅이 어려워진 것 같습니다.) issue를 남깁니다.해당 에러를 해결 후,
12. Component - MLFlow
의 Run 파트가 수정되어야 한다면, python 코드와 함게 생성된 yaml 내용이 함께 PR되면 좋을 것 같습니다.