下記のライブラリを使って、データ品質やバイアス・ドリフト検知を行うサンプルコードをまとめたリポジトリとなります.
cd deequ
docker build -t sample_deequ:1.0 .
docker run -it -v /<リポジトリをダウンロードしたフォルダの絶対パス>/sample_data_quality/deequ/:/home/codes sample_deequ:1.0 /bin/bash
dockerコンテナ上で実行する
python sample_deequ.py
リポジトリのrootフォルダーで下記を実行する.
docker-compose up -d
docker imageをリビルドする場合は下記.
docker-compose up --build -d
下記をホストマシンのブラウザに入力する.
jupyter notebook環境で作成したnotebookファイルや他ファイルについては, notebookフォルダに格納される.
notebook上で下記のコードを追加し, JAVA SDKのパスを設定する.
%env JAVA_HOME=/root/.sdkman/candidates/java/current