カメラ映像から入力される動画(画像)を、「サトウキビ」「パイナップル」「雑草」に分類し、バウンディングボックスを表示させます。
推論には、こちらのリポジトリで作成したモデルを使って行います。
モデルは、YOLO v7とNASを使用しています。
また、GUIアプリのフレームワークには、CustomTkinterというPythonでGUIアプリが作れるものを使っています。
※画像がリンク切れを起こしていますが、画像の所在が不明なので対処できていません。
テスト用の動画ファイルを扱うために、git-lfsをインストールしてください。
# mac
brew install git-lfs
# windows
# https://git-lfs.github.com/ からインストーラをダウンロードしてインストール
# git-lfsの初期化
git lfs install
git clone git@github.com:TechC-SugarCane/ImageRecognitionWinApp.git
cd ImageRecognitionWinApp
pyenv install
python -m venv .venv
# mac
source .venv/bin/activate
# windows
.venv\Scripts\activate
# CPUで推論を行う場合
pip install -r requirements-cpu.txt
# GPUで推論を行う場合
pip install -r requirements-gpu.txt
こちらに従い、すべてのモデルをダウンロードしてください。
その後、model
ディレクトリにダウンロードしたモデルを配置してください。
python setup_view.py
# テスト用の動画を使って推論を行う場合
python setup_view.py --test
# serial通信を使って、ノズルから噴出させる場合
python setup_view.py --serial
コントリビューター向けのガイドラインについては、こちらのCONTRIBUTING.mdを参照してください。