書籍「GANディープラーニング実装ハンドブック」のサポートサイトです。本書籍で使用するサンプルコードがまとめてあります。
ライブラリは執筆時点のColabの最新バージョンになります。Colabのライブラリは定期的に更新するので、プログラム実行時にエラーが発生する場合はバージョンを戻して実行してください。
章 | モデル | データセット | ライセンス | 取得元リンク |
---|---|---|---|---|
2 | AE、VAE | MNIST | Creative Commons | https://pytorch.org/vision/0.8/datasets.html |
3 | DCGAN、CGAN | MNIST | Creative Commons | https://pytorch.org/vision/0.8/datasets.html |
3 | LSGAN、DCGAN | Pet Dataset | Creative Commons | https://www.robots.ox.ac.uk/~vgg/data/pets/ |
4 | ESRGAN | Pet Dataset | Creative Commons | https://www.robots.ox.ac.uk/~vgg/data/pets/ |
5 | pix2pix、CycleGAN | photo2portrait | データセットの画像をインターネット等で公開したり、販売するのは禁止です。 | https://drive.google.com/file/d/13qICIuYxV4babtPLjkmg-Y4DzU8_D5wN/view?usp=sharing |
6 | Cycle GAN、Recycle-GAN | VidTIMIT Audio-Video Dataset | リンク先のLICENSEに利用時の注事事項の記載あり | https://conradsanderson.id.au/vidtimit/ |
7 | StyleGAN、StyleGAN2 | Endless Summer Dataset | データセットの画像をインターネット等で公開したり、販売するのは禁止です。 | https://drive.google.com/file/d/1LM4FtUltzS45PuFyfuSp3I8QdTD8Cu0F/view?usp=sharing |
8 | AnoGAN、EfficientGAN | Fruits 360 Dataset | Creative Commons | https://data.mendeley.com/datasets/rp73yg93n8/1 |
9 | 3D-α-WGAN-GP | IXI Dataset | Creative Commons | http://brain-development.org/ixi-dataset/ |
章 | モデル | 注意点 | 学習の目安時間 |
---|---|---|---|
3 | LSGAN、DCGAN | LSGANよりDCGANの方が猫っぽい画像を生成します。 | 5~6時間程度 |
4 | ESRGAN | デフォルト設定だとファイルはColabに保存されるので、Google Driveに保存したい場合は出力ファイルのパスの定義(output_dir)をGoogle Driveに変更してください。 | 5~6時間程 |
5 | pix2pix, CycleGAN | 特になし | 5〜8時間程度 |
6 | CycleGAN 、Recycle-GAN | 特になし | 半日から数日 |
7 | StyleGAN、StyleGAN2 | GPUは執筆時点で最速のP100を推奨(理想はV100)。 | P100で2週間程度 |
8 | AnoGAN、EfficientGAN、 EfficientGAN_L1 |
AnoGAN, EfficientGANで生成精度が悪い場合、EfficientGAN_L1を使用してください。 | 2 ~ 3時間程度 |
9 | 3D-α-WGAN-GP | 特になし | 8時間程度 |
章 | モデル | 説明 | 生成画像 |
---|---|---|---|
3 | DCGAN | サイズ128×128の猫画像を生成 | |
4 | ESRGAN | 低解像画像を入力し、超解像画像を生成 左側: 低解像画像 中央: 本物画像 右側: 生成画像(超解像画像) |
|
5 | CycleGAN | 肖像画を入力し、写真画像を生成 上側: 肖像画 下側: 写真画像 |
|
6 | Recycle-GAN | 女性Aの画像を入力し、同じ向き、同じ表情の別の女性Bの画像を生成 左側: 女性A 右側: 女性B |
|
7 | StyleGAN2 | 512×512の画像を生成 | |
8 | AnoGAN、EfficientGAN | サイズ96×96のほおずきの画像を生成 左側: 入力画像 中央: 生成画像 右側: 差分画像 上段は本物画像を入力したため、本物と生成の差が小さく異常スコアが低い 下段は異常画像を入力したため、生成画像は異常箇所を再現できず、異常スコアが高い |
|
9 | 3D-α-WGAN-GP | サイズ64×64×64の3次元頭部MRIデータを生成 1行目は1つの3次元データを異なる断面で2次元化したデータ 左側: 矢状面(左右の断面) 中央: 冠状面(前後の断面) 右側: 横断面(上下の断面) 2・3行目は同じデータを矢状面で断面をずらしながらスライスしたデータ |
|
サンプルコードの間違いや動作不具合は本リポジトリのIssuesに投稿ください。
動作不具合についての投稿では、以下を記載ください。
ページ | 誤 | 正 | 補足 |
---|---|---|---|
3章 p52 1行目 | パラメータを待つモデル分布 | パラメータを持つモデル分布 | |
7章 p281 活用メモ | 左の方が、よりハイスペックになります。 | 右の方が、よりハイスペックになります。 | |
7章 p281 活用メモ | Colabo pro | Colab pro |
日付 | 変更内容 |
---|---|
2021/02/13 | 初版 |
2023/01/23 | 8 章データダウンロードurlをアップデート(データの中身は同じです) |