sociocom / DNorm-J

Japanese version of DNorm
BSD 2-Clause "Simplified" License
9 stars 2 forks source link

バイナリデータをリポジトリから削除すべき #1

Closed shuntaroy closed 4 years ago

shuntaroy commented 4 years ago

Git/GitHubはコード(スクリプト)を管理するものなので,モデルなどのバイナリデータは別途どこかのデータ置き場からダウンロードする方が良いと思います. .git がどんどん重くなり,追々クローンするのが大変になるなどの弊害もあります. 場所は半永久性を担保できたらどこでもよいので,研究室のサーバやクラウドにおき,shellスクリプトなどを使ってダウンロードできるようにしてはどうでしょうか.

shuntaroy commented 4 years ago

今あるファイルの中では,具体的には .pkl, .txt, .npz です.

shuntaroy commented 4 years ago

ちなみに,一度でも重たいデータを git にコミットしてしまうと履歴として残るので,完全に消すには工夫が必要です. Git リポジトリに上がっているファイルを履歴ごと消すには? - Qiita

バイナリを含まないリポジトリとしてinitしてから再アップする方が簡単なことが多いですね…

ujiuji1259 commented 4 years ago

ありがとうございます.少し土日でそこら辺を整備してみます. ちなみに,githubで共同開発したことないのですが,基本issuesでやりとりするものでしょうか?

shuntaroy commented 4 years ago

issuesの方がおすすめです. というのは,issueにしておくと,TODOリスト的に,何をどこまで解決したかが記録に残せるからです. 私が直接コードを直せることは,プルリクを送ります.同じ理由で記録に残って,進捗管理しやすいです.

shuntaroy commented 4 years ago

c59d518fe4e008d0037b6696f55588d2948dc54e で完了できましたね.おつかれさまです