linkvt / repo-classifier

Automatische Klassifizierung von Github Repositories für den informatiCup2017
8 stars 2 forks source link

Caching von Feature Werten #7

Closed kuznecpl closed 7 years ago

kuznecpl commented 7 years ago

Wir sollten uns überlegen, wie wir die Feature Werte von einzelnen Repos cachen können, damit wir nicht vor jedem Training alle Daten neu laden müssen.

BlackDark commented 7 years ago

Muss man noch testen

kuznecpl commented 7 years ago

Was mir noch aufgefallen ist:

Wir greifen teilweise direkt auf Repository Objekt außerhalb der FeatureExtractor zu: In classifier.py und CachedFeatureExtractor.

Dadurch wird ein Request an die Github API gesendet und das ganze Repo-Objekt geholt. Auch diese Werte sollten wir cachen.