Closed qaziok closed 1 year ago
Ja na przykład w moim folderze zbiorczym z 50-tkami nie zachowałem podziału na zbiory uczący, testowy i walidacyjny. Z tego co zrozumiałem to tak miało być. Jednak w treści tej issue jest odniesienie do tego podziału. Jak mam to rozumieć? Mam policzyć wszystkie (około 6000) zdjęcia, wydzielić samemu zbiór testowy, wydzielić zbiór testowy na podstawie tego z zeszłych lat, czy może jest jakieś inne rozwiązanie?
Tak od siebie chciałbym zasugerować nie używanie podziału z zeszłych lat. accuracy na "valset" z 2020 idzie mi zawsze w parze z accuracy "datasetu" w związku z czym nie daje żadnej informacji na temat tego czy model jest przetrenowany i napawa fałszywy optymizmem. "testset" z moich obserwacji nie cierpi na ten problem.
Mamy teraz dane stworzone przez więcej osób z przestrzeni kilku lat więc łatwiej będzie podzielić to tak żeby model nie zaczynał sugerować się np. czyimiś dłońmi.
@mikolajwirkijowski97 Dobrze zauważone! Faktycznie, podział na "valset" i "dataset" może prowadzić do fałszywego optymizmu i nie dostarczyć wiarygodnych informacji na temat modelu. Lepiej jest używać "testset" do oceny modelu i sprawdzenia jego skuteczności. Co więcej, warto pamiętać o tym, że dane stworzone przez różne osoby mogą być różne, dlatego ważne jest, aby dobrze je przygotować i podzielić, aby uniknąć problemów związanych z przetrenowaniem modelu.
Banknot 10 zł:
Banknot 20 zł:
Banknot 200 zł:
Podsumowanie (wstępne):
Na przyszłość do treningów:
--->>>>> do rozwinięcia powyższe
Potrzebujemy podczas przeglądania danych zebrać informację na temat ( przynajmniej części testowej )