Open Ztrk opened 4 years ago
Będzie miał 90%, jak zamienisz 170 na 175. Twój kod zdaje się być bardziej odporny na dane z zewnątrz, przetestuję go dzisiaj na nich. Nie będę działał na twoim hsp, co najwyżej zrobię ensemble swojego i twojego - mój algo w dramatycznie inny sposób podchodzi do sprawy, na samym początku filtruje wszystkie częstotliwości spoza przedziału [60;290] (tam się powinien znajdować ludzki głos). Rozumiem, że 29.12 oznacza, że jeszcze jutro mogę to wysłać? Jeśli tak, to wyślę to Tomczykowi jutro do 12:00. Swoją drogą, sam kod, żadnych sprawek itp.?
Sent with ProtonMail Secure Email.
‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐ On Friday, December 27, 2019 5:17 PM, Marcin Zatorski notifications@github.com wrote:
Wrzuciłem zaimplementowany harmonic product spectrum w notebooku i skrypt w pythonie. Ma jakieś 87% skuteczności na zbiorze treningowym. Jeśli chcesz użyć to algo w drzewie decyzyjnym to masz funkcję hps() zwracającą częstotliwość głosu. Trzeba by to wysłać do 29 grudnia.
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe.
Wrzuciłem jeszcze metodę opartą o autokorelację - ma 88 % skuteczności. Jutro jeszcze możemy to wysłać, wystarczy sam kod. Wrzuciłem ensemble wszystkich trzech metod - ma 99 % skuteczności.
Sent with ProtonMail Secure Email.
‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐ On Saturday, December 28, 2019 2:57 PM, Marcin Zatorski notifications@github.com wrote:
Wrzuciłem jeszcze metodę opartą o autokorelację - ma 88 % skuteczności. Jutro jeszcze możemy to wysłać, wystarczy sam kod.
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
Wydaje mi się, że na hps-ie nawet nie ma sensu dodawać czegokolwiek: po dodaniu 3 kwartyla odtworzyłem prawie to samo, co u siebie (4 mismatche na głównym trainie - 95%, 6 na filmowym: dominanta<130 to M, dominanta>180 to K, jeśli nadal niezdefiniowany, to 3 kwartyl>178 to K
Sent with ProtonMail Secure Email.
‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐ On Sunday, December 29, 2019 12:37 PM, sebastian.michon10 sebastian.michon10@protonmail.com wrote:
- Twój kod wydaje się bardziej uniwersalizowalny - na dodatkowych testach z filmów mój kod wyłożył się na 9 z 16, twój pierwszy na trzech, ensemble na 5. Inna sprawa, że moja metodologia działania była kontrowersyjna (konwersja z mp3 do wava). Który chcesz wysłać? Próbuję jeszcze pobawić się z IQR i medianą w hps, ale z 90% skuteczności bez nich i prawie maksem na ensemblu nie wiem czy to ma sens.
Sent with ProtonMail Secure Email.
‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐ On Saturday, December 28, 2019 2:57 PM, Marcin Zatorski notifications@github.com wrote:
Wrzuciłem jeszcze metodę opartą o autokorelację - ma 88 % skuteczności. Jutro jeszcze możemy to wysłać, wystarczy sam kod.
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
Chyba wysłałbym ensemble - zbiór testowy będzie pewnie będzie bardziej podobny do zbioru treningowego niż tego dodatkowego.
Wysłałem ensemble, bez praktycznie żadnych zmian. Moja przerobiona wersja hps-a była najlepszym kodem bez ensembla, ale po dodaniu jej do ensembla zamiast mojego kodu wychodziły 3 błędy na trainie - co oznacza, że decimate(...) miało spory wpływ na rozwiązanie, bo to w praktyce jedyna poważna różnica między hps a moim pierwotnym kodem. Żeby było śmieszniej, profilowanie (Tomczyk wymaga, żeby kod działał poniżej 1s na plik, nasz ma 24-26s na całość) nie miałoby żadnego sensu, bo ponad połowa czasu wykonania to import, a czas importu jest w praktyce stały niezależnie od liczby bibliotek - wykonanie kodu samych importów trwa 0.15s z jednym from ... import ..., 0.168s na cały blok importów.
Sent with ProtonMail Secure Email.
‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐ On Sunday, December 29, 2019 3:07 PM, Marcin Zatorski notifications@github.com wrote:
Chyba wysłałbym ensemble - zbiór testowy będzie pewnie bardziej podobny do zbioru treningowego niż tego dodatkowego.
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
Wrzuciłem zaimplementowany harmonic product spectrum w notebooku i skrypt w pythonie. Ma jakieś 87% skuteczności na zbiorze treningowym. Jeśli chcesz użyć to algo w drzewie decyzyjnym to masz funkcję hps() zwracającą częstotliwość głosu. Trzeba by to wysłać do 29 grudnia.
Poprawiłem wczytywanie plików. Teraz wczytuje wszystkie i nie wypluwa warningów.