MajkiIT / polish-ads-filter

CertyficateIT - Oficjalne polskie filtry do Adblock, uBlock Origin, Adguard
Other
672 stars 93 forks source link

wielkie sprzątanie #3318

Closed MajkiIT closed 4 years ago

MajkiIT commented 7 years ago

@F4z @xxcriticxx @hawkeye116477 @blocker999 @gzenio22

Chłopaki reguł nie ubywa i nie chcę pchać w listę wszystkiego, dlatego pokusiłem się o napisacie czegoś w php aby wklejać listę a skrypty sparsują i wyciągną z tego domeny, wywalą duplikaty i sprawdzą czy domena istnieje. Jeśli nie to w wynikach napiszę, że nie istnieje. Zrobiłem już coś takiego dla listy KAD ==> https://github.com/azet12/KAD/issues/454 . Jak skończę to zaczniemy to robić z automatu.

xxcriticxx commented 7 years ago

jakie szybko przerabja liste?

F4z commented 7 years ago

Super :)

MajkiIT commented 7 years ago

@xxcriticxx Listę KAD, która ma 1647 linii przetworzyło w ok 50-60s .

xxcriticxx commented 7 years ago

dziala na host?

MajkiIT commented 7 years ago

nie, na https://github.com/azet12/KAD/blob/master/KAD.txt

xxcriticxx commented 7 years ago

rozumiem ale czy mozemy sprawdzic liste host?

MajkiIT commented 7 years ago

tak, zaraz to zrobię.

xxcriticxx commented 7 years ago

@MajkiIT ok czekam

MajkiIT commented 7 years ago

@xxcriticxx https://github.com/azet12/KADhosts/issues/6

xxcriticxx commented 7 years ago

@MajkiIT przetestuj to liste co ma 2 mil hostow zobaczymy jak to dziala

MajkiIT commented 7 years ago

@xxcriticxx Ok, na razie ustawiłem limit 10 zapytań DNS na 1 s.

xxcriticxx commented 7 years ago

@MajkiIT nie zaleje network karty?

MajkiIT commented 7 years ago

Nie, to udp czyli połączenie bez potwierdzeń. Nie widzę znacznego ruchu na karcie, bardziej się martwię czy isp mnie nie wytnie.

xxcriticxx commented 7 years ago

za spamowanie

gzenio22 commented 7 years ago

oki :)

blocker999 commented 7 years ago

@MajkiIT Jak najbardziej jestem za tylko sprzątanie w PL niebędzie takie proste jak wprzypadku KAD bo w przypadku domen z " Przekrętami " są one na chwile by wyłudzić kase i się ulotnić, dlatego było ich sporo do usunięcia. A w PL domeny raczej są na lata ale warto wten sposób coś wyłapać. Jeśli chodzi o wielkie porządki to najlepiej byłoby każdą strone przejżeć z osobna bo szata graficzna i reklamy mogły się tam pozmieniać kilka razy, no ale dotego potrzebny jest sztab ludzi bo sam jeden tego nieogarniesz no chyba że wymyślisz do tej roboty jakiś magiczny skrypt, ja tylko moge podawać kolejne strony. Natomiast warto w ten sposób pousuwać domeny a reszte z czasem powoli się pozmienia.

xxcriticxx commented 7 years ago

Przestane podawać bendzie mniejsza lista :)

MajkiIT commented 7 years ago

@blocker999 No nie mówię, że będzie to dziennie 10 stron, ale może coś się skróci. Zawsze to coś. Jak mi to wyjdzie to wystawię to w świat i niech się ludzie bawią. Docelowo pod blokowanie elementów coś wymyślę, ale muszę się nauczyć rozwiązywania problemów, które stawiam sobie przed tym.

@xxcriticxx O nie, nie, nie dodajesz co znajdziesz. Nie ma tak łatwo.

MajkiIT commented 7 years ago

Nie jest tak źle

Host 24opole.pl.ad not found: 3(NXDOMAIN) UNKNOWN
Host 24tvonline.pl not found: 3(NXDOMAIN) UNKNOWN
Host [AdblockPlus2.0] not found: 3(NXDOMAIN) UNKNOWN
Host buletproofserving.com not found: 3(NXDOMAIN) UNKNOWN
Host bulletproofserving.com not found: 3(NXDOMAIN) UNKNOWN
Host epostuj.pl not found: 3(NXDOMAIN) UNKNOWN
Host free-all.pl not found: 3(NXDOMAIN) UNKNOWN
Host freedisc.pl.footer-ad not found: 3(NXDOMAIN) UNKNOWN
Host jegoego.com not found: 3(NXDOMAIN) UNKNOWN
Host meczhd.biz not found: 3(NXDOMAIN) UNKNOWN
Host mojlink.pl not found: 3(NXDOMAIN) UNKNOWN
Host nadzwyczajne.com.pl not found: 3(NXDOMAIN) UNKNOWN
Host rozaholding.com not found: 3(NXDOMAIN) UNKNOWN
Host seansik.nl not found: 3(NXDOMAIN) UNKNOWN
Host sostart.org not found: 3(NXDOMAIN) UNKNOWN
Host store.office.live.com not found: 3(NXDOMAIN) UNKNOWN
Host strefaanime.pl not found: 3(NXDOMAIN) UNKNOWN
Host www.poloniada.com not found: 3(NXDOMAIN) UNKNOWN
F4z commented 7 years ago

Chyba trzeba lekko skrypt poprawić, bo 24opole.pl.ad i freedisc.pl.footer-ad raczej jest niepoprawne i powinno być bez tej ostatniej kropki i reszty :)

MajkiIT commented 7 years ago

tak, wiem, jutro poprawię :P ale już jest większość poprawne. @F4z dzięki

MajkiIT commented 7 years ago

@F4z już jest lepiej https://github.com/easylist/easylist/issues/509

F4z commented 7 years ago

@MajkiIT zgadza się, ale jeszcze trzeba gwiazdki poprawić accelo.com* 2gb.com* i jakąś kropkę abbp1.website. :)

xxcriticxx commented 7 years ago

@MajkiIT easylisty i tak nikt nie poprawja dlatego jest taka duza

MajkiIT commented 7 years ago

@F4z muszę to ogarnąć jakimś filtrem aby wyłapywało prawidłowo @xxcriticxx dlatego im wrzuciłem i zobaczę czy ich zainteresuje

hawkeye116477 commented 7 years ago

@MajkiIT Może za parę tygodni zerkną :smile:. Z moim zgłoszeniem https://github.com/easylist/easylist/issues/505, już od 3 dni nadal nic nie zareagowali.

xxcriticxx commented 7 years ago

@hawkeye116477 takie zeczy to najlepjej im na forum ale tam tez nie zamoczny ruch

podaj moze to pigwina

hawkeye116477 commented 7 years ago

@xxcriticxx Tyle, że w uBlock Protector to już jest, ale inaczej rozwiązane, bo pingwin nie lubi whitelist. Natomiast w AAK Cont oczywiście tego nie ma. Może kiedyś gdzieś tam dodadzą :smile:. https://gitlab.com/xuhaiyang1234/AAK-Cont/issues/192

BTW, dlaczego u nas nadal od ok.28 dni jest parę issues, a @MajkiIT nie dodaje reguł? @MajkiIT ma jakieś wakacje od blokowania reklam czy coś?

MajkiIT commented 7 years ago

@hawkeye116477 są zgłoszenia które, nie mają do końca pełnego rozwiązania. Np. Na stronie trzeba byłoby dodać 10 reguł itp. Ponadto ciągle myśle nad rozwojem projektu i cześć czasu przeznaczam na kombinowanie co zmienić jak poprawić lub usprawnić. Jeśli cie to boli to przejrzę i pozamykam.

hawkeye116477 commented 7 years ago

@MajkiIT Ok, to kombinuj dalej i nie pośpieszam.

xxcriticxx commented 7 years ago

@hawkeye116477 mozesz podac rozwiazanie do dlugo otwartych spraw i zrobic pull request

MajkiIT commented 7 years ago

@hawkeye116477 luzik, dodałem co wiedziałem.

hawkeye116477 commented 7 years ago

@xxcriticxx Już i tak trochę mniej się zrobiło, głównie zostało coś tam dla Adguarda i https://github.com/MajkiIT/polish-ads-filter/issues/3173 oraz twoje zgłoszenie https://github.com/MajkiIT/polish-ads-filter/issues/3059.

xxcriticxx commented 7 years ago

@hawkeye116477 moja juz zamknieta

MajkiIT commented 7 years ago

@F4z https://github.com/AdguardTeam/AdguardFilters/issues/6331

xxcriticxx commented 7 years ago

@MajkiIT bys sprawdzil moja personalna liste host please

MajkiIT commented 7 years ago

Jak możesz podaj link to zaraz sprawdzę

xxcriticxx commented 7 years ago

https://raw.githubusercontent.com/xxcriticxx/.pl-host-file/master/hosts.txt

MajkiIT commented 7 years ago

@xxcriticxx jedynie Host spanel.gem.pl not found: 3(NXDOMAIN) UNKNOWN

F4z commented 7 years ago

@MajkiIT dzięki. Te ukraińskie/rosyjskie strony z końca listy to w większości przypadków działają.

MajkiIT commented 7 years ago

@F4z hmmm masz rację. Przepraszam

F4z commented 7 years ago

@MajkiIT nic nie szkodzi, nie ma problemu :) Ja i tak zanim coś tam dodam lub usunę, to staram się sprawdzać dokładnie kilka razy.

MajkiIT commented 7 years ago

Oni naprawdę mają tam śmietnik https://github.com/easylist/easylist/issues/511

xxcriticxx commented 7 years ago

lista po sprzataniu koniec wielkiego sprzatania!

hawkeye116477 commented 7 years ago

@MajkiIT A skoro mowa o sprzątaniu, to co się stało z @blocker999? Kto teraz będzie zajmował się blokowaniem popupów?

xxcriticxx commented 7 years ago

@hawkeye116477 a co mialo sie znim stac?

hawkeye116477 commented 7 years ago

@xxcriticxx Chyba się coś stało, bo GitHub podaje, że w ogóle nie ma takiego gościa, pewnie sprzątneli go/banana dostał. Podejrzewam, że ten gość z którym się ostatnio sprzeczał ma coś z tym wspólnego. No chyba, że się mylę i sam się usunął, ale tak w sumie to niby po co by miał to robić.

xxcriticxx commented 7 years ago

robota sie jemu nie podobala to zucil

@hawkeye116477 nastepna zecza mozesz sie zopiekowac

hawkeye116477 commented 7 years ago

@xxcriticxx Serio, ja tam jednak myslę, że to miało coś wspólnego z https://github.com/azet12/PopupBlocker/issues/68.

hawkeye116477 commented 7 years ago

@xxcriticxx Rzadko kiedy ktoś tam coś zgłaszał. Chyba bym musiał sam wyguglować coś, by mieć co blokować, ale to raczej odpada. A czemu nie ty, tobie się nudzi często, to teraz będziesz miał robotę?