MajkiIT / polish-ads-filter

CertyficateIT - Oficjalne polskie filtry do Adblock, uBlock Origin, Adguard
Other
671 stars 93 forks source link

find useless filters #9030

Closed xxcriticxx closed 5 years ago

xxcriticxx commented 6 years ago

its time again to check your list

https://adblockplus.org/en/redundancy_check

kulfoon commented 6 years ago

Ten jest lepszy i bardziej zaawansowany: https://arestwo.org/famlam/redundantRuleChecker.html

xxcriticxx commented 6 years ago

@kulfoon zapraszamy do wspolnej zabawy

kulfoon commented 6 years ago

Kulfon się bawić !

krystian3w commented 6 years ago

On jest zamykany i w filtrach jest adres do nowego, który ma na jego kodzie rozwijać MajkiIT.

kulfoon commented 6 years ago

On jest zamykany i w filtrach jest adres do nowego,

O tym wiedziałem.

który ma na jego kodzie rozwijać MajkiIT.

O tym nie.

krystian3w commented 6 years ago

its time again to check your list

https://adblockplus.org/en/redundancy_check

W sumie wywaliło tylko wyjątki pod anty-adblock. Więc do przejrzenia na spokojnie czy jest tam coś sensownego podanego. Automatyczna automatyzacja ich może je przywrócić.

A dodatkowo w optymalizatorze @falama już widzę, że są znowu jakieś reguły pod uBlock Origin, na głównej liście.

jak już to powinno to być np. :-abp-has(...) (nie wydaje mi się, by aż uprościli składnię do if) i xpath chyba dalej niezaimplementowany w Adblock Plus / Adblock.


to też by można rozdzielić by na głównej było tylko dopuszczenie wyjątków EasyPrivacy / EasyList a negacja uBO Privacy w pliku dla uBlock Origin.

kulfoon commented 6 years ago

Zastanawiałem się dlaczego nagle ubyło ponad 120 filtrów z listy, było jakieś 6005 a teraz jakieś 5885​, myślałem, że to porządki związane z tym wątkiem, ale prawda jest bardziej bolesna, te filtry tam są, ale zostały zepsute, cały blok został zepsuty: https://github.com/MajkiIT/polish-ads-filter/commit/f7eb2fab0d3db0fa97e21f8a87e942c84c8dced3

Cosmetic filtering – invalid filters:

jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.pub_300x250
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl#,fm.tuba.pl#@#.pub_300x250m
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.pub_728x90
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.text_ad
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.text-ad
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.textAd
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.text-ad-links
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.text_ads
jbzdy.pl,kwejk.pl,piwniczkamemow.pl,eszkola.pl,dobreprogramy.pl,interia.pl,kwantowo.pl,katowickisport.pl,imeds.pl,pl.aleteia.org,overwatch.pl,jackcaleib.com,waw4free.pl,dziwneobrazki.pl,fm.tuba.pl##@#.text-ads 

Omyłkowo dodano zbędne hasze do filtrów #@# robiąc niepoprawne ##@# A tutaj nawet jeden hasz zabawnie się zaplątał: dziwneobrazki.pl#,fm.tuba.pl#@#.pub_300x250m Ale ten blok to już wiele razy w historii miał awarie.

Tu się zaplątał na końcu zbędny przecinek (pchła): Cosmetic filtering – invalid filter: #adv_on_post, #small,

A tu zdublowane dolary i jakieś zbędne spacje i chyba wmieszany jakiś filtr kosmetyczny:

Network filtering – invalid filter: hdtvpolska.com$$script[tag-content="#sdWelcomeScreen"]
Network filtering – invalid filter: czasdzieci.pl$$html body.cdb div#allPage script
krystian3w commented 6 years ago

Ostatnie to magia html filteringu w wykonaniu AdGuarda, widać im nie odpowiadał daszek.

kulfoon commented 6 years ago

https://github.com/MajkiIT/polish-ads-filter/commit/a0b0edc659b65871609ccdb1781d9ce987bbf9a8

The following error, warning or optimalization was encountered while checking the rules:

The following domain of

tubagliwic.pl,tubawyszkowa.pl##.active.aligned.center.segment.basic.stackable.ui > small, .aligned.center.column.one.grid.stackable.ui > p > small, .active.aligned.center.segment.basic.stackable.ui > p > small

can be removed: tubawyszkowa.pl because it has has been made (partially?) redundant by tubawyszkowa.pl##p > small

Hmm ale np. .active.aligned.center.segment.basic.stackable.ui > small nie wygląda na zbędny przez ##p > small nie wiem coś krzyczy w każdym bądź razie, może to fałszywy alarm albo mi się już oczy zmęczyły, a może mam fatamorganę, w każdym bądź razie: .aligned.center.column.one.grid.stackable.ui > p > small, .active.aligned.center.segment.basic.stackable.ui > p > small jest zbędne przez ##p > small. Czy to jakoś rozbić czy o co tu chodzi, w każdym bądź razie reklamy blokowane bezproblemowo.

krystian3w commented 6 years ago

Dopatruje się podobieństwa dziecka i wnuka ale wcale nie analizuje rodzica (dziadka).

Niby można uprościć do samego p > small, raczej rzadko w artykule prasowym piszą coś małym druczkiem (do sprawdzenia, by się nie ugryźć potem w język) lub ktoś na kolanie robił cały szablon.

Opcjonalnie głupieje po przez zbicie 3 reguł w jedną, widać tego w przeszłości nie ogarniał silnik.

xxcriticxx commented 6 years ago

bo silnik z malucha :+1:

kulfoon commented 6 years ago

Dopatruje się podobieństwa dziecka i wnuka ale wcale nie analizuje rodzica (dziadka).

buahahaha

bo silnik z malucha

buahahaha

Najlepiej całą rodzinkę do malucha i na przejażdżkę do lasu na grzyby

Tutaj jak w cyrku normalnie

Kulfon Czerwonouchy

krystian3w commented 6 years ago

W sumie tak...

Wiersz 2 397: ':xpath(//*[@align="center"]/*[@id][contains(text(),"REKLAMA")])' nie jest poprawnym selektorem CSS
Wiersz 2 797: '.bbbb:-abp-has([data-original*="/pictures/informacje/"])' nie jest poprawnym selektorem CSS
Wiersz 2 798: '.bbbb > div > div > div:-abp-contains(reklama)' nie jest poprawnym selektorem CSS
Wiersz 2 801: '.bottom:nth-of-type(n+5):nth-of-type(-n+6) > .bbbb:-abp-contains(reklama)' nie jest poprawnym selektorem CSS
Wiersz 2 802: '.bottom:nth-of-type(20) > .bbbb:-abp-contains(reklama)' nie jest poprawnym selektorem CSS
Wiersz 4 042: Nieznana opcja filtra
Wiersz 4 043: Nieznana opcja filtra
Wiersz 4 181: 'div[class*=" "]:-abp-has(> img[src$="/i.wp.pl/a/i/stg/pkf/bg.png"])' nie jest poprawnym selektorem CSS
Wiersz 4 205: 'div[class]:if(>div[class]:first-child:has-text(REKLAMA):if-not(>*))' nie jest poprawnym selektorem CSS
Wiersz 4 226: Nieznana opcja filtra
Wiersz 4 227: Nieznana opcja filtra
Wiersz 4 240: Nieznana opcja filtra
Wiersz 4 246: Nieznana opcja filtra
Wiersz 4 247: Nieznana opcja filtra
Wiersz 4 248: Nieznana opcja filtra
Wiersz 4 249: Nieznana opcja filtra
Wiersz 4 426: Nieznana opcja filtra

https://github.com/MajkiIT/polish-ads-filter/blob/a4103f650f013ed7d78828a1d10355c3f9c00a8f/polish-adblock-filters/adblock.txt - linie filtrów i można porównać.

krystian3w commented 6 years ago

Aż sam się dziwię, że twoje reguły z .bbbb nie są poprawne dla AdBlock Plus 3.3.1.

krystian3w commented 5 years ago

Ładniej wyglądają rozbite na 4 linie, od biedy można skleić w jedną.

MajkiIT commented 5 years ago

@gargaamel dzięki

krystian3w commented 5 years ago

Z racji, że został usunięty post o duplikatach na EasyPrivacy i nie było podanej propozycji redundancji to też usuwam posty.

Z komunikatów jakie mamy jest jeden:

Finished (after 4 seconds)!  1 redundant rule found!

istotne.pl##.advert has been made redundant by ~allegro.pl##.advert

Ale go nie można zoptymalizować przez generichide i zasięg jak ma mieć filtr ##.advert (globalny z wykluczeniem Allegro).


Warmingi co do filtrów uBlockowych na liście pod wszystkie blokery reklam wynikają z testów nieszkodliwości.


Co do redundancji z https://adblockplus.org/redundancy_check to ta jest trudna do przetworzenia, wymagała by chyba doklejenia EasyList by połowa komunikatów straciła uzasadnienie.

MajkiIT commented 5 years ago

@krystian3w Co przez to rozumiesz? Z racji, że został usunięty post o duplikatach na EasyPrivacy i nie było podanej propozycji redundancji to też usuwam posty.

krystian3w commented 5 years ago

https://github.com/MajkiIT/polish-ads-filter/issues/9621#issuecomment-439287529 ale to już jest poprawione, wpis z linii 4XXX wykasowany.

MajkiIT commented 5 years ago

@krystian3w Ok, dziękuję

krystian3w commented 5 years ago

Albo anti-adblock - tyle że nie mogę teraz powiedzieć ile już naprawiliśmy takich wywołanych przez EasyPrivacy (raczej to jakieś efekty uboczne webmasterów / nieoczekiwane działanie).

github-actions[bot] commented 6 months ago

Ten wątek został automatycznie zablokowany, ponieważ 60 dni po jego zamknięciu nie było żadnej aktywności. Proszę otworzyć nowe zgłoszenie dla powiązanych problemów.