dipnl / wappalyzer

Identify technology on websites.
https://www.wappalyzer.com
2 stars 1 forks source link

allow fetch as request #16

Closed simonbesters closed 6 months ago

simonbesters commented 7 months ago

Vermoedelijk is wappa om performance-redenen beperkt in requests types. React websites van SIM gebruiken fetch om vanuit main.js (geladen vanaf 3rd party / cdn) om alle resources te laden, zie:

https://www.ameland.nl / https://www.achtkarspelen.nl

Door in driver.js naast 'document' en 'script' ook 'fetch' toe te staan zorg je dat de requests niet geblokkeerd worden en zo de verschillende Analytics-tools geladen worden.

driver.js regel 658:

if (
          (responseReceived && request.isNavigationRequest()) ||
          request.frame() !== page.mainFrame() ||
          !['document', ...(this.options.noScripts ? [] : ['script']), 'fetch'].includes(
            request.resourceType()
          )
        )

Op deze manier lukt het wel. Is een tijdelijke oplossing, want misschien moeten we de wappa efficiëntie een stukje terugschroeven om betere resultaten te realiseren.

rudiedirkx commented 7 months ago

Dat is niet echt leesbaar, hoe je het hebt aangepast :D Het was al totaal niet leesbaar in Wappa, maar je hebt het NOG onleesbaarder gemaakt 😆

simonbesters commented 7 months ago

Dat is niet echt leesbaar, hoe je het hebt aangepast :D Het was al totaal niet leesbaar in Wappa, maar je hebt het NOG onleesbaarder gemaakt 😆

Haha. Ja, had hem beter vooraan erbij kunnen zetten en niet achter de optie. Maar dat is voor de grote opruiming als we echt niks meer te doen hebben...

rudiedirkx commented 7 months ago

Op https://www.ameland.nl/ vindt ie nog steeds geen Siteimprove. En volgens mij klopt dat.

rudiedirkx commented 7 months ago

Maar we moeten dit wel veel beter testen, want het zou hierdoor ook kunnen dat de pagina heel vaak blijft hangen omdat ie niet in idle0 of idle2 komt omdat er XHR requests blijven gebeuren. Dus gooi er een hoop rare en normale sites doorheen met fetch toegestaan, en kijk wat eruitkomt.

simonbesters commented 7 months ago

Maar we moeten dit wel veel beter testen, want het zou hierdoor ook kunnen dat de pagina heel vaak blijft hangen omdat ie niet in idle0 of idle2 komt omdat er XHR requests blijven gebeuren. Dus gooi er een hoop rare en normale sites doorheen met fetch toegestaan, en kijk wat eruitkomt.

Ik zal morgen een bulk test doen met random en rare sites.

simonbesters commented 7 months ago

Ik heb alle 342 gemeentelijke hoofdwebsites mét en zonder 'fetch' in dip lokaal wappa laten uitvoeren:

Ik denk dat we dit prima kunnen doen en wel de timeouts blijven monitoren in dip.

tabel Type | URL | fetch | No_fetch -- | -- | -- | -- Website | https://www.aalten.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.achtkarspelen.nl/ | Google Analytics, Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.ameland.nl/ | Matomo Analytics | Niets gevonden Website | https://www.baarn.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.gemeentebeek.nl/ | Matomo Analytics | Niets gevonden Website | https://www.beekdaelen.nl/ | Matomo Analytics | Niets gevonden Website | https://www.bergendal.nl/ | Matomo Analytics | Niets gevonden Website | https://www.bergeijk.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.bergen.nl/ | Google Analytics, Matomo Analytics | Niets gevonden Website | https://www.bergenopzoom.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.beverwijk.nl/ | Google Analytics, Matomo Analytics | Niets gevonden Website | https://www.bladel.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.bronckhorst.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.bunschoten.nl/ | Matomo Analytics | Niets gevonden Website | https://www.capelleaandenijssel.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.cranendonck.nl/ | Matomo Analytics | Niets gevonden Website | https://www.dalfsen.nl/ | Matomo Analytics | Niets gevonden Website | https://www.deurne.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.doesburg.nl/ | Linkedin Insight Tag, Matomo Analytics | Niets gevonden Website | https://www.doetinchem.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.eersel.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.geldrop-mierlo.nl/ | Google Analytics, Matomo Analytics | Niets gevonden Website | https://www.goeree-overflakkee.nl/ | Google Analytics, Matomo Analytics, Monsido | Niets gevonden Website | https://www.harlingen.nl/ | Matomo Analytics | Niets gevonden Website | https://www.heeze-leende.nl/ | Matomo Analytics | Niets gevonden Website | https://www.heumen.nl/ | Matomo Analytics | Niets gevonden Website | https://www.huizen.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.kerkrade.nl/ | Matomo Analytics | Niets gevonden Website | https://www.koggenland.nl/ | Google Analytics, Matomo Analytics | Niets gevonden Website | https://www.krimpenerwaard.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.landgraaf.nl/home?origin=/dienstverlening | Matomo Analytics | Niets gevonden Website | https://www.leudal.nl/ | Matomo Analytics | Niets gevonden Website | https://www.lingewaard.nl/ | Matomo Analytics | Niets gevonden Website | https://www.lopik.nl/ | Matomo Analytics | Niets gevonden Website | https://www.gemeentemaasgouw.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.maassluis.nl/ | Matomo Analytics | Niets gevonden Website | https://www.middelburg.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.middendelfland.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.mookenmiddelaar.nl/ | Matomo Analytics | Niets gevonden Website | https://www.nederweert.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.nieuwkoop.nl/ | Matomo Analytics | Niets gevonden Website | https://www.nijkerk.eu/ | Matomo Analytics | Niets gevonden Website | https://www.nuenen.nl/ | Matomo Analytics | Niets gevonden Website | https://www.oirschot.nl/ | Matomo Analytics | Niets gevonden Website | https://www.ooststellingwerf.nl/ | Google Analytics, Hotjar, Matomo Analytics | Niets gevonden Website | https://www.opmeer.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.opsterland.nl/ | Matomo Analytics | Niets gevonden Website | https://www.overbetuwe.nl/ | Matomo Analytics | Niets gevonden Website | https://www.renswoude.nl/ | Matomo Analytics | Niets gevonden Website | https://www.reuseldemierden.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.roerdalen.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.scherpenzeel.nl/ | Matomo Analytics | Niets gevonden Website | https://www.schiermonnikoog.nl/ | Matomo Analytics | Niets gevonden Website | https://www.simpelveld.nl/ | Matomo Analytics | Niets gevonden Website | https://www.sonenbreugel.nl/ | Google Analytics, Matomo Analytics | Niets gevonden Website | https://www.staphorst.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.terschelling.nl/ | Matomo Analytics | Niets gevonden Website | https://www.twenterand.nl/ | Linkedin Insight Tag, Matomo Analytics | Niets gevonden Website | https://www.t-diel.nl/ | Google Analytics, Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.urk.nl/ | Matomo Analytics | Niets gevonden Website | https://www.heuvelrug.nl/ | Google Analytics, Matomo Analytics | Niets gevonden Website | https://www.valkenswaard.nl/ | Matomo Analytics | Niets gevonden Website | https://www.veere.nl/ | Matomo Analytics, Monsido, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.vlieland.nl/ | Matomo Analytics | Niets gevonden Website | https://www.vlissingen.nl/ | Matomo Analytics | Niets gevonden Website | https://www.voorneaanzee.nl/ | Matomo Analytics | Niets gevonden Website | https://www.voorschoten.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.waalwijk.nl/ | Matomo Analytics | Niets gevonden Website | https://www.wassenaar.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.westmaasenwaal.nl/ | Matomo Analytics | Niets gevonden Website | https://www.westerkwartier.nl/ | Matomo Analytics, Monsido | Niets gevonden Website | https://www.weststellingwerf.nl/ | Matomo Analytics | Niets gevonden Website | https://www.wierden.nl/ | Matomo Analytics | Niets gevonden Website | https://www.winterswijk.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.woensdrecht.nl/ | Matomo Analytics | Niets gevonden Website | https://www.zoetermeer.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.zuidplas.nl/ | Matomo Analytics, Siteimprove, Siteimprove!! | Niets gevonden Website | https://www.zwartewaterland.nl/ | Google Analytics, Matomo Analytics | Niets gevonden
rudiedirkx commented 7 months ago

fetch wordt nog niet gebruikt als xhr pattern bron. Dat voegt in dit geval misschien niks toe, maar wel netjes.

    if (request.resourceType() === 'xhr') {

Die moet ook fetch accepteren en daar de xhr patterns op los laten.

rudiedirkx commented 7 months ago

En dan moeten we xhr ook toelaten waar je nu fetch toevoegt.

rudiedirkx commented 7 months ago

En met testen bedoelde ik vooral de sites die niet geoptimaliseerd en getest en veelgebruikt en wettelijk netjes zijn, dus de intranetten en SSO redirects en youtube kanalen etc.

simonbesters commented 7 months ago

En met testen bedoelde ik vooral de sites die niet geoptimaliseerd en getest en veelgebruikt en wettelijk netjes zijn, dus de intranetten en SSO redirects en youtube kanalen etc.

Ik heb ook random ruk websites gedaan. Alleen geen vergelijk zoals bij alle gemeente hoofdwebsites.

simonbesters commented 7 months ago

Die moet ook fetch accepteren en daar de xhr patterns op los laten.

En dan moeten we xhr ook toelaten waar je nu fetch toevoegt.

Toegevoegd. Ik heb me beperkt tot die twee regels qua leesbaarheid verbeteren. Jij hebt waarschijnlijk daar voor heel wappa al ideeën over.

rudiedirkx commented 7 months ago

Ik heb me beperkt tot die twee regels qua leesbaarheid verbeteren.

Ik zou het juist op 1 regel zetten ipv 5 superkorte:

if (['xhr', 'fetch'].includes(request.resourceType())) {

is leesbaarder dan

if ([
'xhr',
'fetch'
].includes(request.resourceType())
) {

Die komma aan het eind van de diff mag je laten staan. Wellicht is je IDE te enthousiast.

rudiedirkx commented 7 months ago

Er gebeuren nog meer rare dingen. Zie diff. Je moet wel je diff scrutinizen voordat je commit he. Niet alleen handig om debugs eruit te halen 😆

rudiedirkx commented 6 months ago

Ik heb de formatting aangepast. Willen we deze nog beter testen, of vertrouwen we meer meer meer xhr/fetch? Dat ie langzamer wordt is niet erg. Dat ie crasht of dingen mist wel. Had jij jouw lijstje websites getest met alleen die eerste verandering (fetch toelaten) of ook met de tweede (fetch analyseren)? Het lijkt me dat er alleen maar betere resultaten uitkomen, maar misschien winnen daardoor wel ineens andere techs van degene die wij verwachten/willen.

simonbesters commented 6 months ago

Willen we deze nog beter testen, of vertrouwen we meer meer meer xhr/fetch?

Nee, deze kan door. Ik heb getest inclusief analyse fetch. Ook gekke kutwebsites.