dipnl / wappalyzer

Identify technology on websites.
https://www.wappalyzer.com
2 stars 0 forks source link

Betere pattern matches debug #9

Closed rudiedirkx closed 4 months ago

rudiedirkx commented 4 months ago
  1. Met flag -e kan je alle matches zien, maar vaak niet het nuttige deel om terug te zoeken. Bijv voor een "type": "cookies" match toont ie wel de cookie value, maar niet de name. Zou wel handig zijn.
  2. Sommige gevonden resultaten komen niet in die patterns lijst, ook al heeft ie ze wel echt gevonden, omdat Wappa vindt dat ze al bestaan, ook al zijn ze echt uniek. Er wordt te hard uitgefilterd (dip#906). Verandert wss niks aan de resultaten, maar wel onhandig debuggen.
rudiedirkx commented 4 months ago

Ik heb m lokaal gemaakt, alleen voor analyzeManyToMany() matchers. Andere (regex) matchers (bijv scripts) bevatten al een regex key, dus dat is al te lezen. Wel nuttig voor cookies, dom, headers etc. Nieuwe key in de -e patterns heet origKey:

    "Siteimprove": [
      {
        "type": "js",
        "regex": "(?:)",
        "value": true,
        "origKey": "_sz.analytics.heatmap",
        "match": "",
        "confidence": 100,
        "version": "",
        "implies": [],
        "excludes": []
      },
      {
        "type": "cookies",
        "regex": "(?:)",
        "value": "f4418f4b-2e31-2e5d-01c3-ebdfaa000a8a",
        "origKey": "nmstat",
        "match": "",
        "confidence": 100,
        "version": "",
        "implies": [],
        "excludes": []
      },
      {
        "type": "cookieNames",
        "regex": "^nmstat$",
        "value": "nmstat",
        "match": "nmstat",
        "confidence": 100,
        "version": "",
        "implies": [],
        "excludes": []
      },
      {
        "type": "scriptSrc",
        "regex": "(?:\\.|\\/\\/)siteimprove(?:analytics)?\\.com\\/js\\/siteanalyze",
        "value": "https://siteimproveanalytics.com/js/siteanalyze_6004851.js",
        "match": "//siteimproveanalytics.com/js/siteanalyze",
        "confidence": 100,
        "version": "",
        "implies": [],
        "excludes": []
      }
    ],

Het zit nu in alle refactorcleanupmagic van dip#906, dus eerst alles goed controleren.