SIWECOS / siwecos-crawler

Website crawler written in PHP.
Other
1 stars 0 forks source link

Domain als Domain, nicht als URL zurückliefern #8

Closed Lednerb closed 5 years ago

Lednerb commented 5 years ago

Momentan liefert der Crawler das folgende Ergebnis:

{
    "name": "SIWECOS-CRAWLER",
    "version": "1.2",
    "hasError": false,
    "errorMessage": null,
    "result": {
        "domain": "https://siwecos.de",
        "urls": [
            "https://siwecos.de/cms",
            "https://siwecos.de/app",
            "https://siwecos.de/impressum",
            "https://siwecos.de/news",
            "https://siwecos.de/ueber-das-projekt",
            "https://siwecos.de/support",
            "https://siwecos.de/presse",
            "https://siwecos.de/en/",
            "https://siwecos.de/service-fuer-webhoster",
            "https://siwecos.de/agb"
        ]
    }
}

Als result.domain soll die Domain siwecos.de zurückgeliefert werden, nicht die URL https://siwecos.de

y-ates commented 5 years ago

Hmm, mit dem Eintrag wollte ich eigentlich das zurückgeben was auch gescannt wurde. Wenn nur siwecos.de zurückgegeben wird kann man nicht erkennen, welches Protokoll denn verwendet wurde.

Ist es wirklich sinnvoller siwecos.de zurückzugeben?

Ich meine, ich weiß was du meinst mit Domain != URL, evtl. wäre die Umbenennung von result.domain besser?

Lednerb commented 5 years ago

Dann startUrl anstatt domain verwenden