michael-spengler / wwi20sea-web-programmierung

1 stars 0 forks source link

Search Engine für Unternehmenswebsites #10

Open binhdich opened 2 years ago

binhdich commented 2 years ago

Ich hätte Bock eine eigene Search Engine zu bauen. Allerdings soll anders als bei Google beispielsweise nicht das gesamte www durchgecrawled werden sondern ein Pool an Startpunkten (seeds) definiert werden, welcher sich auf Unternehmenswebsites aus dem deutschen Handelsregister beschränkt. Möchte man zb eine Liste an deutschen Unternehmen erhalten, die duale Studiengänge anbieten, könnte man diese Search Engine nach "Duales Studium" durchsuchen und würde als Ergebnis nur Websites von Unternehmen erhalten die auch duale Studiengänge anbieten. Bei Google hingegen würde man zig Websites erhalten wie "https://www.wegweiser-duales-studium.de/", die einem Null bei der Suche weiterhelfen.

Wer auch Lust hat kann gerne mitmachen :)

LeonEngelhardt commented 2 years ago

bin dabei :)

juengeja commented 2 years ago

Moin 👀

michael-spengler commented 2 years ago

https://github.com/michael-spengler/DHBW-Learning-Apps -->

https://github.com/michael-spengler/DHBW-Learning-Apps#scientific-papers

binhdich commented 2 years ago

Ich habe die Search Engine so erweitert, dass man eine eigene Liste an seed URLs angeben kann, um so einen komplett individuellen Index zu erstellen. Sprich, wer möchte, kann diesen Code nutzen um eine eigene Sammlung an Websites, Dokumenten, Online Büchern, Artikeln oder whatever sehr schnell durchsuchen zu können. : https://github.com/binhdich/Custom-Search-Engine

michael-spengler commented 2 years ago

https://github.com/binhdich/Custom-Search-Engine

@binhdich: kannst Du das repo https://github.com/binhdich/Custom-Search-Engine public machen? - sonst kommt kaum einer drauf.