freifunk-ffm / ToDo-Liste

Hier werde Punkte gesammelt, welche umgesetzt bzw. abgearbeitet werden sollten. Siehe https://github.com/freifunk-ffm/ToDo-Liste/issues
0 stars 0 forks source link

Umzug des fffffmmapserver von netcup auf eulenfunk-Proxmox #20

Closed Adorfer closed 7 years ago

Adorfer commented 7 years ago

ich habe mich gestern (als die Kiste nicht lief und auch auf der VNC-Konsole nicht ansprechbar war) nach dem Reset das erste mal "im Produktivbetrieb" dort eingelogt: Die Load ist nicht tragbar, das System ist schlicht völlig überlastet.

Vorschlag:

1) Umzug des Systems auf "dags3" (Eulenfunk). DD-job? Oder neu aufsetzen? 2) Freigabe der Mini-VM für Babel-Map-Versuche. (Alternativ zu 2: Einstampen der netcup-vm komplett)

christf commented 7 years ago

@skorpy2009 und ich hatten noch eine weitere Alternative entwickelt, ich fänd es gut, wenn wir die mal alle hier reinpacken und dann gemeinsam entscheiden.

Die Idee war, den prometheus auszulagern auf eine andere VM (die wir im Moment nicht für trafficlastige Dinge nutzen können, die aber genügend CPU und RAM-Kapazitäten hat) und den Rest auf der Map laufen zu lassen.

Insgesamt spielt dann noch eine Rolle wie man mit der Map für das babel-Testnetz umgehen möchte. Nachdem ich @Adorfer um Hilfe gebeten hatte kam noch die Idee auf, sowohl das Frankfurter FF-Netz als auch das Testnetz auf der gleichen Map zu betreiben, damit man nach außen hin nicht wieder das Chaos herstellt, dass wir beim Meshviewer-Umzug hatten. Das macht dann folgende Entscheidungen erforderlich:

  1. Betreibt man für das Testnetz eine separate Map? <= Hier ist meine Meinung mittlerweile, dass wir versuchensollten das zu vermeiden
  2. Auf welcher Infrastruktur läuft die Map? Hier gibt es 2 Ansätze: a) Der gesamte Map-Stack läuft in der selben VM b) einzelne Komponenten werden ausgelagert.

Zu (2) hab ich noch keine Meinung gebildet. Was sind Vor- und Nachteile von 2a/2b)?

Und dann ist da noch die Frage von Oliver, welche Hardware eigentlich nötig wäre. Wie sind denn die Karten beim Eulenfunk ausgestattet?

Adorfer commented 7 years ago

Die EulenfunkMap-Instanz ist schlecht vergleichbar, da dort mehrere Domains gerechent werden

siehe https://github.com/eulenfunk/mapconfig/blob/master/sites

Was die frisst: Nicht wenig, es sind aber eben auch >1500 Knoten grafik

grafik

grafik

Adorfer commented 7 years ago

VM ist aufgesetzt auf dags1, vorerst mit 2 Kernen, 20GB Platte und 4GB RAM. Falls das nicht reicht, dann müssen wir die IP nochmal ändern, da wir die nicht "mitnehmen" können. Falls also mehrere dns-Namen auf das Ding zeigen, bitte ein A-Record machen und da dann die anderen als C-Name hinzeigen lassen.

Adorfer commented 7 years ago

P.S. IPv4: 5.196.175.55 DE
hostroute(!) 51.254.47.239 reverse (können wir ändern) ns3016549.ip-51-254-47.eu ipv6: 2001:41d0:1008:7ef::c3ba mac: 02:00:00:d7:c3:ba

skorpy2009 commented 7 years ago

netmask IPv6: 56

skorpy2009 commented 7 years ago

Prometheus und Alertmanager sind installiert und die ersten Configs sind erstellt

Adorfer commented 7 years ago

ipv6: eisen 2001:41d0:1008:7ef::/64 localmac 02:00:00:d7:c3:ba localipv6 2001:41d0:1008:7ef::d7:ceba/128 defaultroute via 2001:41d0:1008:07ff:ff:ff:ff:ff

P.S: für IPv4 muss auch Nacharbeit gemacht werden: post-up ip r add 51.254.47.1 dev ens18 post-up ip r add default via 51.254.47.1

d.h. ipv4 default nicht via 5.196.175.1!

Adorfer commented 7 years ago

Wenn der "alte" (Netcup VM) frei ist/wird, bitte Bescheid geben. Danke.

skorpy2009 commented 7 years ago

Prometheus & Grafana ist auf dem neuen System installiert, läuft akzeptabel solange man nicht alle Grafen der Knoten zeichnet

Adorfer commented 7 years ago

Damit mache ich den Netcup dann platt, OK?

skorpy2009 commented 7 years ago

Nein, nur Prometheus ist dort! Hopglass Stack sollte da aus Performance Gründen nicht drauf.

Adorfer commented 7 years ago

Bis zum 25.04.2017 (deadline) muss der alte Server (46.38.238.147) geräumt sein, da läuft der Vertrag aus. Ich hätte aber diverse andere Maschinen anzubieten, die auchmehr Wumms haben. Alterantiv, prüft bitte mal ob das Prometheus auch auf den neuen Server passt. Da müsste Luft sein.

christf commented 7 years ago

Wer kann zusammenfassen was jetzt wo läuft? @skorpy2009 soweit ich weiß hast Du den Kram dankenswerterweise zuletzt mit @t-8ch repariert.

Was läuft wo und welcher Dienst fällt am 25.4. weg? Welche Voraussetzungen braucht der auf einer neuen Maschine?

Adorfer commented 7 years ago

grafik

Was auf der Maschine 46.38.238.147 läuft: Keine Ahnung. Bitte prüft es bitte selbst, ich habe da den Überblick verloren. Faktisch fällt diese Kiste am 25.04.2017 weg.

skorpy2009 commented 7 years ago

Wahram wollte das alles aufschreiben, ich habe ihm das grob aufgeschrieben + erklärt

Wir brauchen $Debians:

christf commented 7 years ago

Nach einem IRC Gespräch beantworte ich meine erste Frage selbst:

christf commented 7 years ago

Jetzt der nächste Schritt: Wir wollen 5 VMs einrichten. Jetzt betrachten wir mal, wie die ausgestattet sein müssen. Jeweils RAM und vCPU. Was wird benötigt?

christf commented 7 years ago

Wieder aus der IRC-Diskussion wird folgende Ausstattung für die Dienste vorgeschlagen:

christf commented 7 years ago

nächster Schritt: Wo wird welcher Dienst gehostet? @Adorfer kannst Du bei dieser Frage helfen?

Adorfer commented 7 years ago

Wo wird welcher Dienst gehostet? @Adorfer kannst Du bei dieser Frage helfen?

Das weiss ich nicht. Ich habe keinen Login auf die Maschinen. (allenfalls könnte ich die Systeme herunterfahren und das FS extern mounten und mir da Logins machen.)

Ich kann Euch nur sagen, welche Maschinen welche IP-Adressen, Resourcen und Mac-Adressen haben. Falls dazu Unklarheiten bestehen sollten:

Wegfall am 25.04.2017:

grafik grafik

Weiterbestehen: grafik Mehr CPU könnte der bekommen, ggf auch etwas mehr HDD, Problem wäre jedoch "Mehr Ram".

christf commented 7 years ago

@Adorfer sorry, die Frage war unklar formuliert. Ich versuchs nochmal: Wo können zukünftig die Dienste mit dem Ressourcenbedarf gehostet werden? Das sollten wir jetzt zusammentragen.

christf commented 7 years ago

Die Dienste:

MyIgel commented 7 years ago

Webserver -> parallel zu f1 / dl

Webfrontend / Ausgabe der Daten / Caching

Yanic -> Uber? hat kaputtes v6

Daten von den Nodes holen

InfluxDB -> Uvensis

Nodedaten speichern

Prometheus -> Eulenfunk ?

Monitoring

Adorfer commented 7 years ago

@christf Du hattest mir im IRC einige Fragen gestellt gestern. Ehrlich gesagt vermag ich keine zu beantworten, da ich die das derzeitige Setup nicht kenne. Da ich nicht weiss, auf welchem Host derzeit was gemacht wird. Geschweige denn, dass ich weiss, wo es welche Probleme gibt: Ich kann nichts sinnvoll vorschlagen. Ich bin wirklich an der Stelle eines Hosters, Ich kann der/den VMs Resourcen einstellen und Logins machen, ggf. Rettungsmedien einlegen und Sachen dumpen. That's it.

Was die Resourcen anbelangt: 50-100GB HDD ist der Knackpunkt. Denn jede HDD muss auch in den Backup-Plan. Und Backup ist IO-Load. Das kann man ionicen, nur dann muss man schauen, dass das Backup in einer Woche für alle VMs fertig wird... Will sagen: 50GB wären so mein gefühltes Limit.

christf commented 7 years ago

hm. inwiefern man ein tägliches/wöchentliches oder monatliches backup braucht, kann man an der stelle glaub ich philosophisch diskutieren. aber die größenordnung passt ja schonmal. :) Wer hat denn schon logins?

Adorfer commented 7 years ago

Der Host in der Eulenfunk-Domain (IPv4 5.196.175.55) heisst derzeit "monitoring.ffm.freifunk.net" Ich habe dort heute Früh auf Geheiß ein Backup vom 10.04.2017 eingespielt. Was ihr mit dem System macht: Bitte formalisiert/dokumentiert es hier irgendwo. Damit ich die Chance habe, "merkwürdige Betriebszustände" zu erkennen. (Sofern das gewünscht ist.)

wir könnnen aber gern auch ein neues Issue draus machen.