Wachstum ungebrochen

Nur mal so am Rande: innerhalb des letzten Monats hat sich unser Netzwerk ungefähr verdoppelt. Wir sind nun bei 808 Knoten (online) und 1525 Clients.

Das ist erfreulich, bringt uns aber auch wieder an die Skalierungsgrenze, so dass ein Domain-Split erforderlich wird.

Wie verfahren wir? Welche Community können wir als nächstes ausgliedern?

1 „Gefällt mir“

Ich würde vorschlagen, Düsseldorf/Neuss in „Rheinturm“ auszugliedern.

1 „Gefällt mir“

Keine so schlechte Idee. Die Frage ist nur, wie da Personal zu stande kommt. @cyrusfox und ich sind noch immer zu zweit.

Von daher wäre es mir lieber, fähige Menschen von außerhalb Düsseldorf/Neuss zu aktiveren und ihnen im die Autonomie zu helfen.

Ich wäre immernoch dafür, die Domains in einem Admin-pool zu betreiben.
Das vermeidet auch, Räder ständig doppelt zu erfinden, weil jeder seine einigenen Monitoring-Scripts baut.

5 „Gefällt mir“

Also die CPU-Auslastung auf den Supernodes ist ja jetzt quasi halbiert. Daher würde ich vorschlagen dort einfach eine zweite Instanz zu installieren. Da wir ja Resourcen sparen müssen, sollten wir die vorhandene Hardware nutzen. Quasi wie es momentan in Wuppertal der Fall ist.
So können wir eine Besserung der Situation zeitnah realisieren.

Dafür müssten wir wohl die Ansible Playbooks ein wenig anpassen und modularer machen :smile:

Zum Thema Monitoring: Da setzen wir jetzt auf Zabbix, der Map Server ist da gerade die Testinstanz für die Monitoringscripts (Batman Neighbors, Version usw werden geloggt)

1 „Gefällt mir“

Monitoring wäre wichtig, sich nicht auf die prinzipbedingt unzuverlässigen alfred-Daten zu verlassen, sondern sich selbst durch die Ausgaben der batctl originators zu pflügen.

ich stimme @adorfer da zu … auch wenn ich Ruhrgebiet bin aber es macht sinn Ressourcen so bündeln … !

Ja die Scripts nehmen die Daten direkt aus dem Proc-FS bzw batctl. Einfache Bash-Scripts die vom Zabbix Agent als userparameter Scripts ausgeführt werden.

Sieht dann z.b. so aus:

1 „Gefällt mir“

@Windoof Generell stimme ich da zu. Leider gibt es einen signifikanten Unterschied in der Art wie die Server Administriert werden.
Während im Rheinufer die Server nur via Ansible verwaltet werden, so ist es im Ruhrgebiet manuelle Konfiguration. Wir können problemlos 20-30 Supernodes mit 3 Personen verwalten während im Ruhrgebiet bei einem großen Ausfall wohl mehr Leute mit antreten müssen um auch alle Server möglichst zeitgleich zu reparieren.

Da muss einfach generell ein Konsens her, Configuration Management muss Vorgabe werden bei so einem Unterfangen, sonst hat man schnell inkonsistente Systeme und Configänderungen brauchen viel zu lange um ausgerollt zu werden.

5 „Gefällt mir“

Dann lass uns das so machen und ein gutes Vorbild abgeben. :blush:

So gesehen bleibt es also bei der Meta-Community Rheinufer, gesplittet in zwei oder mehr Domänen.

1 „Gefällt mir“

Wir sollten nur evtl überlegen ob wir direkt auch zu Bat15 wechseln :wink:

2 „Gefällt mir“

Also zwei neue Domänen mit Batman v15 aufmachen und alle Nodes zu der einen oder anderen migrieren. Das klingt nach einem Plan.

1 „Gefällt mir“

das klingt in der tat sehr gut … und auch einfach machbar!
selbst mit 2 3 domains… sollte es ja kein problem geben … und falsch meshen kann man ja unterbinden …

Und den mit einem Zwischenupdate den Autoupdater auf das „Nordwest-Verfahren“ umstellen:

zweimal pro Stunde nach neuem Update schauen (dabei prüfen, ob der Autoupdater schon läuft, pidfile…)
Mit dem eigentlichen Flashen 12h warten.

2 „Gefällt mir“

Freut mich sehr, dass du zurück bist @CyrusFox! Euer Plan klingt gut. Alles was uns aus diesem Dilemma heraus führt, kann ich nur begrüßen.
Auch wir im Kreis Mettmann können uns keine Admins für eine eigene Domain schnitzen …