Admin-Tagebuch GL


#21

Jetzt gibts public IPv6 für bgl und lln - danke an @jjx für die Hilfe beim debuggen

Edit:
Ein bisschen vorschnell. Es gibt noch MTU-Probleme und ich habe den radvd erstmal wieder abgeschaltet

Edit2:
Problem gelöst, v6 nun aktiv


#22

??

any news?


#24

Kann der Server die Knoten schon vor der neuen FW übernehmen? Müsste eigentlich gehen.


#25

Nein. 20202020202020


#26

Die folgenden Router sind bei der Trennung in gl.wupper stecken geblieben:

BCD

Autoupdate deaktiviert:
https://map.ffgl.eu/#!v:g;n:60e327ee03fc
https://map.ffgl.eu/#!v:g;n:60e327b80bf8
https://map.ffgl.eu/#!v:g;n:60e327ee05ae

Sonstiges:
https://map.ffgl.eu/#!v:g;n:60e327b80bf8

LLN

Autoupdate deaktiviert:
https://map.ffgl.eu/#!v:g;n:60e327cd5888
https://map.ffgl.eu/#!v:g;n:60e327b80b82
https://map.ffgl.eu/#!v:m;n:60e327b80baa
https://map.ffgl.eu/#!v:g;n:60e327b80a78

ODE

Dieser hier hatte eine schlechte Anbindung, also habe ich seinen Uplink auf eine Blacklist gesetzt, bis der hier das Update zieht:
https://map.ffgl.eu/#!v:g;n:30b5c2879db8

Dieser hier hat die falsche Site. Ich habe nach Absprache den Autoupdater umgebogen, sodass er von BCD zu ODE rübergeschubst wird. Außerdem habe ich den Uplink auf die Blacklist gesetzt.
https://ode.map.ffgl.eu/#!v:g;n:60e327e72b32

BRIDGES

Es existier(t)en mehrere Bridges zwischen den Städten:

  • BBL und Bluetenbad, BBL hat das Update gemacht und mesht somit nicht mehr mit Bluetenbad.
  • Stoff-Zaubermaus speist gl.wupper in ein zentrales BCD-Mesh ein. Sollte sich mit der Zeit fixen, wenn die Nachbarn das Update ziehen
    • Edit: passiert

Update 11:30:
Es hat sich alles wieder stabilisiert. Mal sehen wie so die Windstärken in BCD und ODE aussehen.

TODO:

  • (√) x86-generic images für BGL
  • (√) Karten aufräumen
  • (√) firmware.ffgl.eu updaten
  • ( ) BCD- und ODE-VMs auf Silver aufsetzen.
  • ( ) LLN-VM auf Tungsten aufsetzen (Bitte von Herr Werner)
  • ( ) einheitliche Firmware für GL
    • HT40 wird beim Update beibehalten? @Marssl

#27

aktualisiertes TODO:

  • (√) x86-generic images für BGL
  • (√) Karten aufräumen
  • (√) firmware.ffgl.eu updaten
  • (√) BCD- und ODE-VMs auf Silver aufsetzen.
  • ( ) LLN-VM auf Tungsten aufsetzen (Bitte von Herr Werner)
  • ( ) einheitliche Firmware für GL
  • HT40 wird beim Update beibehalten? @Marssl
    • (√) Grund ist bekannt
  • (√) ffgl.eu nameserver verlegen auf gl2 / neue service vm
  • (√) gl.wupper.ffrl.de nameserver verlegen auf gl2 / neue service vm

Aktuell ist der nameserver auf gl1, einem netcup-server, der irgendwann gekündigt werden soll. gl2 ist die neue service vm (auf silver) und soll firmwares, webseiten, autoupdates und nameserver übernehmen.

Auf Grund der letzten beiden Punkte kann es heute abend zu Ausfällen kommen. Falls ein Router neu gestartet wird, kann dieser möglicherweise die Server nicht mehr auflösen. Da DNS sehr träge ist und die verschiedenen Schritte voneinander abhängen, kann es etwas dauern.
Falls morgen früh noch Probleme auftreten bitte melden!

Update 30.6.: ffgl.eu ist erfolgreich umgelegt…
Update 3.9.: Nameserver ist seit 1 Monat auf GL2


#28

25 Beiträge wurden in ein neues Thema verschoben: Kartenproblem Bergischer Kreis


#29

3.9.:
Updates auf allen Systemen, auf 4.4 aus den Backports umgestellt, auf batman-adv und batctl 2016.3 gepdated. Alle Supernodes, Konzentratoren und Bleche werden neu gestartet.
Es kann heute Nacht von 02:00 Uhr bis 06:00 Uhr zu Ausfällen des Internet-Uplinks kommen.
Ich kann lln0 nicht auf tungsten verlegen, weil ich keinen Zugriff zum SYS-Webinterface von tungsten habe. Das Passwort scheint geändert worden zu sein.

Notizen:

  • apt ist sehr langsam, ich vermisse pacman.
  • nach einem Kernel upgrade ist batman-adv wieder in der “alten” im Kernel enthaltenen Version installiert (ist kein DKMS)
  • " apt -o Acquire::ForceIPv4=true install …"

Admin Support von Blech Tungsten gefährdet
#30

Es kam nur sehr kurz zu Ausfällen des Uplinks, danke!


#31

Das war mal in der Doku drin. War aber wohl nicht “genügend abgesprochen”, wurde daher wieder entfernt.


#32

Ich habe alle Server geupdated und starte später die Bleche neu. Dadurch entsteht eine kurze downtime.

Da ich nach wie vor keinen Zugriff aufs Web-Interface für Tungsten habe, starte ich immer zuerst silver neu und warte bis dort wieder alles reibungslos läuft.


#33

Die folgenden Domains habe ich von gl1 auf gl2 (neue service-vm) umgezogen:

https://ffgl.eu/
https://gl.wupper.ffrl.de/
https://gl.wupper.freifunk-rheinland.net/
https://images.ffgl.eu/
https://images.gl.wupper.ffrl.de/
https://images.gl.wupper.freifunk-rheinland.net/
https://firmware.ffgl.eu/
https://firmware.gl.wupper.ffrl.de/
https://firmware.gl.wupper.freifunk-rheinland.net/

Alle haben Zertifikate erhalten. Ich habe https://firmware.ffgl.eu so angepasst, dass die Links wieder stimmen.
Für images.* ist autoindex aktiviert, d.h. es gibt directory listings.
https://ffgl.eu bzw. die aliases haben momentan keinen Inhalt.

gl1 ist somit nur noch für internes DNS in gl.wupper zuständig. Das kläre ich mit den Wupper-Leuten, dann wird gl1 gekündigt. Außerdem ist die public IPv6-Konfiguration anscheinend broken, was dazu geführt hat, dass alle oben genannten Seiten mit aktiviertem IPv6 nicht erreichbar waren.


#34

Was für eine Sammlung…
Zumindest kann es nicht mehr schlimmer werden, da keine weiteren Kombinationen aus “gl” “firmware” mehr frei sind…


#35

19.10.

Neustart von gl2 (Service-VM) nach Freeze.


#36

26.10.
Alle Server geupdated, batman-adv neu kompiliert und neu gestartet


GL Stand der Dinge 201607
#37

09.11.

Neustart von gl2 (Service-VM) nach Freeze.


#38

11.11.

Blech Tungsten wurde am 10.11.2016 um 10:28 Uhr abgeschaltet ohne vorherige Information.

@PetaByteBoy hat Ersatz-VMs für Odenthal und Burscheid auf Silver in Betrieb genommen:

  • zusätzliche Ersatz-IPs von Silver den Silver-VM’s ODE0 und BCD0 zugewiesen
  • IPs auf Konzentrator gepflegt
  • DNS-Einträge von ODE0 und BCD0 geändert
  • VMs gestartet
  • Traffic und Erreichbarkeitskontrolle durchgeführt

Offen: IPv6 Erreichbarkeit VM ODE0 ist noch nicht gegeben (BCD0 läuft ohne Probleme). Dadurch können Störungen bei den Knoten, welche an IPv6 Uplinks hängen, auftreten.

Enges Monitoring läuft, nach 1 Stunde normale Anwenderzahl und Trafficaufkommen.


#39

05.01.2017

Hardwareausfall von Silver seit 06:55, Ausfall BGL, LLN, ODE und BCD
Techniker von OVH arbeiten.

Behoben seit 08:13.


#40

03.02.2017

Blech Silver war von 11.51 bis 12.12 Uhr down. Grund war ein Ausfall der Stromzufuhr.


GL Stand der Dinge 201607
GL Stand der Dinge 201607
#41

12.1.17
Updates auf allen VMs, batman-adv 2016.5

3.2.17 22:00
Beim Hinzufügen des neuen Blechs “Copper” ins PVE-Cluster kam es zu Problemen, ca. 1/2h downtime von Silver und damit gesamt GL.