Admin-Tagebuch GL

Nein, es ist ein permission issue. Auch dokumentiert: isc-dhcp-server - Community Help Wiki

Es reicht aber eben nicht einfach der dhcp.leases Datei die nötigen Rechte zu geben, wie das hier anscheinend getan wurde. Die noch aktiven Leases werden in eine neue Datei kopiert, und dann als atomare Aktion auf die alte dhcp.leases verschoben. So gibt es keine inkohärenten Zustände. (Siehe auch)

Das macht der DHCPd auch einmal pro Stunde. Die Sache ist, dass es beim Restart halt klappt, weil der da noch nicht seine Rechte gedroppt hat und als Root läuft. (Siehe auch, man beachte: db_startup() kommt vor setuid())

Wenn ihr mir nicht glaubt lasst den halt mal mit strace laufen und schaut nach einer Stunde wo die Syscalls fehlschlagen.

Das ganze ist übrigens ein Distributor-Problem (kaputtes AppArmor-Profil), tritt also ausschließlich bei Ubuntu auf und ist in der aktuellen LTS gefixt. Migrationen funktionieren jedoch laut Bugreport nicht so gut. Also vermutlich einmal purgen und reinstallieren.

Und das Problem sollte eigtl Prio haben, da ein so kaputter DHCP nicht vereinbar mit dem BDSG ist, welches eine Speicherung der IPs für maximal 7 Tage über die technische Notwendigkeit hinaus erlaubt.

1 „Gefällt mir“

ich schlage vor: Kea - new dhcp from isc

8:05 Uhr Ausfall von Eulenfunk-GL (LLN, ODE, BCD, RRH, BGL) durch Ausfall bei OVH, unserem Hoster der Gateways.
10:39 Uhr Link zum Standort unserer GWs (RBX) ist wieder aktiv, unser Netz läuft wieder

News: https://twitter.com/ovh_support_en

1 „Gefällt mir“

Update 20171114:

Auf allen Servern Updates gemacht, rebooted, neues batman-adv, batctl usw.

20171228:
gl2 geupdated und letsencrypt erneuert

20180202:
Ausfall der Namensauflösung auf ffgl.eu
(Alle Router sowie Kartenserver nutzen daruf basierende DNS-Einträge, um die Supernodes zu finden).
Gelöst seit 18.36 Uhr, das Netz stabilisiert sich.
ToDo: Redundanz herstellen

1 „Gefällt mir“

Map-Server down.

https://bgl.map.ffgl.eu/

Präziser: er ist nicht down (Animation „Lade Karte & Knoten…“ erscheint), führt aber nach einer Weile nur zur Anzeige der Meldung „Error: Network Error“

[edit] 3 Stunden später: geht wieder.

Jupp… Batman kernelpanik.
nach langer Zeit mal wieder.

1 „Gefällt mir“

20181025:
Ich habe auf gl2.ffgl.eu Updates gemacht, den Server neu gestartet und Let’s Encrypt-Renewals übers Webroot eingerichtet. Jetzt reicht also ein „certbot renew; systemctl reload nginx“.

Mit der aktuellen Kernel-Version 4.18.16. ist es nicht notwendig, batman-adv manuell aus einer externen Quelle zu kompilieren, die aktuelle Version wird 2018.2 mitgeliefert.

1 „Gefällt mir“

Danke!
Allerdings hängen, glaube ich zumindest, wieder die Fastd-IFs. Die Webcam legt seit 10:36 keine neuen Bilder mehr ab. Kannst Du nochmal schauen?

Die fastd- und batman-interfaces laufen. Wo kann ich schauen ob die Webcam geupdated wird?
Edit: habe gerade nochmal nachgeschaut und die Webcam scheint geupdated zu werden

Läuft wieder, lag am Router, der die Daten der Kamera weiterleitet.

Müssen wir noch irgendwas tun, um die NRW-DOPs wieder zu bekommen?

Die Map läuft wieder nicht. :confused: Im Browser Fehlermeldung Seitenladefehler / Netzwerk-Zeitüberschreitung, Server könnte eventuell vorübergehend nicht erreichbar sein, bla bla bla… :sweat_smile:

Sieht wieder aus als wär der Server abgeschmiert…
@adorfer ?

Nein, der Server läuft, die VM hat wieder Batman-Kernelpanic.

Falls jemand ein Monitoring/Reset-Script für den qemu schreiben möchte: PR welcome…

@PetaByteBoy Wenn Du dafür Zeit finden würdest, das wäre toll.

Tut’s nicht ein /sbin/sysctl kernel.panic=5 in /etc/rc.local (oder analog für /etc/sysctl.conf)?

Welcher Kernel, welches batman_adv.ko? Würde diese Kombo dann gerne vermeiden :wink:

16.04.5 LTS: Ubuntu 16.04.5 LTS - Kernel 4.15.0-38-generic: Boot 4.15.0-38-generic
batman-versions:batctl 2018.3 [batman-adv: 2018.3]

2018-12-31

Auf gl2.ffgl.eu lief die mariadb nicht, und somit waren die WordPress-Instanzen freifunk-leichlingen.net und freifunk-bergischgladbach.de down. Ich habe es wieder angeworfen. Vermutlich ist der service bei einem Neustart vor 4 Tagen nicht erfolgreich gestartet. Wieso habe ich nicht weiter investegiert.

GL2 hat sich wohl irgendwann verabschiedet