28.6. Krefeld schon wieder Offline

Der Titel sagt alles,
Alle Niersufer Clients in Krefeld sind offline

Bei mir (11:51) ist das meiste online.

War wohl nur für 15 Minuten von 10.19 Uhr bis 10.36
Habe zu der Zeit gerade einen neuen Router aufgesetzt, der gemeshed hat, aber sofort Offline ging. Wäre mir sonst wohl auch nicht aufgefallen.
Da der Ausfall bei letzten Mal mehrere Stunden war, habe ich es gepostet.

Hi,

so wie es in aller schneller aussieht, ist ein Supernode ausgefallen.

Supernode läuft wieder. Alles gut.
Ist schon ungewöhnlich so nen Ausfall, lief ja jetzt Monate lang stabil.

Gruß
Thomas

1 Like

Da das Thema ja bereits kürzlich aufkam. Was haltet ihr denn von einem „Twitter/FB/ETC Ticker“
Wo nur kurz announced wird, dass etwas nicht läuft. Auf der Website gebt ihr ja eher ausführliche Informationen.
Das würde die ganzen Threads und bei mir zumindest auch einige Anrufe à la „Freifunk funktioniert grade nicht“ ersparen.

Wenn es euch zu viel Arbeit macht kann ich das auch Verstehen… :smiley:

Twitter wäre vollkommen ausreichend.
Eine kurze Nachricht a la" wir arbeiten heute ab 10.00 Uhr an unseren Nodes, es könnte zu kurzfristigen Ausfällen kommen" oder „Nodeausfall in der Niersufer Domain um xxx Uhr“ würde viel Nachfragen ersparen.
Natürlich ginge das auch im Blog, aber der ist ja aufwändiger zu pflegen.
Das könnte Thomas @fragstone theoretisch auch einfach über seinen Twitteraccount machen.
Schicken die Nodes nicht automatische Ausfall- Fehlermeldungen per SMS oder Mail? Dann könnte man die eigentlich auch an einen extra Twitteraccount automatisch umleiten.

Ihr seit ja lustig. Wenn euch etwas auffällt, das etwas nicht geht schickt uns doch bitte eine Email.
Wenn man etwas für 10 min nicht geht ist mir das persönlich eigentlich relativ egal.
Weil Freifunk ist immer noch ein Freizeit Projekt das von der Community getragen werden muss.

Falls einer meiner mit Admins Spaß hat so etwas einzurichten/zu verwalten gerne.
Ich halte mich mal bedeckt zu dem Thema.

1 Like

Wir sind bei geplanten Arbeiten schon so vorsichtig wie es irgendwie geht und halten die Ausfallzeiten so minimal wie moeglich.

Die letzten Tage gab es aber voellig unerwartete Ausfaelle. Da wir davon selber nicht immer sofort etwas mitbekommen, koennen wir es auch schlecht ankuendigen. Da wir das hier alle Nebenberuflich als Hobby machen, muss uns wohl gestattet sein, dass wir keine 24x7 Ueberwachung der Infrastruktur betrieben. Und nach jedem Ausfall, den wir haeufig innerhalb von Minuten beheben Bericht erstatten wuerde meiner Meinung nach einen unnoetogen Overhead erzeugen.

1 Like

Die Map ist ja schon ein guter Anhaltspunkt. Kann aber auch gelegentlich ausfallen.
Entsprechend kann man hier schauen

http://grafana.freifunk-niersufer.de/

Und bitte, wenn euch was auffällt was nicht so funktioniert wie es sollte oder ihr sonst irgendwelche Fragen habt.
Schickt uns ne EMAIL.

Heute morgen das Problem lässt sich nicht in gänze analysieren. Es scheint aber ein Problem am Tunneldigger gegeben zu haben und der ESX host scheint die Maschine angehalten zu haben. Das hat sich wohl über mehrere Minuten hingezogen weshalb auch teile der Nodes offline waren. Wäre der Node einfach so gecrashed hätte es keiner gemerkt. Der tunneldigger ist so fix beim reconnecten das es tatsächlich keinem aufgefallen wäre (außer den Admins in den Statistiken)

Das soll aber nun echt alles zu dem Thema sein. Ich hoffe wir haben morgen nicht wieder einen Ausfall oder wie sagt man so schön. Aller guten Dinge sind drei :smiley:

Gruß
Thomas

1 Like