Forum Downtime Archiv :-)

Um mal eine Übersicht zu bekommen, wie oft - leider - das Forum nicht funzt, beginne ich hier eine Dokumentation der Downtime.

Hinweis: Ich weiß, die Admins machen das alles in ihrer Freizeit, das ist alles mit sehr viel Arbeit verbunden, nicht immer wird man auch mal gelobt und das ist aller Ehren wert.

Da ich beruflich fast auschließlich mit Freiwilligen und Ehrenamtlichen zu tun habe, weiß ich den Wert dieser Arbeit einzuschätzen und zu schätzen. Und ich bitte, diese Dokumentation nicht als „Angriff“ oder was auch immer in Richtung Admins zu sehen.

An anderer Stelle schrieb ich schon mal, dass ich solche Downtimes anderer Foren(software) so gar nicht kenne und würde mir wünschen, dass dieses Kommunikationsmittel besser und dauerhaft erreichbar wäre.


12.10.2015 ca bis 9h
15.10.2015 ca bis 10h
17.10.2015 ca. 9h30-11h
19.10.2015 ca 16 Uhr
20.10.2015 ca. 7-9 Uhr
20.10.2015 ca. 12-16 Uhr
20.10.2015 ca 23h30-0h45
25.10.2015 23h30 - 26.10 21h30: IPv4 über UnityMedia blockiert bei ff-hamburg
27.10.2015 11h00 - 13h00: IPv4 über UnityMedia NRW blockiert bei ff-hamburg

4 Likes

Darf ich das Posting zum Wiki flaggen, damit wir darin eine Tabelle pflegen können?

3 Likes

ja, mach ruhig. 202020202020

Wenn es dich wirklich interessant integriere einen http Check deiner Wahl in einem nagios oder ähnlichem.

Wenn du dann noch eine Mailadresse der Admins hinzufügst wird es zu einem hilfreichen Werkzeug.

Gleichzeitig bekommst du eine Dokumentation.

Diesen Beitrag hingegen finde ich in keinster Weise hilfreich.

3 Likes

das stimmt schon, dass andere Foren nicht ausfallen; dieses Forum Fällt auch nicht aus. Meines Wissens ist die Kiste zum xten Mal umgezogen worden – auf eine neue Kiste (dies dauert, aufgrund der Größe) – und es traten unvorhersehbare Probleme im Nachhinein auf. Wenn das Forum jetzt stabil läuft, dann wird es bis zum nächsten Umzug/(Update/Anstupsen/schief Angucken) stabil laufen.

Es wurde alles im Nachhinein dokumentiert

und während dessen auf Twitter kommuniziert

dies hat mich selbst überrascht, da ich beim FFCS2015 „mal eben“ den Forumbeitrag, auf den im Vortrag verwiesen wurde, aufrufen wollte und mit Routingproblemen zum Forum konfrontiert wurde. Ist aber halb so schlimm, da eine Forumspause auch mal gut tut. Für Mitteilungen zur Steuerung lebenserhaltender Geräte oder Atomkraftwerke sollten ohnehin andere Kanäle verwendet werden.

Wie gesagt, es wird kommuniziert und dokumentiert; warum noch ein mal in diesem Thread dokumentieren, das verstehe ich nicht.

Guten Abend.

Da mag ich dann doch ein paar Zeilen zu verlieren wollen.

Vorausgeschickt sei, dass ich - wie sicherlich viele andere Nutzer auch - völlig Verständnis dafür haben, wenn diverse Wartungsarbeiten erforderlich werden.

Ich lese kein Twitter, ich stelle beim Forum-Aufruf fest „geht nicht“.

Eine Umleitung auf eine nackte HMTL-Info-Seite wäre vielleicht das Mittel der Wahl, die Foren-User kurzfristig zu informieren. Da hat dann sicher jeder Verständnis.

In der zurückliegenden Zeit war das Forum relativ oft (persönlicher Eindruck) down. Mich persönlich nervt das schon.

Da ich keine näheren technischen Details der Down-Time kenne - ja, ich habe die anderen Threads gelesen - möchte ich als Benutzer schon gern wissen, ob und wann denn diese öfteren Ausfälle irgendwann mal wirklich ein Ende haben.

Sollte es an der Forensoftware in Kombination mit überlasteter Hardware liegen, würde ich mir schon wünschen, dass entweder entsprechende Hardware zum Einsatz kommt oder weniger ressourcenhungeringe Forensoftware.

Wie gesagt, ich weiß wie das ist, habe selber als Forenadmin gewerkelt, kenne User-Seite, kenne Betreuer/Betreiber-Seite.

Ziel muss sein, dass die Ausfälle auf ein Minimum zurückgehen, dann hat auch der Admin mehr Zeit für Privates und die Benutzer kommen gern wieder zum kommunizieren…

Wenn wir/ich dabei helfen können/kann, lasst es uns/mich wissen, wie.

Für konstruktive Wortbeiträge bin ich immer offen.

Herzliche Grüße
Jörg

2 Likes

Hallo,

Genauso wie Du verfügen auch wir nicht über eine Glaskugel welche uns vorhersagen könnte ob unsere Hardware ab dem heutigen Tag stabil läuft. Dass der Hypervisor auf der Hardware zu einem Stillstand kommt ist kein normales Verhalten bei einem durchgängig zertifizierten Stack (Server+Storage+Hypervisor). Dieses Setup wird von allen beteiligten Herstellern so supported.

Wie @nomaster bereits schrieb gab es in der Vergangenheit Resourcen-Engpässe die mit einer überaus potenten Hardware nun gelöst sind.

Ich kann allen von den Downtimes genervten Benutzern versichern, dass niemand der die Hardware dort administriert froh über solche Ausfälle ist oder sie gar absichtlich provoziert. Wir tun alle unser möglichstes um die Ausfälle auf ein Minimum zu reduzieren. Aber wie bei allen anderen werden unsere Brötchen nicht vom Freifunken bezahlt. :wink:

Wir haben nun eine zweite Hardware auf die Forum umgezogen ist. Ob das Problem darauf auch auftritt bleibt abzuwarten:

Grüße
Thomas

2 Likes

Guten Morgen Thomas.

vielen Dank für die ausführliche Antwort und Eure ganzen Bemühungen.

Ich weiß aus eigener Erfahrung, wie das ist, wenn Benutzer an einem „rütteln“ wenn was nicht geht. Ich denke, dass ich ganz sanft gerüttelt habe. :slight_smile:

Wollen wir hoffen, dass nun alles rennt. Drücke ganz fest die Daumen.

Herzliche Grüße aus Nordhessen
Jörg

1 Like

Zählen wir partielle Downtimes auch? Aus dem DTAG Netz geht es, der @adorfer kommt aus dem Unitymedia Netz nicht rein. Ist bestimmt Absicht, damit er das Forum in Ruhe lässt. :wink:

1 <1 ms <1 ms <1 ms xxxxxx
2 1 ms 1 ms 1 ms xxxxxx
3 * * * Zeitüberschreitung der Anforderung.
4 131 ms 120 ms 111 ms de-fra04a-ra1-ae10-1310.fra.unity-media.net [81.210.129.169]
5 78 ms 52 ms 9 ms 84.116.197.93
6 125 ms 138 ms 133 ms de-fra03b-ri1-ae12-0.aorta.net [84.116.133.97]
7 128 ms 132 ms 106 ms ge0-0-3-br2.frankfurt1.iphh.net [80.81.192.27]
8 152 ms 142 ms 130 ms ae1-11-br3.hamburg2.iphh.net [213.128.159.101]
9 138 ms 136 ms 135 ms te4-3-cr1.hamburg2.iphh.net [213.128.159.14]
10 141 ms 142 ms 138 ms wende0.hamburg.freifunk.net [213.128.138.162]
11 * * * Zeitüberschreitung der Anforderung.
12 * * * Zeitüberschreitung der Anforderung.
13 * * * Zeitüberschreitung der Anforderung.
14 * * * Zeitüberschreitung der Anforderung.
15 *

Da scheint das Routing nicht zu stimmen. Freifunk Hamburg ist jedenfalls nicht für das Forum zuständig und sollte nur Traffic für das eigene AS annehmen.

@thomasDOTwtf @takt @Barbarossa schaut mal her, bitte.

Das ist so vollkommen ok. Wir sind gewähren uns gegenseitig Transit.
Das Problem kann mit den letzten vorgenommenen Changes zusammen hängen.
Ist es noch existent? Ich verfasse diesen Post gerade aus dem UM Netz.

Hallo,

Problem ist noch existent, ich kann nach wie vor das Forum nicht erreichen von UM mit IPv4. Habe nun einen IPv6 Tunnel angeknipst und komme so ins Forum, Routing läuft dann nicht über Hamburg. Muss man aber erstmal merken, dass das Forum nicht komplett weg ist!

viele Grüße

Biertrinker

Konstantes Problem aus UMv4-Hessen, privat wie business.
Routing versumpft bei Freifunk-Hamburg.

Wir (Freifunk Rheinland & Freifunk Hamburg) haben gestern Abend das ganze mal genauer angeschaut. Einer unserer Transits hier in Hamburg hatte da noch einen Filter gesetzt, der Pakete aus dem Rheinland verworfen hat. Das konnte dann schnell und unkompliziert behoben werden, weshalb nun wieder alles laufen sollte.

3 Likes

Herzlichen Dank. Das sollte geholfen haben und erklärt auch, warum ich das Problem auf unserer Seite nicht lokalisieren konnte.

1 Like

Ich habe mal zwei Measurements beim RIPE Atlas eingerichtet:

Diese ermitteln alle 8 Stunden die Erreichbarkeit des Forums von verschiedenen Standorten aus und zeigen den jeweils gewählten Pfad (Traceroute).

5 Likes