Kein Internet im RG-West


#102

Ich dachte mir, dass etwas Transparenz nach außen, warum unsere Domäne wiedermal ausgefallen, nicht schadet.
Außerdem hatte ich die Nicknamen-Zuordnung gerade nicht parat gehabt, anderer Kontext XD


#103

Nur so als Vermutung: Da ist eines der “100€/Monat-Bleche” des FFRL bei OVH aus (oder zumindest nicht mehr unter seiner IPv4 pingbar seit 11.07.2018 6h38)
Zum Beispiel:


#104

Die Screenshots irritieren mich ein wenig.
Meine Router sind seit etwa halb 4 Offline, in den Screenshots sieht es aus, als wäre der Ausfall um halb 7 passiert.


#105

Kann ich bestätigen, meine Geräte sind auch um halb 4 offline gegangen.


#106

Ich sage nicht, dass ich behaupte, dass ein Zusammenhang besteht. Meine Meldung besagt lediglich, dass
der mir als FFRG-OVH-18 bekannte Rechner unter der IPv4 151.80.18.92 seit heute morgen bei uns im Monitoring nicht auf Ping antwortet.
Was das bedeutet, das kann mindestens 12 verschiedene Ursachen haben. (Ich kann gern ein paar ausführen, die gar nichts mit “whatever” zu tun haben. Führt nur sicher hier zu nichts.)

(Und rein technisch geht mich das auch nichts an, weil wir auf dem System keine VMs mehr nutzen seit vielen, vielen Monden. Ist da halt nur noch traditionell drin und ist nicht gelöscht worden.)


#107

Also ist es eine VM die nichts mit dem konkreten Ausfall der Domänen zu tun hat, aber evtl. aufgrund der gleichen Ursache ausgefallen ist.
Hab ich das richtig verstanden?


#108

Aber zumindest liegt die Vermutung nahe, dass da irgendwas “ausgegangen” ist, da z.B. auch die Wupper-Infrastruktur (wup, rdv, gl) 1-2 ihrer Gateway-Supernodes verloren hat um ca. 6h35.
Es kann sich natürlich durchaus auch um eine geplante Umstellung handeln @DSchmidtberg
Informationen habe ich nicht (muss ich aber auch nicht. Ich schaue hier wirklich nur “aus dem Fenster”, weil wir hier einen Mapserver betreiben für ein paar andere Menschen mit.)

grafik


Wupper 0+1 und service nicht erreichbar
#109

Wenn ich gleich wieder ein Terminal habe starte ich die Maschine neu.


#110

Ein Punkt könnte sein:

Eure Supernodes laufen auf Domains wie “rg-west02.freifunk.ruhr” derzeit?

der dns für “freifunk.ruhr” dafür sollten “ns1.freifunk-ruhrgebiet.de” und “ns2.freifunk-ruhrgebiet.de” sein.

151.80.64.190 antwortet aber mir nicht und 5.196.129.150 weiss nix von domains in “freifunk.ruhr”.

Will sagen: Zumindest hier würde das VPN schon an der Namensauflösung scheitern. Das darf aber auch gern ein Telekom-Problem “hier” sein.

Dass also z.B. http://www.freifunk-ruhrgebiet.de, http://www.freifunk.ruhr nimmer (so) funktionieren wie zumindest früher mal: Wäre ein Indinz nach etwas zu schauen, was “mehr defekt” erklären könnte.


#111

TL;DR
Mehrere Hardware Server sind aus gründen offline, das betrifft mehrere Communitys und auch den DNS für Freifunk.ruhr.
Ich habe es zwar noch nicht geprüft, aber @pberndro hat wohl aus seinem Urlaub heraus das DNS Problem entschärft.


#112

Danke schonmal für‘s kümmern!


#113

www.freifunk.ruhr und freifunk-ruhrgebiet.de verbinden jetzt mit servergurus.de. Da scheint sich was zu tun - was auch immer.


#114

Ich sehe keine Veränderung in den letzten rund 20h. Dieser Redirect war da auch vormittags schon.

Solange keiner von den beiden hosts

  • rg-west01.freifunk.ruhr
  • rg-west02.freifunk.ruhr

anpingbar sind (also schlicht schon per DNS nicht resolved), solange wird das nichts mit auch nur einem VPN-Tunnel.
Denn das ist der einzige Supernode, der als L2TP-Gegenstelle in site-ffrgwest/site.conf at 2016 · ffruhr/site-ffrgwest · GitHub eingetragen ist.
(Ich gehe davon aus, dass das die Firma ist, die derzeit ausgerollt ist auf Routern).

Nächste spannede Frage wird sicher auch, ob einer der 3 verzeichneten Firmeware-Signer bereit (und in der Lage) sein werden, eine Umzugsfirmware zu unterschreiben, falls man die knoten kurzfristig irgendwie migrieren wollte mittels ein paar DNS-Tricks. (stable-firmware mit nur einer notwendigen Signatur… auch mal was…)


#115

und ich dachte meine Schlafgewohnheiten sind Kacke adorfer :wink:

da sind ne Handvoll qualifizierte Fachkräfte dran den Kram wieder ans Laufen zu bringen. Es Betrifft die kompletten an die Domäne Ruhr angebundenen Communitys/Domänen und ist nicht binnen nen paar Minuten zu flicken. Dazu fehlt den Damen und Herren leider die Ausbildung an einer Zauberschule. Lösung ist in Sicht, Problem wird in Zukunft vermieden werden können.

Teile funktionieren bereits wieder, andere sind noch nicht da, es ist Urlaubszeit und dafür sind (in meinen Augen) überraschend viele erreichbar und an der Sache dran. Daumen drücken und die Sonne genießen, helfen kann man aktuell nicht wirklich.


#116

Falls z.B. schon wieder Supernodes laufen und “nur” der DNS noch fehlt, könnte man sich evtl. damit behelfen dass die einzelnen Menschen, die Zugriff auf Router haben, dort die Supernode-Adressen tauschen. Also entweder neue Domain oder direkt eine IP(v4)-Adresse hinterlegen statt rg-west01.freifunk.ruhr und rg-west02.freifunk.ruhr
(Den Befehls-Schnipsel, den man im Configmode per ssh/telnet abschicken müsste könnte man hier ja hineinstellen, damit nicht jedeR selbst herumprobieren muss.)


#117

Eine Supernode läuft wieder und 2/3 der Router sind damit verbunden. Scheinbar ist das DNS noch nicht komplett durch. Z.B vom Unitymedia-Netz aus wird rg-west01.freifunk.ruhr nicht aufgelöst auch die Map ist darüber nicht zu erreichen. Die IP der Map ist 89.163.130.116 darüber klappt es dann beim mir. Und wer von den Betroffenen seinen Router sofort wieder im Netz haben möchte muß in /etc/config/tunneldigger die Zeile

list address ‘rg-west02.freifunk.ruhr:4042’

gegen

list address ‘185.46.137.149:4042’

tauschen.


#118

Ja, gerade erst gesehen, seit etwa 13h am 13.07.2018 läuft es wieder.


#119

Ein kurzer Überblick über den mir bekannten Status der Ruhr Subdomänen;

Eine Supernode in RGWest läuft wieder, die ist natürlich jetzt etwas unter Last, wie stabil sie läuft ist noch nicht klar. Eine Zweite befindet sich in Vorbereitung was die Situation erst einmal entschärfen wird. Bei dem ein oder anderen Knoten scheint ein Neustart zu reichen um sich zu verbinden, bei anderen muss manuell (siehe Afontys Beitrag) nachgeholfen werden.

Ein (grober) Plan für den Netzumbau in RGWest existiert bereits. Dazu wird das Team (wird sich sicherlich die Tage vorstellen) das ein oder andere Firmware Update ausrollen. Daher stellt bitte eure Router auf “Autoupdate”.

Niersufer mit seinen 3 Instanzen läuft mehr oder weniger auch, eine Supernode ist gestern komplett abgeschmiert (Freitag der 13 -.-) ne neue/Ersatz wird eventuell am Wochenende fertig. Sollte ein Knoten nicht alleine “zurück” finden, eventuell hilft ein Neustart. Teilweise sind Firmwareupdates für die Knoten ausgerollt (Moers). Weitere werden die Tage folgen.

Auch hier steht ein Um/Ausbau der der Infrastruktur an.

Über Wupper und Niederrhein liegen mir keine Informationen vor. Lediglich von den Knoten die sich noch auf der/den Instanzen Ruhr befanden weiß ich das sie mit aller Wahrscheinlichkeit nicht einsammelbar sind. Wieviele es waren ist aktuell unklar, grob aber eine niedrige 2 stellige Anzahl. Dort ist ein Firmwareupdate auf die regionale Domäne nötig.

Durch den (alten) Aufbau der Domäne Ruhr und den Subdomänen und somit die Komplexität der Struktur ist der Verlust der Server so gravierend ausgefallen. Dieser Verlust war von keiner Seite so gewollt noch geplant. Ich nenne es mal “eine Verkettung von unglücklichen Umständen”. Durch die nun nötig gewordenen Umbauten wird sich das wohl nicht mehr so schnell wiederholen (lassen).


#120

Ich danke Dir für diese erläuternden Worte!

Ich bin grundsätzlich immer für offene Worte und gerade bei so einem Communityprojekt, bei dem viele Laien zum Mitmachen eingeladen werden, ist eine offene Informationspolitik wichtig, um die reinen „Knotenaufsteller“ bei der Stange zu halten. Ich bin ja noch ganz gut vernetzt, aber trotzdem hatte ich für meine „Kunden“ bzw. Nutzer keine Antworten außer „geht nicht, dauer unbekannt“. Zwar kann man sich auf die Position zurückziehen, dass das halt alles in Freizeit erfolgt und ja auch nichts kostet, und natürlich kostet Kommunikation auch Zeit, aber wenn man Freifunk in die Fläche bringen will, muss halt auch ein Informationsfluss vom Backend zu den kleinen Leuten etabliert sein.
Das kann auch sein, dass man halt irgendwo liest „FF defekt, Dauer unbekannt“ - nichts ist für die mühsam überzeugten Anwender demotivierender als Informationsvakuum. Die stellen nur fest, dass ihr Router nicht geht und sich keiner kümmert.

Und wenn es um Übersetzung zwischen Techniksprache und Laiensprache geht, biete ich mich gerne an. Auch Blogartikel für freifunk-duisburg.de könnte ich schreiben - wenn man mir Infos und Zugang zum Blog gibt.

Ich freue mich jedenfalls darauf, dass Freifunk im Ruhrgebiet bzw. konkret in Duisburg wieder voran geht.


#121

Irgendwie steht ›alles‹ schon ›irgendwo‹, aber nur zwischen Zeilen; kann bitte einfach jemand mal hier bestätigen, was adorfer im anderen Thread schon andeutete, nämlich daß …

… aus einer – lange vorgesehenen – Serverkündigung resultierte?

Wir betreiben mittlerweile eine Handvoll (+/- ein paar Hände) Server in derzeit 3 Standorten, daher lerne ich gerne aus Problemen Dritter, um in dieses oder jenes Fettnäpfchen nicht mehr selbst zu treten. (Mehrere Standorte ist z. B. so eine ›lesson learned‹; auch ein DC kann mal strom-/netzlos werden, kommt in den besten Familien vor und Murphy schert sich nicht um eingerahmte Zertifikate.)

Mehrere Hosts (›Hypervisoren‹, ›Hardwareserver‹, ›Bleche‹ usw.) fallen selten ohne äußeren Trigger zeitgleich aus; das alleine zeigt deutlich in Richtung geplante Abschaltung. Nur das der »Verlust […] von keiner Seite so gewollt noch geplant« gewesen sei, sprich dagegen. Was war’s also?