Wie nach dem update verlorene Knoten wieder ins Netz einbinden?

Hallo und guten Tag,
ich möchte folgendes Problem schildern:

seit dem letzten update der Ruhrgebietsfirmware auf 0.5.2 sind wegen des Kanalwechsels einige Router ohne uplink nicht mehr erreichbar, da sie an Routern mit anderer Firmware hängen.

Mir wurde gesagt, dass ich einfach abwarten soll und sich das über Nacht durch neue Updates lösen würde.

Bisher hat sich nichts getan in der Richtung. Ich glaube dass ich diese Router nur wieder ins Netz bringen kann, indem ich per Lan die Firmware aufspiele.

Sehe ich das richtig so?

Über eine technische Antwort würde ich mich freuen.
Besten Gruß

Enrique

Nachtrag:
an anderer Stelle wurde ein Thema mit der Begründung geschlossen, dass alles zum Thema update gesagt und geschrieben wurde.
Es scheint nicht der Fall zu sein, da Sekunden später ein Freifunker einen neuen Strang zu genau diesem Thema eröffnete.
Das verstehe ich nicht.

Also, für den Fall, dass das Router sind die ausschließlich von Routern Netzzugang bekommen, die sich nicht flashen lassen, dann werden diese nur per Kabel flashbar sein.

Einfach irgendwo ans LAN hängen wo sie Internet haben und mittels „autoupdater -f“ updaten lassen.

Wenn es diesen Fall in Gelsenkirchen genau so gibt, dann ist das aber gleichzeitig auch ein Designfehler, als quasi Master Router mit anderer Firmware und ohne Autoupdate zu haben und auf den quasi Slaves das Autoupdate an zu haben.

Um ehrlich zu sein hatten wir solch einen Fall auch noch nicht gesehen und sind entsprechend davon ausgegangen das wir zumindest alle Router die selber VPN aufbauen erwischt haben und nun mit dem Update auf 0.5.3 dann sozusagen mögliche verlorene Router, die „nur“ im Mesh sind automatisch wieder einsammeln.

Weil für den Philip das Update komplett durch ist.

Für einen 3600 der noch nicht wieder online ist oder aber Mesh only Router die verloren gegangen sind muss man dann Einzelfallbetrachtungen in neuen Threads machen, das sprengt dann den Rahmen des reinen Updates.

Hallo und guten Tag, ich habe auch noch Fragen zum Thema autoupdate, möchte aber weder gegen Regeln der Höflichkeit noch gegen geschriebene oder ungeschriebene Boardgesetze verstoßen.
Ein Freifunker mit mehr Übersicht als ich, erklärte dass alles zum Thema gesagt und geschrieben worden ist.
Nun wird hier weiter zum Thema geschrieben.
Darf ich hier auch meine Fragen stellen?

Mit der Begründung ist @CHRlS mir zuvor gekommen. Danke dafür.

Danke Chris - genau dass dachte ich mir schon gestern und wollte nur nicht unhöflich sein, als man mir sagte, dass das durch erneute updates gelöst werden würde.

Also muss ich wie befürchtet die Router vor Ort einsammeln - oder:

  1. Ich spiele die Ruhrgebietsfirmware auf alle Router auf, damit sie sich gegenseitig wieder erreichen?
  2. Andreas zaubert irgendein Script, dass seiner Firmware ermöglicht die verlorenen Router einzufangen.

Bei beiden Optionen bin ich etwas skeptisch und befürchte Komplkationen. Vielleicht sehe ich auch nur zu schwarz.

Da wird der Andreas sich bedanken.

Also, was möglich ist, kurzzeitig per SSH den Kanal der Router auf 1 setzen, dann sind die Router dahinter wieder erreichbar und werden innerhalb von maximal 24 Stunden updaten und wieder nicht erreichbar sein.

Danach dann wieder den Kanal auf 3 per SSH zurück ändern, dann läuft wieder alles!

Wenn Du Zugangsdaten für die Router hast dann benötige ich für jeden Fall eines verlorenen Routers:

  • den Namen des stabilsten Partnerrouters mit Internet und Zugangsdaten für diesen

…dann mache ich Dir das, oder der Andreas…

Ja, eine solche Begründung ist auch eine Begründung.
Ich sehe es so: ihr habt beim update etwas verbasselt, was immer mal wieder vorkommen kann und niemand wird euch deshalb einen Vorwurf machen.

Das Problem ist ein strukturelles und sollte hier von allen diskutiert und gelöst werden - nämlich ob man so einfach ohne ausreichende Prüfung in einer Testumgebung ein update fahren kann.

Das geht entgegen der Behauptung von Maltus gegen keine Person, niemand wird durch solche Überlegungen persönlich angegangen oder in Frage gestellt. Es scheint einfach nur nicht geregelt zu sein, wie man sicher solche Änderungen laufen lassen kann.

Das zweite Problem ist, dass wir durchgängig Konflikte haben, weil wir unterschiedliche Einstellungen über eine „Fehler“-Kultur haben.

Vom ersten Moment an wurde ich hier übel angegangen - als ich z.B. vorschlug, einen internen Bereich einzurichten.
Großes Gezeter „Enrique der Mauschelbruder“
Danach wurde ich angegangen, weil ich eine Pressekonferenz abhalten wollte - „Enrique der Ahnungslose hat ja noch nicht mal gedient“
Dann weil ich angeblich unhöflich bin, mal dies, mal das.

Sorry Leute - so geht das nicht. Hier muss sich ja nun wirklich nicht jeder mögen müssen. Wer den Themenstrang Ruhrgebietsupdate aufmerksam und ohne Vorurteile liest, wird ganz sicher feststellen, dass dort meine Probleme unter den Tisch gekehrt, nicht ernst genommen wurden.

Aber was solls - ich werde versuchen einen Weg aus dieser Sackgasse zu finden.

Hä? Ich habe Dir doch sogar die Lösung geschildert (siehe oben)!

Bin gestern morgen mit dem Problem ein wenig anders umgegangen.

1 Node hat ein update auf 5.2 bekommen 2. Node war per Mesh verbunden und noch auf 5.0.

Habe den 1. Node dann per SSH auf 5.0 downgraded. In diesem Augenblick ist auch das update auf 5.3 erschienen.

Also den 2. Node der jetzt wieder erreichbar war, mit dem update auf 5.3 versorgt und nach dem das update erfolgreich eingespielt war den 1. Node mit 5.3 versorgt.

Das gleiche könntest du natürlich versuchen um die verloren Nodes wieder zu bekommen also dafür ein downgraded auf 5.2 ( Falls die Nodes überhaupt schon das Update auf 5.2 hatten.)

Heinz hat da experimentelle 2014.4 Barrier Breaker auf den Nodes mit direktem Internetzugang!

Hä? Ich hatte den Beitrag geschrieben ohne deine zwischenzeitliche Antwort mitbekommen zu haben. :wink:

Trotzdem ist meine Aussage korrekt - meine Fragen wurden übergangen - mein Hinweis, dass es wegen der falschen Kanäle kein Update geben kann, mit der Aufforderung gekontert, mal schön still zu sein. Etc.

Das Thema „Autoupdate Ruhrgebiet“ wurde sicherlich nicht geschlossen, weil alle Fragen geklärt sind. Wäre dem so, gäbe es nicht 2 Folge Stränge.

Mit „Sackgasse“ ist übrigens gemeint, dass es auf Dauer keine fruchtbare Zusammenarbeit geben kann, wenn es so große Differenzen des „kulturellen“ Miteinanders gibt.

Sachprobleme mit Formalismen zu verkleistern (sei mal höflich, sei mal still) ist nicht mein Ding.
Dass hier viele Aktive und Entscheidungträger Getriebene der Entwicklungen mit wenig Handlungsspielraum sind, nehme ich sehr wohl wahr. Dass die Arbeit auf zu wenigen Schultern lastet auch.
Daraus aber eine Berechtigung abzuleiten, unliebsames mit Schweigen zu erdrücken, geht nicht.

Aber - ich werde mich da irgendwie durchlavieren und nach einer Lösung suchen, die alle zufrieden stellt.

Mir sind aktuell zwei Fälle bekannt.

Der eine ist ein nicht mehr erreichbarer 3600 mit direktem Internetzugang - kann beim Booten hängen geblieben sein, wird geklärt werden.

Der andere Fall sind Deine Router, die hinter fremder Software hängen, welche nicht von uns upgedated werden konnte. Ob das nun wirklich unser Versagen ist, dass das Autoupdate auf den verbliebenen Slaves in Gelsenkirchen nicht ausgeschaltet wurde, das lasse ich einfach mal dahin gestellt. Mir geht es nicht um Vorhaltungen, sondern ausschließlich um konstruktive Lösungen.

Entsprechend habe ich angeboten, dir das zu fixen. Das ist ne ganz simple Geschichte, wenn man das so macht wie von mir skizziert. Was soll ich denn noch mehr machen? Und wieso gibt es nun Differenzen im kulturellen Miteinander?

Verstehe ich wirklich nicht…

1 „Gefällt mir“

[quote=„CHRlS, post:13, topic:1086“]
Ob das nun wirklich unser Versagen ist, dass das Autoupdate auf den verbliebenen Slaves in Gelsenkirchen nicht ausgeschaltet wurde, das lasse ich einfach mal dahin gestellt. [/quote]Kann das sein, dass deine Antwort rabulistisch ist?
Da habe ich das Problem bisher nicht gesehen - die Slaves wurden aus dem Netz gekickt weil ihr den Funkkanal gewechselt habt.

Mir auch. Eine konstruktive Lösung (nach der ersten Hilfe) kann nur sein, dass man solche Sachen ausreichend unter Belastung in einer Testumgebung laufen lässt, bevor das auf die Router losgelassen wird.

Oh… du gehörst zu den … warte… 4 (vier) Leuten hier, bei denen es die größte gemeinsame Schnittmenge gibt.
Die Gemeinten (kulturell Differenten) wissen was ich meine, wenn sie es nicht wissen, ist da auch nichts mehr zu machen. :blush:

Zum Thema „kulturelle“ Differenzen:
Phillip zu Enrique:

Kann man machen. Spricht sicher auch vielen aus dem Herzen. Sollte ein Moderator aber vermeiden.
Zumal es objektiv falsch ist.
Die Botschaft ist angekommen.
Die Sub- oder Metabotschaft auch.

Scheint kein einfacher Prozess zu sein, von einer Mailing-Liste auf ein Forum zu wechseln. von einer homogenen Gemeinschaft aus Bastel-Kellerkindern zu einer heterogenen Gruppe mit schwerfälligen, nicht Technik-Affinen Menschen. Da braucht es auf allen Seiten Geduld und Zeit.
Die ich zumindest euch lassen werde.

Danke für das Angebot. Vielleicht reicht auch aus, wenn du mir hier die ssh Befehle für die Kanaländerung posten würdest.
Du hättest weniger Arbeit und ich wäre um eine Erfahrung reicher und einer gewissen Autonomie ein Stück näher. :blush:

Als erste Amtshandlung bestimmst Du den im Mesh zum verschollenen Router stabilsten Router, auf diesen gehst Du dann per SSH drauf.

Auf diesem siehst Dir zunächst mittels:

uci show wireless

an welche radios vorhanden sind.

Im einfachsten Fall ist es ein einziges Device, ansonsten zwei, das sieht dann ( sehr gekürzt) so aus:

wireless.radio0=wifi-device
wireless.radio0.channel=3

Nun änderst Du den Funkkanal von 3 auf 1 mittels:

uci set wireless.radio0.channel='1'
uci commit

Und lässt den Router live die Änderungen am Wlan übernehmen mittels Befehl:

wifi

Fertig, bis hierhin.

Nun sollte der verschollene Router nach ein paar Minuten im Alfred auftauchen, wenn der Funkkontakt im Mesh gut genug ist.

Dann gehst Du auf den vorher verschollenen Router drauf und schmeisst direkt nen Update an mittels Befehl:

autoupdater

Nun lässt Du den Router in aller Ruhe updaten. Wenn er nach Zeit, sagen wir mal 10-15 Minuten maximal nicht wieder erreichbar / sichtbar wird, dann machst Du auf dem Router mit Internetzugang die Änderungen wieder rückgängig, also:

uci set wireless.radio0.channel='3'
uci commit
wifi

Nun sollte der zuvor verschollene Router nach einer gewissen Zeit wieder auftauchen, installiert auf Version 0.5.3.

Das ist dann schon alles…

@CHRlS

Danke, leider hat es auch 3 Router erwischt, zu denen ich keinen Zugang habe. Bei einem, weit außerhalb des Innenstadtnetzes, habe ich versucht den „aúfzuwecken“ - ist mir nicht gelungen.
Vielleicht wurde der schon vom Strom getrennt weil er tot war.

Bei den anderen beiden wäre eine Kanaländerung wahrscheinlich negativ folgenreicher für das Netz, als sie so lange herum funken zu lassen, bis ich per Kabel an die Geräte komme.

mhh ich hab einfach gar nix gemacht und der verlorene Router ist nach dem neuen Update auf 5.3 wieder aufgetaucht und hat sich auch die neueste Firmware gezogen…

Daher unser Plan so vorzugehen wie wir es getan haben und dieser hat auch in fast allen Fällen funktioniert.


Ich fasse noch mal die Ereignisse der letzen 2 Tage zusammen:

Wir haben am 14.10.2014 ab ca. 22:00 Uhr das Update von der Version 0.5 auf die Version 0.5.2 per Autoupdate ausgerollt.

Hinzugekommen in der Version 0.5.2 sind neue Supernodes und ein Änderung des Kanals von 3 auf 1 (GIT Commit).

Die Änderung des Funkkanals hatte zur Folge, dass die Router ohne direkten Uplink (Version 0.5) im Mesh die Konnektivität verloren haben, nach dem die Router mit Uplink sich das Update runtergeladen und installiert haben (0.5.2).

Die Router ohne Uplink auf Kanal 3 mit der Version 0.5 hatten jetzt keine Verbindung mehr zum Netz und konnten somit nicht auf den Update-Server zugreifen, dass Update laden und auf Kanal 1 wechseln um wieder eine Verbindung herzustellen.

Danach haben wir uns am Morgen des 15.12.2014 entschlossen ein weiteres Update hinterher zu schieben, die Version 0.5.3. Mit dieser Version ist der Kanal wieder auf 3 einstellt und wir haben die Kanal-Änderung wieder zurückgenommen (GIT Commit).

Die Router mit Uplink und der Version 0.5.2 haben sich die neue Version 0.5.3 runtergeladen und installiert und danach wieder auf Kanal 3 gefunkt. Somit konnten sich die Router mit der Version 0.5 aus dem Mesh und dem eingestellten Kanal 3 auch wieder zu den Routern mit Uplink verbinden, ein Update finden und installieren und diese laufen nun auch mit der Version 0.5.3.

Gruß,
Philip