Wichtiges Firmware Update 0.5.6

Hallo,

Vorab: Wichtig für euch ist:

Bitte den Router, insbesondere, wenn es ein reiner Mesh-Router ist, am Dienstag, den 09.06.2015 zwischen 8 Uhr morgens und 17 Uhr nicht vom Netz nehmen oder ausschalten, damit er wie unten beschrieben ordnungsgemäß sein Update installieren kann!
Die Netmon-Anzeige hat in den nächsten Tagen – bis das Update vollständig abgeschlossen ist – keine Funktion/Aussagekraft.

auf unserem gestrigen Freifunk-Treffen in Osnabrück haben wir uns nun abschließend darauf verständigt, den Schritt in Richtung Firmware 0.5.6 zu machen.

Hierbei handelt es sich nicht um eines der kleineren 0815-Updates, die in den letzten Wochen und Monaten hauptsächlich dafür da waren, kleinere Fehler zu beheben oder neue VPN-Gateways hinzuzufügen. Stattdessen wird mit dieser Version das gesamte Netz von der bisher verwendeten 2013er-Version des B.A.T.M.A.N-Protokolls auf eine neuere, 2014er-Version aktualisiert. Da dieses Protokoll für das Meshing der Freifunkrouter untereinander zuständig ist und bei diesem Versionssprung keine abwärtskompatibilität gegeben ist, wirft dies einige Probleme auf.

Router mit unterschiedlichen Firmwareversionen (<0.5.6 gegenüber >=0.5.6) sind nicht in der Lage, miteinander zu kommunizieren. Auch können sich Router mit älterer Firmware/B.A.T.M.A.N-Version künftig nicht mehr mit den VPN-Gateways, die die neuere B.A.T.M.A.N-Version fahren, verbinden. Es ist somit dann kein Netzzugang für diese Firmware-Versionen möglich.

Um Routern, die zur Zeit des geplanten Updates gerade – warum auch immer – offline sind, dennoch die Möglichkeit des Autoupdates zu geben, werden wir kurzfristig (wenige Tage bis Wochen) einige der VPN-Server noch auf der alten B.A.T.M.A.N-Version laufen lassen.

Problematisch beim bisherigen Autoupdate-Mechanismus wäre für dieses Update die Versorgung der reinen Funk-Mesh-Router ohne eigenen Internetanschluss gewesen: Würden diejenigen Router, über die diese an das Internet angebunden sind, zuerst das Update einspielen, wäre die Verbindung zu den Mesh-Routern wegen der beschriebenen fehlenden Abwärtskompatibilität nicht mehr möglich und diese würden dauerhaft auf der alten Firmware festhängen und vom Netz abgeschnitten sein.

Aus diesem Grund ist bereits in der aktuellen Firmware-Version eine modifzierte Version des Autoupdaters enthalten, die dafür sorgt, dass sich sämtliche Router zunächst das Update herunterladen und anschließend zuerst und mit 4 Stunden Zeitvorsprung die reinen Mesh-Router das Update einspielen. Für die nächsten 4 Stunden sind diese dann nicht online, bis die restlichen Router nachziehen, die Verbindung wieder aufgebaut werden kann und anschließend wieder alles wie gewohnt funktionieren sollte.

Wir haben diesen Schritt ausführlich diskutiert und uns überlegt, ob es Sinn macht, ein anderes, als dieses verhältnismäßig einfache, zeitbasierte Updateverfahren zu implementieren, haben in einigen Praxistests aber mit diesem Verfahren sehr gute Ergebnisse erzielt.

Drücken wir die Daumen, dass alles wie geplant funktioniert, dann haben wir Dienstag Abend ein Netz, das in seiner technischen Entwicklung auf einen Schlag über ein Jahr reifer ist :wink:

2 „Gefällt mir“

Ich drücke meinem wifimesh-only auf dem Kamin mal die Daumen.

1 „Gefällt mir“

Das sollte er schon schaffen, solange er an ist :slight_smile:

1 „Gefällt mir“

hmm, meine beiden Router sind zumindest im netmon nach wie vor offline, damit also rund 5 Stunden überfällig.
So wie gefühlt 80% der Router auf der Map.

Ist das nur ein Anzeigeproblem oder hängen die Geräte wirklich „in der Luft“?

Netmon macht Probleme. Ich kann z.B. von dem Server, auf dem Netmon läuft, die Crawldaten meines Routers abrufen, aber Netmon anscheinend nicht.

o.k. dann gedulde ich mich mal bevor ich das Schalten von Sicherungen telefonisch anfordere :wink:

1 „Gefällt mir“

@adorfer bei mir genauso…
ff_nodes online aber keine anzeige.
überprüfung per ssh möglich :slight_smile:

egal, anzeige ist nicht wild… hauptsache das netzt ist online :wink:

1 „Gefällt mir“

Wir sind am Problem mit dem netmon dran. Das Problem ist aktuell der Crawler aber wir halten euch auf dem laufenden :slight_smile:

2 „Gefällt mir“

Zumindest zeitweise tauchen die Nodes schon wieder im Netmon auf. Und da man vor Ort als Client auch DHCP und Internet bekommt scheint es zumindest mit dem batman als solches ja funktioniert zu haben.

Besten Dank!

Netmon wackelt noch weiterhin rum, nachdem es zwischendurch bereits relativ stabil lief.

Desweiteren haben wir zur Zeit noch ein merkwürdiges Phänomenen:

Manche Router ziehen brav eine Public IPv6 übers Mesh, liefern Alfreddaten ab, sind aber von keinem Gateway aus erreichbar. PubIPv6, ULA, LinkLocal, nichts geht. Verbindungen von einem anderen Router zu dem Router (per VPN) funktionieren.

Das kenne ich nur von den batman-gateways selbst bei „Teildefekten“.
Tritt das auch auf, wenn die Plasterouter die Gateways durchwechseln?

Hat das Update wie oben beschrieben gut geklappt oder ist euch einiges um die Ohren geflogen?

Hi,

um die Ohren geflogen ist sicher nichts, es gibt aber noch diverse Probleme, die sich nicht mal eben bei einem fünf Minuten Kaffee lösen lassen. Das ist aber auch ganz normal, wenn man die zentrale Komponente eines komplexen Systems austauscht und hängt von vielen Faktoren ab.

Bitte gebt den Leuten die daran arbeiten 1-2 Wochen Zeit die Probleme zu fixen. Anschließend können wir gemeinsam evaluieren was gut gelaufen ist und was Probleme bereitet hat. Ich möchte an dieser Stelle auch ein wenig den Druck von den Admins und Entwicklern nehmen, die im Moment überdurchschnittlich viel Freizeit investieren.

Liebe Grüße
Clemens

Wir haben in unserem Planungspad einen Bereich für Verbesserungsvorschläge bezüglich des Update-Prozesses für große und kritische Updates eingerichtet. Wenn ihr Vorschläge habt, dann würden wir uns freuen wenn ihr die dort postet. Gerne sowohl technischer als auch organisatorischer natur:

https://pad.freifunk.net/p/ffnw-batman-update

Liebe Grüße

Ja, anscheinend. Ich bin kurz davor, mal die Batman-Devs und/oder auf der Gluon-ML und im Gluonbereich zu fragen.

Was meinst du mit teildefekten Gateways?

  • Plasterouter mit meshvpn ist im netz (sieht originators, sieht gwl, ist einem gw assigned)
  • Plasterouter kann batctl p auf gateway durchführen. Umgekehrte Richtung funktioniert auch.
  • Plasterouter bekommt Route-Advertismenets
  • Clients an Plasterouter bekommen dhcp und die Routen vom supernode
  • Clients an Plasterouter haben IPv6 und IPv4 innerhalb der Domain funktionsfähig.
  • Clients kommen per IPv4 und IPv6 NICHT über das Gateways in Internet (und auch nicht IC-VPN), Traceroutes bleiben auf dem Gateway hängen
  • IPv6 inbound zur publicV6 des clients oder Plasterouters bleibt am batman-gateway hängen
  • Andere Nodes/Clients am gleichen Gateway können alles nutzen.
  • Restart des Batmans am Plasterouter hilft, selbst bei Nutzung des gleichen gateways.
  • Das Problem tritt nur bei einigen supernodes auf (oder anders: Bei einigen schlicht nie…)

Und ja, das finde ich alles sehr mysteriös, insbesondere letzterer Punkt.
Es scheint so zu sein (spekulation), dass im batman-gateway irgendwelche Tabellen kaputtgehen und schlicht bis zum Reconnect so defekt bleiben bis der Node einmal aus dem Netz fällt und neu hineinkommt.

1 „Gefällt mir“

Auch auf die Gefahr dass es schon bekannt ist, hier bei uns ist seit heute morgen 7:30 Uhr die gesamte Freifunk Installation offline. Dass heißt richtig offline und nicht nur im Netmon, vorher liefen die AP aber waren im Netmon offline.

jetzt rollt ein fix 0.5.6.1 nicht wundern… :wink:

Also zumindest vormittags sah das gar nicht schlecht aus.

ca die haelfte meiner Router(welche tatsaechlich online sind) sind auch im Netmon wieder on, unabhaengig ob sie schon 0.5.6.1 oder noch 0.5.6 haben