Änderungen im Netz - Stabilität

Mojn zusammen,

Laut Forum habe Ich nu alle Posts während meines aurlaubs durch - aber nichts dazu gefunden.

A) gabe es vor ~ einer Woche größere Metzwerkumstellungen ? Da war bei uns im Monitoring ne Weile permantes off/on…
B) unser Monitoring wirft seit dem ca. 2x mal Tag einen „alle nodes offline“ während die Refemzen (heise, google, …) sauber durchlaufen. Das gab es so in der Form früher so gut wie nie. Ursachen ? Pläne ?

Danke.

LG
Ralf

1 „Gefällt mir“

Hallo Ralf,

schön das du wieder hier bist :smile:

Es gab vor 5 Tagen massive Probleme in der Domain Ruhrgebiet. Eine der effekte war das Router direkt nach dem Booten wieder gecrashed sind.

@Chris hat erst einmal die Supernodes geupdated usw.

Weiterhin ist angeraten worden einige Änderungen an der aktuellen Router Konfiguration durchzuführen.

Daraufhin ist eine neue Beta Firmware fürs Ruhrgebiet erschienen. Diese wird aber nicht per Autoupdate eingespielt.

Die neue Beta Firmware erhältst du hier:
https://forum.freifunk.net/t/gluon-v2014-3-1-firmware-0-5-1-beta-1

ich kann auch die Firmware von @adorfer empfehlen. Diese läuft bei mir seitdem mehr oder weniger gut. Ein 841 Bootet so alle 11h. Eine Picostation hat >48 Uptime.

http://images.freifunk-rheinland.net/images/gluon/rheinufer/beta/

Weiterhin unterstützen die Supernodes jetzt die Verschlüsselung salsa2012+umac
Was eine deutlichen Performance Gewinn auf der FastD Strecke gibt und natürlich die Router entlastet. Andreas seine FW unterstützt den Cipher.

Das sollte erst einmal alle wichtigen Informationen kurz zusammenfassen.
Ansonsten musste dich wohl selbst durch diesen Fred Kämpfen.

https://forum.freifunk.net/t/standige-neustarts-in-der-domane-ruhrgebiet

Gruß
Thomas

P.S. Nach den Änderungen und FW Updates ist das Netz zumindest so performant das sogar mehrfache Youtube Streams über einen Router gehen (ohne Ruckeln). Heute Abend ruckelt es wohl wieder ein wenig. Möglicherweise sind aber Wartungsarbeiten an Supernodes 0 und 1 dran schuld. Wir werden sehen.

Link dahin:
Ruhrgebiet:
http://www.nadeshda.org/ff/gluon-ruhr/sysupgrade/

Rheinufer:
http://www.nadeshda.org/ff/gluon-rheinufer/sysupgrade/
(Wobei die Rheinufer-Supernodes leider „umac“ noch nicht akiviert haben, da ist noch gmac angesagt, d.h. Schwerstarbeit für die Nanostations…)

bis auf die site.conf sind (andere fastd-adressen, keys und ip-range) sind die beiden identisch gebaut. „Am Rheinufer“ halten die durch, im Ruhrgebiet (auf den gleichen Routern) nicht. Da reicht wohl bei den 32MB-Modellen das Ram für $WASAUCHIMMER nicht. Panic->Watchdog->Reboot…

Ich vermute das es damit zu tun hat ob der router über WLAN an einem anderen Knoten hängt oder selbst ein VPN Aufbaut.

Die Picostation bei mir rennt eigentlich erst seitdem ich das Uplink Kabel gezogen habe.

Danke für die Hinweise/updates.

Das ist bei uns nicht machbar.
Wir können alle paar Monate ein manuelles Update realisieren oder ne Sonderkonfig.

Aber so werden weder wir das Kapazitätsmäßig hinbekommen , noch haben die Standortspender da Lust drauf.

Wir brauchen also schon was, das per Autoupdate das Problem behebt.

Solange müssen wir mit den 2-3x täglich Amok laufenden o.5er Plasterouter wohl leben…

Ach Ralf, wenn ich mir den Alfred für KK anschaue, sieht doch alles super aus.
Nur drei Router mit einer Uptime <10h und viele mit einer Uptime >100h.

Ich würde mir da aktuell keine große Sorgen machen.
Selbst der Marktgrill ist >100h up.

Man könnte hächstens wegen dem besseren Uplink überlegen…

Gruß
Thomas

Mittlerweile gibt es auch wieder sehr viele „kleine“ Router mit ordentlich hoher Uptime, ein generelles Reboot Problem gibt es also auch ohne Firmware Update nicht mehr.

Ich beginne morgen damit 2 neue Supernodes beim IN-Berlin in Betrieb zu nehmen, das sollte dann die Performance noch weiter stabilisieren.

Roger, da warten wir die neuen Server mal ab.

Kleiner Hinweis noch: der Thread ist bewusst nicht „mein Router startet neu“ sondern „Stabilität“.

Das scheint sich ja in 2 Subthemen zu gliedern:

  • manche Router starten häufiger als gewollt neu
  • bei vielen scheinen die Routen immer mal kurz wegzufliegen. Letzteres lässt sich nicht mit Alfred/Uptime qualifizieren

Beide Effekte haben aber zeitgleich begonnen.
Das Neubooten scheint deutlich reduziert.

Hallo Ralf,

ich denke ein zweiter Punkt könnte gerade in das neue Technikthema von mir gehen.
Mir ist aufgefallen das Teilweise Router zwar im Batman „verfügbar“ sind aber nicht erreicht werden können.

Das finde ich merkwürdig.

Gruß
Thomas

Hi Chris,

neue Supernodes finde ich ja prinzipiell gut.
Nur frage ich mich wie es dazu kommt?
Ist das eine kurzfristige Aktion die im zusammenhang mit den Problemen der letzte Zeit steht?

Inzwischen muss der Verein ja immer mehr „Hardware“ Finanzieren. Ich hoffe mal der Vorstand und Schatzmeister haben da ein Auge drauf :smiley:

Gruß
Thomas

Das Ruhrgebiet läuft bis auf ffrg2/3 ausschließlich auf privaten Ressourcen von Philip (@pberndro) und mir, die weder vom Verein bezahlt wurden / werden, noch sonst ein Ausgleich in welcher Form auch immer dagegen steht, als da wären:

Server „ffrg0“ < Supernode, liegt bei mir in Oberhausen im RZ
Server „ffrg1“ < Supernode, liegt bei mir in Oberhausen im RZ
Server „bb0“ < Exit Gateway ins Internet, liegt beim Phil in Köln im RZ
Server „dns“ < DNS Server, liegt bei mir in Oberhausen im RZ
Server „ticket“ < ffrl Ticketsystem, liegt beim Phil in Köln im RZ
Server „register“ < Webserver für die Maps vom Ruhrgebiet und Verein, Firmware Images, Fastd Registrierung, etc, liegt bei mir in Oberhausen im RZ

„Teilprivate“ Server wie den Webserver/Mailserver „freifunk-ruhrgebiet.de“, den Server „apps“ etc. hosten wir nebenher auch noch auf eigenen Ressourcen…

Wir haben das nie an die große Glocke gehangen, da wir nicht „glänzen müssen“, aber bevor Gerüchte entstehen, wollte ich das mal kurz beiläufig zur Kenntnis geben. :wink:

5 „Gefällt mir“

Ich kann die Verbindungsabbrüche nun derweil auch für 2 Nodes „von Innen“ bestätigen.

Einer testhalber gestern Abend, der andere heute tagsüber mal als Zugang für mein Firmen-VPN. Es scheint also bei diesen Knoten nicht nur ein ICMP Problem von Außen zu geben, sondern wirklich die Route ins Imternet mehrfach täglich kurz wegzubrechen.

Bei mir war es anders. Uptimerobot hat in den letzten Tagen 2x ne kurze Unerreichbarkeit meines Nodes in Ruhrgebiet gemeldet.
Die ssh mit dem „logread -f“, die ich auf meinem Rechner im Rheinufer laufen hatte, wurde nicht unterbrochen.

Oder gibts vom Rheinufer nen Shortcut zu den Nodes im Ruhrgebiet?

Wenn dann nur noch über IPv6, da Rheinufer IPv6 noch über bb0 routet…

ja die Router kann man ja auch nur über IPv6 erreichen, also liegt es daran.

Du hast mich angehängt… Was liegt woran ?

Ich sehe:
Uptimerobot meldet Ausfälle auf IPv6 von Außen - was aber nicht am uptimerobot liegt, da dies nur für einige Geräte insb. aber nie für die Referenzen wie google auf V6 zutrifft.
Zeitgleich von internen Netzabbrüche , hier allerdings V4.

Oder meintest du, dass deine Verbindung stabil bleibt weil IPv6zuV6 FF-intern ?
Sprich: Problem ist uplink ?

Wir hatten durch einen falsch geflashten Plasterouter 3 fremde Supernodes im Netz, die den gesamten Traffic durcheinander gebracht haben.

de:ad:be:ef:43:05 ( 79) c6:6e:1f:64:30:aa [      tap0]: 119 - 1024MBit/1024MBit
de:ad:be:ef:43:04 ( 66) c6:6e:1f:64:30:aa [      tap0]: 215 - 96MBit/96MBit
de:ad:be:ef:43:02 ( 70) c6:6e:1f:64:30:aa [      tap0]: 119 - 1024MBit/1024MBit

Eingeschleppt vom Router

FF-Gemen_01

der ursprünglich in Münster im Netz war…

**petz™

2 „Gefällt mir“

Hi Chris,

das ist ja

  1. Übel
  2. Kommt bei mir die Frage auf, was macht einen Supernode zum Supernode?

Aber wenn mehrere Geräte im Netz sind, die sagen: „Hallo ich nehme deine Pakete“ :smile: … dann ist es doof.

a) Wenn ich von außen den Router erreichen will, geht das nur über IPv6, denn er hat keine öffentliche IPv4-Adresse.
b) Wenn ich mit einem Client in Rheinufer an einen Node in Ruhrgebiet gehe, geschieht das auch über IPv6 und da das über bb0 geroutet wird, ist es „nicht von außen“. Das erklärt, warum der Router für meinen Client erreichbar sein kann, wenn Uptimerobot eine Unerreichbarkeit meldet.

1 „Gefällt mir“

Ein Gateway (bei uns supernode genannt) macht ein einziger batctl Eintrag vom normalen Server zum Gateway.

Noch übler ist dass die Metrik durch manuelle Angabe der Bandbreite beeinflussbar ist.

1 „Gefällt mir“