das mag sein, aber warum tritt das nur in Domäne Ruhrgebiet auf und nicht in Domäne Rheinufer?
Ich dachte bisher FW-Version 0.5 von Ruhrgebiet ist die gleiche, wie die 2014.3-stable-1 von Rheinufer?
Zudem glaube ich, dass es auch bei 0.5 nicht von Anfang an war, sondern erst seit einiger Zeit. Irgendwass muss sich seitdem (im Backend?) verändert haben.
Ich hab das mal im sysctl.conf eingetragen und schaue nun mal, wie sich der router verhält. Und ich hatte gerade gespeichert und hatte vi wieder beendet, da fühlte sich das system unglaublich träge an. Es wurde immer schlimmer, und bevor ich schauen konnte, wie die RAM-Auslastung ist, hat das ding unter meinen Fingern rebootet.
wenn ich meine Router anpinge bekomme ich jetzt ein Hop Limit:
From 2a02:f98:0:25::2 icmp_seq=1 Time exceeded: Hop limit
From 2a02:f98:0:25::2 icmp_seq=2 Time exceeded: Hop limit
From 2a02:f98:0:25::2 icmp_seq=3 Time exceeded: Hop limit
Und das traceroute sieht auch ganz merkwürdig aus:
auch mein lokaler freifunk TP-Link TL-WDR4300 v1 Router, der ohne Probleme funktioniert, zeigt von Außen ein ähnliches Fehlerbild:
Ping:
PING 2a02:f98:0:26:ea94:f6ff:fecd:3248(2a02:f98:0:26:ea94:f6ff:fecd:3248) 56 data bytes
From 2a02:f98:0:25::2 icmp_seq=1 Time exceeded: Hop limit
From 2a02:f98:0:25::2 icmp_seq=2 Time exceeded: Hop limit
ganz stumpf erstmal apt-get update / upgrade auf allen Servern, um die jeweils jüngste Version aller Systemdienste zu bekommen
dann fastd auf allen Servern auf die v16 geupgraded
fastd Methodenliste umgestellt, so dass die Server untereinander das neuere umac benutzen, die Nodes weiterhin gmac da sie es noch nicht können (wird erst in der 2014.4 implementiert)
ein wenig aufgeräumt und Altlasten deinstalliert
…eben alles was man noch irgendwie machen konnte in der Hoffnung ein wenig das Netz zu entlasten / zu stabilisieren…
Dabei hat bb0 dann seine v6 Device Route auf br0 vergessen, deshalb ging kurz der v6 Traffic nicht durch. Die habe ich dann manuell wieder rein genommen, da mir gerade nicht der Sinn nach einem Neustart stand.
That’s all - performed zwar kurzfristig ganz ordentlich, aber noch lange keine Entwarnung für die Neighbour Overflow Fehler samt entsprechender Auswirkungen, erstmal nur ein wenig stabilisiert!
danke. Die Updates sollten ja „eigentlich“ keinen Einfluss haben. Aber mir scheint so als ob die Router nun ein wenig stabiler laufen.
Die Kernelparameter habe ich mal eingespielt.
Kurzzeitig wird der Router dann ein wenig träge aber er fängt sich.
Glaube ja nicht so ganz das es „nur“ an dem memory Leak liegt.
Problem tritt nu im Ruhrgebiet auf.
Das ist ja schon ein sehr alter Bug.
Ich bin ja mal gespannt ob hier noch jemand was rausbekommt.
Spannend ist das ganze ja schon ein wenig, wenn auch gleich sehr nervig … für alle Beteiligten.
Hoffe ja sehr, das wir etwas daraus lernen können!
Laut der Gluon Experten ist im fastd massiv viel für große Netze entwickelt worden und wir haben soeben von v12 auf v16 geupgraded, also doch schon einen deutlichen Sprung gemacht.
Hinzu kommt das wir im Ruhrgebiet ca. 370 Router laufen haben, was das gesamte Netz dann ohnehin sehr stark in Anspruch nimmt.
Der Memory Leak und die verursachenden Probleme des ipv6 sind wohl in der 2014.4 gefixt worden. Von Haus aus deutlich größere Neighbour Table und sonstige Veränderungen…
@CHRlS Wie gerade in #h#gluon geschrieben baue ich gerade einen neuen Satz Experimental-Images mit dem „umac“ aus dem 2014.4 gluon-master für ffruhr.
Mal gucken, wie die laufen. Melde mich.