Ich betreibe hier ein auf batman basierendes Roaming-Netzwerk. Wir gehören zur Community Potsdam.
Auf einem Router habe ich kürzlich zusätzlich einen verschlüsselten AP eingerichtet, der direkt an wan gebunden ist.
Seitdem erlebe ich merkwürdige Effekte, nämlich dass der Router nach einiger Zeit nicht mehr von anderswo im mesh-Netzwerk erreichbar ist bzw. Clients dieses Routers keine anderen Nodes erreichen können. Vom Router selbst lassen sich aber andere Nodes anpingen. Auch sind sie nach wie vor über OLSR/Nachbarn sichtbar.
Heute morgen war es wieder soweit, und da habe ich festgestellt, dass laut ifconfig kein Device bat0 vorhanden ist. Nach einem Neustart ist es wieder da. Aber das ist natürlich auf Dauer keine Lösung.
Hat jemand einen Tipp, woran das liegen könnte? Ich habe jetzt leider nicht geguckt, ob das Kernelmodul batman_adv noch geladen war. Gibt es noch andere Gründe, weshalb der Kernel melden könnte „no such device“?
naja, ich habe die Logs alle auf einem Logserver, aber wenn ich da nach bat0 greppe kriege ich nur Nachrichten dass ich die MTU auf 1532 erhöhen soll um die Performance zu verbessern (was ich jetzt getan habe) aber nicht a la link bat0 is down
@jro die Meldung das man die MTU auf dem batman IF erhöhen soll bringt in vielen Wifi Setups nur probleme, da dort die Pakete afaik meist mit1500 MTU gesendet werden, das bedeutet das die ganzen header da drauf passen müssen, in der Regel nimmt man daher eine geringere MTU.
Das macht auch nur performance selbst aus, sollte nichts mit „bat0 verschwindet über Nacht zu tun haben“ … um da ganz safe zu sein, würdeman eine MTU von 1280 einstellen, das das v6 rfc minimum.
sollte das an der MTU liegen , und du bekommst „kleine“ pakete durch, aber große dannnicht mehr, weil die unrettbar fragmentieren, würdest du das hier auch feststellen,
soweit meine erste Ideen
Heute morgen wieder dasselbe Spiel: Das Gerät bat0 ist verschwunden, wie ifconfig zeigt, wobei das Kernelmodul batman_adv nach wie vor geladen ist: batman_adv 118016 0
bin an einer Stelle weitergekommen: In der crontab steht für 6 Uhr morgens warum auch immer der Befehl „ifup wan“, und wenn man den ausführt verschwindet aus irgendeinem Grunde bat0.
Das ist (leider) normal, dass interfaces aus dem Batman herausfallen (oder der Batman ganz stirbt), wenn man an dort eingehängte Interfaces wackelt.
Wenn man vorhat, das regelmäßig zu tun, dann sollte man eine extra Bridge/vswitch ausgeben, also batman auf die bridge und da dann die „wackel-Interfaces“ einhängen. Ich finde die Diskussion dazu gerade nicht, aber wir hatten sie schon mehreren Threads. (früher gab’s dann auch mal kernel-panic deswegen. siehe Supernode-Thread)
(unter „wackel“ verstehe ich auch „zwangstrennung alle 24h“)
Ich glaube, die Ursachenforschung geht hier etwas in die falsche Richtung.
Ich tippe darauf, dass der WLAN-Chip einfach abgestürzt ist. Je mehr virtuelle SSIDs man auf den Chip schaltet, umso instabiler wird das ganze Zeugs.
Als Gegentest könntest du mal nur das Mesh-Netz und das private Netz aktiviert lassen, aber das Freifunk-Clientnetz vorübergehend deaktivieren. Dann wären es nämlich wieder nur zwei virtuelle SSIDs statt drei.
Ich sehe hier reproduzierbar das Verschinden von bat0 beim Aufruf von ifup wan (übrigens nicht bei ifup -w wan), WLAN geht nach wie vor, der private AP funktioniert nach wie vor. Das passt irgendwie nicht zu Deiner Theorie, oder?