Bei "ifup wan" verschwindet device bat0

Ich betreibe hier ein auf batman basierendes Roaming-Netzwerk. Wir gehören zur Community Potsdam.

Auf einem Router habe ich kürzlich zusätzlich einen verschlüsselten AP eingerichtet, der direkt an wan gebunden ist.

Seitdem erlebe ich merkwürdige Effekte, nämlich dass der Router nach einiger Zeit nicht mehr von anderswo im mesh-Netzwerk erreichbar ist bzw. Clients dieses Routers keine anderen Nodes erreichen können. Vom Router selbst lassen sich aber andere Nodes anpingen. Auch sind sie nach wie vor über OLSR/Nachbarn sichtbar.

Heute morgen war es wieder soweit, und da habe ich festgestellt, dass laut ifconfig kein Device bat0 vorhanden ist. Nach einem Neustart ist es wieder da. Aber das ist natürlich auf Dauer keine Lösung.

Hat jemand einen Tipp, woran das liegen könnte? Ich habe jetzt leider nicht geguckt, ob das Kernelmodul batman_adv noch geladen war. Gibt es noch andere Gründe, weshalb der Kernel melden könnte „no such device“?

Die Ausgabe von logread wäre da evtl. hilfreich, wenn das noch mal auftritt.

naja, ich habe die Logs alle auf einem Logserver, aber wenn ich da nach bat0 greppe kriege ich nur Nachrichten dass ich die MTU auf 1532 erhöhen soll um die Performance zu verbessern (was ich jetzt getan habe) aber nicht a la link bat0 is down

@jro die Meldung das man die MTU auf dem batman IF erhöhen soll bringt in vielen Wifi Setups nur probleme, da dort die Pakete afaik meist mit1500 MTU gesendet werden, das bedeutet das die ganzen header da drauf passen müssen, in der Regel nimmt man daher eine geringere MTU.
Das macht auch nur performance selbst aus, sollte nichts mit „bat0 verschwindet über Nacht zu tun haben“ … um da ganz safe zu sein, würdeman eine MTU von 1280 einstellen, das das v6 rfc minimum.

sollte das an der MTU liegen , und du bekommst „kleine“ pakete durch, aber große dannnicht mehr, weil die unrettbar fragmentieren, würdest du das hier auch feststellen,
soweit meine erste Ideen

Damit wäre der Thread jetzt auf „MTU-Diskussion“ derailed.

Heute morgen wieder dasselbe Spiel: Das Gerät bat0 ist verschwunden, wie ifconfig zeigt, wobei das Kernelmodul batman_adv nach wie vor geladen ist: batman_adv 118016 0

Hier ist das Log von Mitternacht bis heute morgen: https://gist.github.com/vasyugan/6e47a890f196f0391a0f5166203d58c5

bin an einer Stelle weitergekommen: In der crontab steht für 6 Uhr morgens warum auch immer der Befehl „ifup wan“, und wenn man den ausführt verschwindet aus irgendeinem Grunde bat0.

Kann sich da jemand einen Reim drauf machen?

Das ist (leider) normal, dass interfaces aus dem Batman herausfallen (oder der Batman ganz stirbt), wenn man an dort eingehängte Interfaces wackelt.
Wenn man vorhat, das regelmäßig zu tun, dann sollte man eine extra Bridge/vswitch ausgeben, also batman auf die bridge und da dann die „wackel-Interfaces“ einhängen. Ich finde die Diskussion dazu gerade nicht, aber wir hatten sie schon mehreren Threads. (früher gab’s dann auch mal kernel-panic deswegen. siehe Supernode-Thread)
(unter „wackel“ verstehe ich auch „zwangstrennung alle 24h“)

1 Like

Ich glaube, die Ursachenforschung geht hier etwas in die falsche Richtung.

Ich tippe darauf, dass der WLAN-Chip einfach abgestürzt ist. Je mehr virtuelle SSIDs man auf den Chip schaltet, umso instabiler wird das ganze Zeugs.

Als Gegentest könntest du mal nur das Mesh-Netz und das private Netz aktiviert lassen, aber das Freifunk-Clientnetz vorübergehend deaktivieren. Dann wären es nämlich wieder nur zwei virtuelle SSIDs statt drei.

1 Like

Ich sehe hier reproduzierbar das Verschinden von bat0 beim Aufruf von ifup wan (übrigens nicht bei ifup -w wan), WLAN geht nach wie vor, der private AP funktioniert nach wie vor. Das passt irgendwie nicht zu Deiner Theorie, oder?

1 Like

Nicht so richtig, stimmt.

Hast du den ganzen Router mal neu mit der aktuellsten Firmware ohne Übernahme der Konfiguration gefläscht?