Node Verbindung bricht nach Zeit x ab

Hallo Zusammen,

ich habe hier einen Node der immer nach einigen Stunden (zwichen 4 und 8 bis jetzt) die Verbindung verliert.

Hat jemand Tipps für eine Fehlersuche? Ich habe keinen Physikalischen Zugriff auf den Node. Ich lasse ihn immer vom Besitzer neustarten…

Wo sollte ich anfangen zu suchen?

Einige Infos wären erstmal nützlich. Also welche Firmware? Hat der Knoten einen Uplink? Um welches Gerät handelt es sich? usw.

Aber klar doch:

Es ist ein TP-Link TL-WR841N/ND v9,
Troisdorfer Stable FW … Tunnel über IPv6 an Unitymedia DS-Lite Anschluss.

Wir haben schon ohne ende ausprobiert. Über IPv4 läuft der Tunnel gar nicht. Über IPv6 mit MTU 1406 läuft er aber bricht halt nach einiger Zeit wieder weg.

An allen anderen Nodes mit der Selben FW und Selber Einstellung läuft alles Problemlos also würde ich einen FW Fehler ausschließen, Hardware auch schon getauscht also HW Fehler ebenfalls auszuschließen.

Ich tippe auf den Unitymedia Anschluss. Aber ich habe halt keine Ahnung wie genau ich jetzt Herausfinde was genau passiert wenn der Node abbricht.

Schade, dass es geheim ist, um welches Gerät es sich handelt.
So kann man nur spekulieren.

Aber eine Frage: Was bedeutet „Verbindung verlieren“?
(Das ist jetzt ganz im Ernst gemeint. Bitte präzise beantworten. Ansonsten besteht die Gefahr einer Antwort, die nicht weiterhilft.)

Gerät steht doch oben :wink:

Verbindung verloren heißt: fastd Verbindung bricht ab. Der node ist also nicht Mehr im mesh.

Ich weiß nicht genau wie ich das jetzt genau herausfinden kann wieso. Wie gesagt ich hab nur SSH Zugriff, da der node nicht bei mir zuhause steht.

Sehe ich nicht.
Magst Du es nochmal benenn oder wollen wir noch ein wenig Ping-Pong spielen?
Ich sehe da nur die Angabe des Modells und der Firmware.

Versuche doch mal, ob Du -wenn das Gerät „keine Verbindung“ hat- von einem anderen Node im Netz mit batctl p die Macadresse anpingen kannst.

@adorfer Was möchtest du denn erfahren wenn du nach dem Gerät fragst wenn nicht die Modellnummer :wink:

@stefan Versuch mal eine Firmware einer anderen Community

Mich würde interssieren um welches Gerät es geht. (Entweder Nodenamen und/oder MAC-Adresse oder IPv6, oder, oder)
Damit man mal schauen kann. Wobei ich gerade keinen Node in Wuppertal(?) im Zugriff habe, aber ggf. flashe ich mir halt einen.

Ich würde mal die Rheinufer Firmware probieren:

Gluon 2014.4-stable verfügbar

Wir haben heute ein kleines Update für 2014.4-Stable herausgegeben: 2014.4-stable-2

Die folgenden Änderungen sind drin:

  • Neue Supernodes in der Config
    - MTU des Fastd VPN wurde auf 1406 reduziert damit DS-Lite Zugänge zuverlässiger funktionieren.

Die neue Version ist über den Autoupdater und natürlich auf dem Image Server verfügbar.

http://images.freifunk-rheinland.net/images/gluon/rheinufer/latest/1

1 „Gefällt mir“

Wuppertal und Troisdorf sind verschieden.

Hallo,

da der Router selbst nach draußen nicht über fastd kommuniziert, müsste der Router eigentlich noch erreichbar sein, wenn du dir einen SSH-Tunnel einrichtest. Dann kannst du genau diagnostizieren, was passiert:

opkg update
opkg install screen
opkg install autossh
screen
autossh -R 20000:localhost:22 -N dyndns-deines-Rechners

Und dann die session mit Strg + a und dann d detachen. Natürlich muss dein Rechner dazu global erreichbar sein. (Der Vorteil von autossh liegt darin, dass es die Verbindung wieder aufbaut, sollte sie Mal abreißen.) Ich weiß allerdings gerade nicht, ob das ohne pubkey funktioniert (also nur mit Passwortanmeldung). Sonst das halt auch noch kurz einrichten.

Dann warten, bis er das nächste Mal rausfliegt.

Solange du das Gerät nicht rebootest, solltest du dann darauf Zugriff haben. Und dann mal mit dmesg oder im Logfile gucken, wo es hängt.

ssh -p 20000 localhost

(von deinem Rechner aus.)

Grüße
MPW

2 „Gefällt mir“

Danke
Wollte ich testen… Habe vergessen IPv6 DNS Server zu hinterlegen. Kann mir jemand sagen wie ich das per SSH mache?

Sorry da haben wir wohl aneinander vorbei geredet. Momentan ist er eh offline.

Äh, ich verstehe gerade die Frage nicht. Hast du denn auch einen ipv6-Anschluss? Du musst deinen eigenen Router per DynDNS erreichbar machen. Nicht den, wo der Router steht. (Also das geht natürlich auch, aber das erfordert Eingriffe in den Router, das würde ich demjenigen nicht zumuten.)

Ne ich hab eher das Problem das der Router kein DNS hinterlegt hat.

Downloading http://openwrt.draic.info/barrier_breaker/14.07/ar71xx/generic/packages/base/Packages.gz.
wget: bad address 'openwrt.draic.info'

Achsooo. Im Zweifel die 8.8.8.8 in die /etc/resolv.conf.

So ich hab jetzt mal ein wenig aus dem Logfile holen können…

Nachdem der Router eingeschaltet wird baut er ganz normal eine fastd Verbindung auf…

Irgendwann … Ich denke nach einer Zwangstrennung… Versucht er erneut eine Verbindung herzustellen und dann kommt das:

Wed Jan 21 13:04:59 2015 daemon.info fastd[1125]: resolving host `gateway1.freifunk-troisdorf.de' failed: Name or service not known
Wed Jan 21 13:05:00 2015 daemon.info fastd[1125]: resolving host `gateway1.freifunk-troisdorf.de' for peer <mesh_vpn_backbone_peer_gateway1>...
Wed Jan 21 13:05:08 2015 daemon.info fastd[1125]: resolving host `wupper1v6.freifunk-troisdorf.de' for peer <mesh_vpn_backbone_peer_wupper1v6>...
Wed Jan 21 13:05:08 2015 daemon.info fastd[1125]: resolving host `wupper1v6.freifunk-troisdorf.de' failed: Name or service not known
Wed Jan 21 13:05:12 2015 authpriv.info dropbear[24788]: Child connection from 10.188.0.20:58176
Wed Jan 21 13:05:13 2015 daemon.info dnsmasq[1034]: reading /var/gluon/wan-dnsmasq/resolv.conf
Wed Jan 21 13:05:13 2015 daemon.info dnsmasq[1034]: using nameserver 2001:4860:4860::8888#53
Wed Jan 21 13:05:18 2015 daemon.info fastd[1125]: resolving host `gateway1.freifunk-troisdorf.de' for peer <mesh_vpn_backbone_peer_gateway1>...
Wed Jan 21 13:05:18 2015 daemon.info fastd[1125]: resolving host `gateway1.freifunk-troisdorf.de' failed: Name or service not known

Wieso schafft er es dann auf einmal nicht mehr den Hostname aufzulösen?

Wann hast du denn Zwangstrennung ?

Nicht mein Router… Log ist auch nicht von direkt danach!

Habt ihr das hier weiter verfolgt? Habe ein ähnliches Problem und will das Rezept hier mal versuchen.

Wo ich übrigens ein bisschen aufgehalten wurde: das ssh auf den Knoten versteht nicht alles. Ich musste mit dien Key vor Ort so erzeugen:

dropbearkey -t rsa -f ~/.ssh/id_rsa

Wir haben noch keine Lösung für das Problem gefunden. Es tritt aber nur an den Technicolor Routern von Unitymedia auf.

Unsere (Temporäre) Lösung: Automatischer reboot des Routers wenn die Netzwerkverbindung weg ist per Cron Script

Ist nicht schön die Lösung aber hilft erstmal sehr gut