Ich versuche mich jetzt mal an einer Zusammenfassung.
Topologie und Ausgangslage
Ich betreibe gegenwärtig drei Router in meiner Wohnung. Einer davon ist Uplink (FF-MH-Ruhrpromenade-01), alle drei können sich gut „sehen“. Sie sind daher in einem Dreieck vermascht. FF-MH-Ruhrpromenade-03 steht auf dem Balkon um Freifunk nach draussen zu bringen. Alle Router sind identisch konfiguriert. Es handelt sich um nagelneue 841er der Version 9, lediglich der Balkonrouter hat abnehmbare Antennen und trägt die Hardware-Versionsnummer 9.1. Installiert ist gluon-ffrg-0.5-tp-link-tl-wr841n-nd-v9.bin.
Ausfall von FF-MH-Ruhrpromenade-03
Aus heiterem Himmel ist nun der Router FF-MH-Ruhrpromenade-03 ausgefallen. Das kann passieren, sollte aber nicht zu häufig vorkommen. Daraufhin habe ich mal in die Runde gefragt, ob es Logs gibt, und wie so überwacht wird. Vielen Dank für die Antworten. Strom aus - Strom an und der Router war wieder da.
Versuch einer Analyse
Zunächst habe ich direkt den Uptime-Robot auf meine Router gehetzt. Erstmal ausschließlich per Ping. Seitdem werden sie alle im wesentlichen „grün“ angezeigt.
Größere Version des Bildes
Ausserdem habe ich versucht, Syslog dahingehend zu aktivieren, dass die Meldungen auf einen Server im Internet geschrieben werden. Es is jedoch diesbezüglich beim Versuch geblieben.
Einzig auffällig: der Router 03 (draussen) zeigt Log-Meldungen, die auf den anderen Routern nicht auftreten. Ich lese die Meldungen so, dass es da wohl eine DNS-Problem gibt. Mit dem Ausfall des Supernodes ffrg1 hat das sicherlich nichts zu tun. Diese Meldungen werden für alle vier Supernodes generiert. (Bild unten rechts)
Nov 17 08:07:51 FF-MH-Ruhrpromenade-03 daemon.info fastd[1549]: resolving host `ffrg3.freifunk-ruhrgebiet.de' for peer <mesh_vpn_backbone_peer_ruhrgebiet3>...
Größere Version des linken Bildes (logread von FF-MH-Ruhrpromenade-02)
Größere Version des rechten Bildes (logread von FF-MH-Ruhrpromenade-03)
Gleichzeitig war der Router 03 einige Zeit in Alfred nicht zu sehen, obwohl ich ihn weiterhin per SSH aus dem Internet (sic!) erreichen konnte. (Zur Erinnerung: dieser Router nicht direkt mit dem Internet verbunden). Zur gleichen Zeit war es nicht möglich über diesen Router per Freifunk-WLAN ins Internet zu kommen (es gab nicht einmal eine IP-Adresse).
Zusammenfassung
Auf dem Ausfall des Balkonrouters möchte ich gar nicht herumreiten. sowas kann passieren, es ist günstige Consumerhardware. Abgesehen davon scheint es dennoch ein Problem mit dem Netzwerk zwischen den Routern zu geben. Der von mir beobachtete Fehler passt recht gut zu Beschreibungen von @Enrique, wo ja auch hin und wieder Geräte aus Alfred verschwinden, obwohl sein Robot sie „up“ sieht.
Leider habe ich die Konstruktion der Interface auf dem Router noch nicht völlig durchblickt. Auch wie das Routing da funktioniert ist mir noch unklar. Dehalb tue ich mich mit der Fehlersuche etwas schwer.
Syslog einzurichten ist mir nicht gelungen. ich habe per UCI die Server-IP-Adresse und einen Prefix konfiguriert, mal IPv4, mal IPv6, auch committet, sogar neu gestartet, aber es kam nichts auf dem Server (im Internet wie auch im lokalen Netz) an. Möglicherweise ist noch etwas mit der Firewall freizuschalten oder Routen anzupassen.
Meine Takliste sieht folglich so aus (Reihenfolge zufällig):
- Klärung wie Interface und Routing auf den Knoten funktionieren und wie der Status zu kontrollieren ist
- Prüfen, wieso der eine Router offenbar ein DNS-Erreichbarkeitsproblem hat
- Syslog einrichten. Dazu schauen, ob auf der Firewall noch etwas zu tun ist.
Bis ich da weiter bin, werde ich darauf verzichten neue Router aufzustellen. Nicht weil ich an dem Projekt zweifele, sondern um mir Gelegenheit zu geben sicherer im Umgang mit der Konstruktion zu werden. Es arbeitet sich meiner Erfahrung nach entspannter, wenn man weiß was man tut und womit man es zu tun hat.
Gruß
Andreas