Fast alle Zugangspunkte down?

Ich bin (meiner Meinung nach) angemessen schockiert: Laut Karte sind angeblich alle Zugangspunkte in Aachen offline, was aber bei den mir zugänglichen Routern definitiv nicht der Realität entspricht. Das ist ein schweres PR-Disaster, denn wenn wir hier in der Städteregion
Aachen zu Freifunk einladen, wollen die zukünftigen Freifunker ja auch mal schauen, wo es denn schon überall Freifunk gibt. Ein Haufen grauer Kreise ist da wenig hilfreich, eher sogar kontraproduktiv. Insbesondere wenn er nicht der Realität entspricht.

Ich wiederhole mich daher gerne: Wenn wir helfen können oder zumindest Hilfe organisieren können, dann sagt bitte Bescheid. Die Arbeit muss scheinbar auf eine größere Anzahl Schultern verteilt werden.

2 „Gefällt mir“

Mir hat man gestern erklärt, dass das Problem mit den wegbrechenden Nodes in der ffmap weitgehend lösen könne, indem man nur mit einem einzigen alfred-master (statt 2 oder gar 4) arbeiten würde, weil bei „vielen Nodes“ (100 aufwärts…) die Synchronisation zwischen mehreren alfred-mastern nicht mehr sichergestellt sei und dann die Abfrage eines einzigen Masters nicht mehr alle Nodes liefern würde, selbst wenn das Netz „eigentlich“ noch voll funktionsfähig ist.

Das klingt doch sehr gut.

Alfred ist doch auch keine für den Betrieb des Netzes kritische Komponente, beim Ausfall gibt es schlicht kein Monitoring. Ist das korrekt?

Ich kann auch im Anschluss gerne helfen dem einzelnen Alfred Server einen weiteren zur Seite zu stellen der per HA Skript beim Ausfall des primären aktiviert wird und dann wiederum als einzelner Alfred Knoten arbeitet.

Alfred ist zumindest im backend nicht das Problem, dort haben wir nur einen Alfred-Master.
Wenn allerdings irgendwer noch einen Alfred-Master betreibt kann das Probleme verursachen.
Alternativ können Nodedaten auch direkt mittels Multicast bezogen werden, allerdings hab ich das noch nicht so ganz am laufen. Mit Unicast geht es schon prima:

1 „Gefällt mir“

Zumindest sah das für mich (ruhr) nach 4 mastern aus:

root@nadeshda:/tmp# tcpdump -i br-client -n udp port 16962
tcpdump: WARNING: br-client: no IPv4 address assigned
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on br-client, link-type EN10MB (Ethernet), capture size 65535 bytes
01:58:13.718131 IP6 fe80::2877:1fff:fee4:9d79.16962 > ff02::1.16962: UDP, length 4
01:58:13.727664 IP6 fe80::98ec:26ff:fe2e:3113.16962 > ff02::1.16962: UDP, length 4
01:58:13.758791 IP6 fe80::200c:44ff:fe94:55c7.16962 > ff02::1.16962: UDP, length 4
01:58:13.971937 IP6 fe80::50d0:18ff:fe2a:9726.16962 > ff02::1.16962: UDP, length 4
01:58:23.721201 IP6 fe80::2877:1fff:fee4:9d79.16962 > ff02::1.16962: UDP, length 4
01:58:23.741275 IP6 fe80::98ec:26ff:fe2e:3113.16962 > ff02::1.16962: UDP, length 4
01:58:23.767767 IP6 fe80::200c:44ff:fe94:55c7.16962 > ff02::1.16962: UDP, length 4
01:58:23.897163 IP6 fe80::50d0:18ff:fe2a:9726.16962 > ff02::1.16962: UDP, length 4
01:58:33.718011 IP6 fe80::2877:1fff:fee4:9d79.16962 > ff02::1.16962: UDP, length 4
01:58:33.743453 IP6 fe80::98ec:26ff:fe2e:3113.16962 > ff02::1.16962: UDP, length 4

Solche Probleme habe ich vor kurzem - unbeabsichtigt - provoziert. Habe auf einer Linuxkiste FASTD + BATMAN aufgesetzt und ALFRED irrtümlicher Weise im Master-Mode gestartet… Die Folge: Nur noch wenige Nodes wurden als Online angezeigt. Nachdem ich zur Schadensbegrenzung alles abgeschaltet habe, war KEIN Client mehr als Online auf der Map. Das ganze hat sich nach ~15 Minuten wieder erholt und die normale Situation war wieder hergestellt.

An sich ist die Map so jedoch m.E. viel zu leicht zu sabotieren. Langfristig wird das in der Form zu Problemen führen.

3 „Gefällt mir“

Also in Rheinufer bekomme ich da mehrere Ergebnisse, evtl hat jemand zuhause noch einen Alfred Master laufen oder via VM.

Was mich wunder ist das diese Probleme im Ruhrgebiet ja nicht auftreten wobei dort ja anscheinend mehrere Master laufen. Ich denke aber mal das es weniger ein Problem ist wenn diese auf den Supernodes laufen als auf einzelnen Nodes bzw Maschinen hinter einzelnen Nodes.

Mein Experiment fand im Ruhrgebiet statt. Ich vermute es führt zu Problemen, wenn neue Master hinzukommen / verschwinden. Der dauerhafte Parallelbetrieb schein irgendwie zu funktionieren.

Doch, da wackelt die Map auch regelmäßig. Nur in anderem Takt als im Rheinufer…
Frage mal @Enrique

Zur Zeit bzw. seit mehreren Stunden werden Kosmos und Cafeé Faber nicht angezeigt. Ich kann Kosmos anpingen, Cafeé Faber ist komplett raus - wenn ich hinginge und es vor Ort überprüfen würde, wäre das Cafeé sicher im Netz.
Im Nadeshda ist Kosmos drin. Einzig Tenemosecreto ist tatsächlich mal wieder rausgekippt.
Das Netz hier ist auf jeden Fall enger gewebt, als es angezeigt wird.
http://www.nadeshda.org/ff/gelsenwolke.html

Gerade wenn man Nodes hat, die „eher wackelig“ per Wifi vermesht sind (ohne vpn), mag man ja gern mal schauen, ob das denn noch läuft.
Von daher wäre eine zuverlässige Liste (wie aus dem Alfred) wirklich eine Arbeitsgrundlage, um seine Herde zu gärtnern…

1 „Gefällt mir“

So isset. Ohne verlässliche Werkzeuge ist Ärger und Zusatz-Arbeit einfach vorprogrammiert.
Heute bekam ich eine Klage, die ich als positive Rückmeldung sehe - Kunden eines Händlers, bei dem ich eher nicht Internet-Affine vermutete, fanden es SCHADE dass es gerade nicht mit dem Internet Zugang klappte. Wäre ne klasse Geschichte, im Laden mal schnell die mails checken zu können.
Yoo… den Dank reiche ich mal durch an alle, die das ermöglichen.

2 „Gefällt mir“

Gerade noch mal überprüft: Router die nirgendwo erscheinen, wie z.B. Cafeé Faber, haben schnellen Internetzugriff.
Zur Zeit fehlen im Alfredo 10 Knoten.

Die Ampel ist wieder da …

Das Problem ist weiterhin unvermindert vorhanden. Finde ich super ärgerlich da ich im Moment dabei bin etliche Geräte auszuliefern.

Gibt es eine Stelle an der ich sinnvoll helfen kann?

Zumindest in Sachen Nagios, cacti, etc bin ich ausreichend fit, so viel anders kann das ja auch nicht sein :wink:

2 „Gefällt mir“

Wir brauchen einen Work-Around, wenn es keine Sofort- Lösung gibt. Dringend.

Wie?
Wer?
Bis allerspätestens wann?
Was kann ich beitragen?
Wen braucht man unbedingt zur Unterstützung?

Das geht so einfach nicht. Das muss doch jedem klar sein, dass das ein Prio 1 Problem ist.

Das zertrümmert jede Anstrengung die Idee zu vermitteln. In dem Zustand ist jeder Versuch jemanden zu überzeugen ein Eigentor: „Das tut doch die meiste Zeit eh nicht“. So jemand ist erst dann mal verbrantte Erde. Egal ob das stimmt was die Liste da anzeigt. Das steht da so in der Liste, also wird das so gesehen.

Was machen wir? JETZT!

1 „Gefällt mir“

Entfernt doch einfach das Feld aus der Tabelle? Die Map ist kein Indikator für den Online-Status.
Das Problem lässt sich nicht zeitnah lösen da es mit der Funktionsweise von Alfred zu tun hat.

Was die „Ampel“ angeht so kann ich bestätigen das es zumindest die letzten 2-3 Tage Probleme gab:

Up	Cyrus-Foxden01	20-11-2014 01:03:26	OK	9 hrs, 48 mins
Down	Cyrus-Foxden01	20-11-2014 00:45:34	---	0 hrs, 17 mins
Up	Cyrus-Foxden01	19-11-2014 00:11:10	OK	24 hrs, 34 mins
Down	Cyrus-Foxden01	18-11-2014 23:21:10	---	0 hrs, 50 mins
Up	Cyrus-Foxden01	18-11-2014 01:55:37	OK	21 hrs, 25 mins
Down	Cyrus-Foxden01	18-11-2014 01:51:05	---	0 hrs, 4 mins
Up	Cyrus-Foxden01	17-11-2014 23:34:25	OK	2 hrs, 16 mins
Down	Cyrus-Foxden01	17-11-2014 23:30:02	---	0 hrs, 4 mins
Up	Cyrus-Foxden01	17-11-2014 22:56:07	OK	0 hrs, 33 mins
Down	Cyrus-Foxden01	17-11-2014 22:45:52	---	0 hrs, 10 mins
Up	Cyrus-Foxden01	17-11-2014 22:40:31	OK	0 hrs, 5 mins
Down	Cyrus-Foxden01	17-11-2014 22:29:32	---	0 hrs, 10 mins
Up	Cyrus-Foxden01	17-11-2014 20:57:19	OK	1 hrs, 32 mins
Down	Cyrus-Foxden01	17-11-2014 20:52:43	---	0 hrs, 4 mins

Okay, das Problem ist also systematischer Natur und man muss sich selber einarbeiten um helfen zu dürfen

Man müsste also eine semi statische Tabelle für die außen Kommunikation nur mit Name, Geo und Firmware machen.

Dazu eine Tabelle die weniger prominent verlinkt ist, quasi für den internen Gebrauch. Oben drüber dann aber dick:

Diese Tabelle ist im experimentellen beta Stadium!
Sie stellt häufig nicht den tatsächlichen Netzstatus dar!

1 „Gefällt mir“

Mir ist es lieber, wenn die Stabilität des Netzes verbessert und Bugs in Gluon gefixt werden, statt permanent an irgendwelchen Karten rumzuhampeln (die eh bald ausgemustert werden, sodass was neues, besseres und hoffentlich mit weniger Bugs kommt). Das ist also nicht für jeden ein „Prio 1 Problem“.

Ein einfacher, wenn auch aufwendiger Workaround wäre ein manuelles Pflegen einer solchen Liste bzw. Karte. Das kann man z.B. gut mit http://share.mapbbcode.org/ auch als Laie machen. Wer programmieren kann kann ja die Geodaten aus der Rheinland-Liste ziehen, und die automatisch auf eine OpenStreetMap-Karte setzen. Mit Leaflet geht das ganz fix eigentlich.