Störung IPv4 02-09.12.2014

Nicht zwingen, wir hatten hier des öfteren Geräte die mal direkt zweimal hintereinander neu gestartet haben, mehr kam aber an sich nicht vor.

Ich spreche hier aber von einer ziemlich homogenen Umgebung mit ausschließlich D-Link DIR 825 rev. B1 und TP-Link TL-WDR4900 v1. Davon aber recht viele.

Für andere Umgebungen und Geräte muss man erst eine Weile das Logfile beobachten.

Apropos: Gibt’s da ein Gluon für? wenn ja welches? Denn das ist so für mich der andere Kandidat neben 1043v2, wenn es um fastd-Leistung geht.

Aber es bahnt sich gerade der nächste Kandidat an, dem ich hoffentlich gleich mal auf den Zahn fühlen kann. Ein Router, der nur aus Teilen des Netztes erreichbar (pingbar) ist…

Das Problem ist wieder vorhanden, mir sind noch weitere IPs die nicht erreichbar sind aufgefallen. Beispielsweise Sipgate:

tracepath sipgate.de
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 59.114ms
1: 10.40.228.1 56.734ms
2: 100.64.0.16 240.355ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 144.436ms asymm 4
4: c13-1.netzquadrat.net 67.762ms asymm 5
5: no reply

Erneut die RWTH
tracepath www.rwth-aachen.de
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 38.898ms
1: 10.40.228.1 40.491ms
2: 100.64.0.16 48.948ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 48.202ms asymm 4
4: no reply

tracepath a23-65-181-73.deploy.static.akamaitechnologies.com 1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 39.109ms
1: 10.40.228.1 38.769ms
2: 100.64.0.16 48.476ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 47.817ms asymm 4
4: te-2-1.bb-d.ba.slo.gb.oneandone.net 63.216ms asymm 5
5: 212.119.29.77 63.337ms asymm 6
6: ae-6.r02.amstnl02.nl.bb.gin.ntt.net 73.815ms asymm 9
7: ae-5.r03.amstnl02.nl.bb.gin.ntt.net 71.901ms asymm 8
8: no reply

Ich wollte sowohl am Donnerstag, als auch am Sonntag neue iOS-Geräte installieren. Über Freifunk ist das nicht gelungen. Die Geräte behaupteten, sie hätten keinen Zugang zum Internet (natürlich wurde nur irgendein Apple-Server nicht erreicht).
Dann habe ich mein privates WLAN ausgewählt, mich mit dem langen WLAN-Key abgequält, aber dann klappte die Installation.

Am Wochenende wollten meine Kids die Maus-App (‎DieMaus on the App Store) benutzen, die aber nicht lud, weil sie scheinbar irgendeinen WDR-Server nicht erreichte.

Das sind alles Phänomene, die wiederholt auftreten, aber schwer zu debuggen sind, wenn man den angefragten Server nicht kennt.
Insgesamt ist es derzeit sehr unbefriedigend.

1 „Gefällt mir“

Mich verwirrt an dem Problem vor allem, dass bei meinen drei Beispielen die Probleme jeweils an unterschiedlichen Punkten zu liegen scheinen.

Ich habe den Verdacht, dass sich unsere Routing Tabellen nicht schnell genug an neue Informationen anpassen.

Verbindungsprobleme kann ich hier recht zuverlässig reproduzieren :smile: .
So ist z.B http://www.dropbox.com aus dem lokalen Freifunk-Netzwerk heraus nicht erreichbar.

Ein ähnliches Problem hatten wir vor einiger Zeit schon einmal:

Google (geht):

traceroute to www.google.de (64.233.167.94), 64 hops max, 52 byte packets
 1  10.40.228.1  19.705 ms  221.032 ms  319.546 ms
 2  100.64.0.16  178.717 ms  48.331 ms  31.645 ms
 3  195.20.242.193  28.540 ms  28.994 ms  30.095 ms
 4  * * *
 5  209.85.248.12  45.585 ms  35.086 ms  38.557 ms
 6  209.85.251.178  31.400 ms
    209.85.251.248  59.206 ms
    72.14.234.231  40.343 ms
 7  209.85.240.142  43.125 ms  93.494 ms
    209.85.241.226  45.210 ms
 8  209.85.244.102  43.207 ms
    209.85.244.100  83.046 ms
    209.85.240.221  67.504 ms
 9  209.85.242.165  90.202 ms
    209.85.242.15  49.565 ms  45.844 ms
10  * * *
11  64.233.167.94  58.102 ms  45.068 ms  52.422 ms

Dropbox (geht nicht):

traceroute to www.v.dropbox.com (108.160.166.142), 64 hops max, 52 byte packets
 1  10.40.228.1  20.875 ms  28.334 ms  17.746 ms
 2  100.64.0.16  37.603 ms  146.542 ms  96.597 ms
 3  195.20.242.193  115.540 ms  74.240 ms  118.951 ms
 4  213.200.65.201  86.578 ms  253.292 ms  348.374 ms
 5  141.136.106.58  47.561 ms
    141.136.106.194  44.205 ms
    141.136.106.58  147.506 ms
 6  * * *
 7  * * *
 8  * * *
 9  * * *
10  * * *
11  * * *
12  * * *
...

Wenn ich von diesen plötzlich nicht erreichbaren Hosts höre muss ich zwangsläufig an Juli 2014 denken.
Zur Erinnerung: Wir waren damals noch kein RIPE Mitglied und auf niederländische Provider angewiesen, die wiederum aufgrund von einigen Abusemails Probleme machten. Um zumindest eine Grundfunktionalität herzustellen, haben Menschen aus dem Adminteam ein paar IP-Ranges gesperrt um unseren damaligen Provider zu beruhigen. In der Zwischenzeit liefen die Arbeiten am „Projekt Provider werden“ und der Aufbau eigener Infrastruktur.

Siehe:
https://mailman.freifunk-rheinland.net/pipermail/ffrl/2014-July/003355.html
https://mailman.freifunk-rheinland.net/pipermail/ffrl/2014-July/003356.html
https://mailman.freifunk-rheinland.net/pipermail/ffrl/2014-July/003360.html

Unter den versehentlich gesperrten IPs warenn auch Apple und Akamai Ranges, die hier scheinbar auch betroffen sind. Daher einfach mal meine Frage ins Blaue hinein: da hat sich nicht zufällig irgendwie eine alte Filterregel eingeschlichen?

Kann denn @nomaster @CyrusFox oder sonst jemand mit zugriff auf die backbone Infrastruktur etwas dazu sagen?

Ich finde die Situation abstrus, dass es möglich ist von der rwth aus einen knoten anzuschließen der sich per mesh vpn mit den ffrl Backbone verbindet, eine Verbund zurück, die ja über die gleichen routen gehen könnte, gelingt nicht.

Ich dachte, @nomaster und @thomasDOTwtf haben Zugriff auf den Backbone!?

Wo ist eigentlich die Übersicht, wer hier was macht?

1 „Gefällt mir“

Ist ja letztendlich egal wer was macht :wink: Probleme sollten immer generell gemeldet werden und nicht mittels kurzem Dienstweg, das belastet einzelne zu sehr und es ist nicht transparent wer was geändert hat.

Momentan gibt es im Mesh sehr viel Packetloss was wohl auch zu dem Problem beiträgt, ich denke das sich dies erst verbessern wird wenn wir die Supernodes auf neue VMs umgezogen haben.

Das tun wir hier, aber wir bekommen nicht mit, ob jemand etwas dagegen macht.

@Maltis hat hier eine interessante These beschrieben, es hat aber niemand etwas dazu gesagt.

Packetloss würde für eine Überlastung im Netz sprechen, dann müsste jedes Ziel mal funktionieren und mal gestört sein. Bei mir sind es aber bestimmte Ziele, die nie erreichbar sind.

aktuell funzt kein Flashplayer-Update:

reka$ ping aihdownload.adobe.com
PING e2265.d.akamaiedge.net (23.66.249.92): 56 data bytes
Request timeout for icmp_seq 0
Request timeout for icmp_seq 1
Request timeout for icmp_seq 2
Request timeout for icmp_seq 3
^C
e2265.d.akamaiedge.net ping statistics —
5 packets transmitted, 0 packets received, 100.0% packet loss

reka$ traceroute aihdownload.adobe.com
traceroute to e2265.d.akamaiedge.net (23.66.249.92), 64 hops max, 52 byte packets
1 10.40.228.1 (10.40.228.1) 34.837 ms 37.593 ms 51.252 ms
2 100.64.0.16 (100.64.0.16) 54.283 ms 42.082 ms 40.591 ms
3 irb-1050.bb-a.fra3.fra.de.oneandone.net (195.20.242.193) 83.370 ms 57.770 ms 62.457 ms
4 te-2-1.bb-d.ba.slo.gb.oneandone.net (212.227.120.21) 108.003 ms 68.304 ms 119.897 ms
5 212.119.29.77 (212.119.29.77) 60.058 ms 69.602 ms 62.800 ms
6 ae-6.r02.amstnl02.nl.bb.gin.ntt.net (129.250.3.9) 80.884 ms * 71.714 ms
7 ae-5.r03.amstnl02.nl.bb.gin.ntt.net (129.250.4.186) 69.094 ms 79.897 ms 69.580 ms
8 * * *
9 * * *
10 * * *
11 * * *
12 * * *
13 * * *
14 * * *
15 * * *
16 * * *
17 * *

Sehr gute Frage. Würde mich auch sehr interessieren!

1 „Gefällt mir“

Ich habe mehrere User Berichte, dass Instagram :blush: und E-Mails per iphone nicht funktionieren. Bei Friseuren ein echtes Problem!

Aber auch sonst hakelt es wieder, zwecks Doku:

tracepath www.rwth-aachen.de
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 18.990ms
1: 10.40.228.1 22.241ms
2: 100.64.0.16 27.007ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 27.027ms asymm 4
4: no reply

tracepath aihdownload.adobe.com
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 18.839ms
1: 10.40.228.1 20.430ms
2: 100.64.0.16 26.944ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 30.027ms asymm 4
4: te-2-1.bb-d.ba.slo.gb.oneandone.net 46.667ms asymm 5
5: 212.119.29.77 51.343ms asymm 6
6: ae-6.r02.amstnl02.nl.bb.gin.ntt.net 70.573ms asymm 9
7: ae-5.r03.amstnl02.nl.bb.gin.ntt.net 54.726ms asymm 8
8: no reply

tracepath www.v.dropbox.com
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 18.905ms
1: 10.40.228.1 19.334ms
2: 100.64.0.16 27.465ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 27.099ms asymm 4
4: xe-3-1-0-276.fra20.ip4.tinet.net 42.200ms asymm 14
5: xe-4-2-2.sjc12.ip4.gtt.net 57.978ms asymm 13
6: no reply

tracepath a23-65-181-73.deploy.static.akamaitechnologies.com
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 19.049ms
1: 10.40.228.1 18.910ms
2: 100.64.0.16 26.899ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 28.834ms asymm 4
4: te-2-1.bb-d.ba.slo.gb.oneandone.net 44.355ms asymm 5
5: 212.119.29.77 44.670ms asymm 6
6: ae-6.r02.amstnl02.nl.bb.gin.ntt.net 65.189ms asymm 9
7: ae-5.r03.amstnl02.nl.bb.gin.ntt.net 60.526ms asymm 8
8: no reply

tracepath sipgate.de
1?: [LOCALHOST] pmtu 1280
1: 10.40.228.1 18.640ms
1: 10.40.228.1 20.230ms
2: 100.64.0.16 28.318ms
3: irb-1050.bb-a.fra3.fra.de.oneandone.net 27.317ms asymm 4
4: c13-1.netzquadrat.net 33.740ms asymm 5
5: no reply

Verbunden zu mesh_vpn_backbone_peer_rheinufer0 & 2

Notiz an mich (und andere):
Stand erfassen wenn es geht (so wie gestern Abend)

heute morgen 7:45 ist unsere Spendenmaschine www.boost-project.com nicht erreichbar.

Kann mit dem iPad leider kein traceroute zur Verfügung stelen…

kann das jemand von denen, die auf den Link geklickt haben, bestätigen?

Derzeit sind die beiden Supernodes rheinufer0 und rheinufer2 schlicht überlastet. Eigentlich wollte ich bereits vor einigen Tagen zwei weitere Supernodes in Betrieb nehmen, jedoch wurde ich aufgehalten durch andere Probleme und jüngst eine Erklältung.

Bitte gedultet euch noch bis übers Wochenende. Bis dahin bekommen wir bestimmt eine Verbesserung hin.

1 „Gefällt mir“

Hi @nomaster,

ein Aachener Provider hatte uns mal kostenlose Serverkapazitäten mit 1 Gbit/s Uplink angeboten. Falls wir dafür Bedarf haben, können wir ( @FxFx und ich ) gerne mittelfristig aktiv werden und einen Kontakt vermitteln.

Gruß
Jan

1 „Gefällt mir“

@nomaster

Ich kann mit einer VM als Supernode auch gerne aushelfen! Bei interresse einfach melden.

Lg

Stefan

1 „Gefällt mir“

@nomaster

Danke für die Info, ich werde bald ein Forschungsprojekt mit der Hochschule beginnen.

Dafür würde ich gerne auch einen Supernode betreiben.

Wo sind denn die Engpässe beim derzeitigen System?

CPU oder Netz?

Mit welchem Volumen ist zu rechnen?