Performance FFAC | hohe Antwortzeiten/Ping Verlust


#1

Hallo zusammen,

ich wollte mal fragen wie es so um die Performance im FFAC steht.
Ich beobachte (Anbindung über Kabel am Offloader) oft verlorene Pings und hohe Latenzzeiten.
Das WAN ist nicht an der vollen Auslastung sonder zu 50% ausgelastete.
Unitymedia Business mit 150DL und 10UL

Es ist auch unabhängig von der Anzahl der Verbundenen Clients am Offloader.

26-02-_2018_14-41-24

26-02-_2018_14-37-44

Ist das unter “normal” zu verbuchen oder doch ein Problem?

Die Auslastung meines Offloaders schaut so aus:

26-02-_2018_15-27-25

Schöne Grüße


#2

nehme doch bitte mal eine Platform für die mtr verfügbar ist und lasse das für mindestens 20 Minuten offen, davon dann einen screenshot.

Meine Vermutung: FFRL-Backbone-Saturierung zwischen 12 und 24h. Ist aber Spekulation

P.S. ggf. Download


#3

Einzelne Pings die verloren gehen sehe ich bei mir auch immer wieder, aber der loss ist dann auch noch <5%

Wenn ich dann auf meine native Leitung wechsele sehe ich den packetloss aber auch dort.

Alles per wlan.


#4

In der Tat, die obigen Dinge (des TS) sehen eigentlich gar nicht schlecht aus, Packetloss unter 5% ist doch gut in einem Wlan-Netz.

Die Info, ob der Test aus dem Wlan gemacht wird oder nicht: Ebenfalls wichtig. Vielleicht ist es ja auch Kabel-Link vom Client.

Aber wenn man schon mal dabei ist beim Messen: Vielleicht nochmal ein MTR auf die Nextnode-IP (des FF-Routers) zum Vergleich (ip ist von der verwendeten site.conf abhängig), ebenfalls über mindestens 30 Minuten (des gleichen Zeitraums nach Möglichkeit)

Man kann in komplexen Haus-Installationen sich auch selbst in den Fuß schiessen, z.B. wenn Clients beständig zwischen APs “roamen” und dabei jeweils erstmal 5-10s Packetloss haben.


#5

Ich habe WinMTR einmal 20 Min laufen lassen jeweils immer auf www.google.de
Ohne WLAN dazwischen sondern direkt auf der VM und nur mit dem vSwitch am Offloader.
Beim ersten über den FF-Offloader, beim zweiten mal direkt über das WAN.

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
10.145.224.1 - 1 1280 1277 16 66 2638 22
node01.gw-ec.ffac - 1 1272 1267 16 69 2638 24
185.66.194.0 - 1 1255 1245 24 81 2778 38
de-cix.fra.google.com - 1 1248 1236 23 80 2778 59
108.170.251.129 - 1 1257 1248 25 84 2778 60
66.249.94.135 - 1 1262 1254 24 84 2778 43
fra15s12-in-f35.1e100.net - 1 1261 1253 24 84 2778 31
________________________________________________ ______ ______ ______ ______ ______ ______
Windows VM <–> vSwitch <–> FF-Offloader <–> WAN ca. 20 Minuten --> www.google.de

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
192.168.120.1 - 100 257 1 0 0 0 0
No response from host - 100 256 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 0 1261 1261 6 14 42 15
de-fra04a-rc1-ae49-0.aorta.net - 1 1257 1256 12 25 85 53
de-fra03b-ri1-ae5-0.aorta.net - 1 1257 1256 11 18 67 20
213.46.177.42 - 0 1260 1260 12 19 55 21
108.170.251.193 - 0 1260 1260 12 18 44 22
108.170.235.253 - 1 1257 1256 12 18 44 32
fra16s14-in-f3.1e100.net - 0 1261 1261 11 17 44 21
________________________________________________ ______ ______ ______ ______ ______ ______
Windows VM <–> vSwitch <–> WAN ca. 20 Minuten --> www.google.de

#6

Das sieht jetzt alles ziemlch gut aus.

Ich sehe weder Paketverluste noch hohe Antwortzeiten.
Oder übersehe ich etwas?

Anders gefragt: Was wäre Deine Erwartungshaltung?

Ach so, was den Lag anbetrifft: Vermutlich steht der Supernode irgendwo in einem lokalen Aachener Rechenzentrum und nicht in der Nähe einer der üblichen Monster-RZ-Großstandorte. das sorgt dann halt für 10ms mehr Laufzeit. (Aber ist halt mit 60ms immernoch im Rahmen)


#7

P.S. an einem durchaus belasteten (aber gut nutzbaren) Host, der per ethernet an einem Offload hängt (dann aber eine Wlan-Strecke):

grafik

Sprich: Deine Messung da oben zeigt zumindest keine Auffälligkeiten und das Netz sollte gut nutzbar sein.
(Und wenn doch was ist, dann liegt es weder an Packet-Loss, noch an RoundTripDelay)


#8

Kannst du das selbe versuchen mit den 6 Supernodes 01.nodes.freifunk-aachen.de bis 06.nodes.freifunk-aachen.de und schauen ob es da Auffälligkeiten gibt? Die Server sind auf zwei ASe verteilt, bei Problemen sollte eigentlich die eine Hälfte gut funktionieren, die andere nicht. Kann und mag nix versprechen, kann mir aber gut vorstellen, dass die RZ dem allein aus Eigeninteresse auf den Grund gehen wollen, und sich über sachdienliche Tipps von uns freuen :slight_smile:

Ich kann das zwar selber nicht reproduzieren (auch Unitymedia, aber ohne Business), habe aber so dtag.net Netze in den Hops gesehen. Kann mir vorstellen dass es da grundsätzlich knirscht, viellei cht wenn der Übergang da an einem anderen Punkt erfolgt der eher ausgelastet ist. :wink:

(Und ich sehe grade dass ich die Umleitung zu dtag.net nicht mehr sehen kann wenn ich jetzt paar Stunden später nochmal versuche)


#9

So dann einmal die Werte für die nodes:
Von Node1 bis Node6

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
01.nodes.freifunk-aachen.de - 1 3496 3489 15 56 3656 19
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
10.145.224.1 - 46 1341 737 16 70 1641 22
node01.gw-ec.ffac - 69 1002 312 0 76 2055 74
185.66.194.0 - 56 1169 521 0 108 2092 95
decix.ffm.synaix.de - 2 3559 3520 29 84 1891 53
i124ve21.cr129206.synaix.de - 1 3577 3543 27 84 1837 41
i231ve31.cr129207.synaix.de - 1 3584 3552 27 84 1867 38
02.nodes.freifunk-aachen.de - 2 3490 3432 24 68 2133 34
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
10.145.224.1 - 64 1074 387 16 74 1409 19
node01.gw-ec.ffac - 43 1420 820 0 66 2055 26
185.66.194.0 - 52 1242 597 24 91 1980 30
bb1-decix.relaix.net - 1 3684 3664 37 97 1882 59
bb1-euraix.relaix.net - 1 3645 3614 37 93 2114 75
5.145.135.133 - 1 3657 3629 23 81 1805 67
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
10.145.224.1 - 52 1241 602 0 61 1742 23
node01.gw-ec.ffac - 29 1770 1263 16 66 2055 18
185.66.194.0 - 42 1438 848 24 84 1662 40
bb1-decix.relaix.net - 1 3648 3624 37 98 1897 61
bb1-euraix.relaix.net - 1 3610 3576 35 95 1971 45
5.145.135.134 - 1 3636 3609 23 81 1969 34
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
10.145.224.1 - 49 1276 651 16 72 1515 19
node01.gw-ec.ffac - 57 1158 502 0 88 1744 24
185.66.194.0 - 53 1214 572 0 99 1838 95
bb1-decix.relaix.net - 2 3579 3540 37 92 1720 84
bb1-euraix.relaix.net - 1 3593 3558 37 92 1720 59
5.145.135.135 - 1 3642 3622 22 87 1873 29
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
10.145.224.1 - 26 1867 1394 0 50 1934 78
node01.gw-ec.ffac - 41 1431 847 0 50 1838 20
185.66.194.0 - 30 1740 1234 0 76 2041 40
bb1-decix.relaix.net - 1 3627 3606 36 97 1897 49
bb1-euraix.relaix.net - 1 3598 3569 36 93 1839 39
5.145.135.136 - 1 3614 3589 23 80 2174 53
________________________________________________ ______ ______ ______ ______ ______ ______

#10

Danke.
Welche Störungen/Beeinträchtigungen beobachtest Du denn parallel?


#11

Im Prinzip sind mir nur beim Ping die Paketverluste und die manchmal hohen Latenzen aufgefallen.
Das hat bei VPN dann manchmal schon mal zur Folge dass der VPN-Client sich neu verbindet…

Daher wollte ich eigentlich nur einmal nachhören ob das trotzdem ok ist von den Werten her. :wink:


#12

Wann war dieses “Prinzip”: Während der obigen Messungen oder nicht?

(Entschuldige die direkt Rückfrage, aber meine Frage oben war bewusst gewählt.)

Wenn die als Störung empfundenen Effekte während obiger Messungen weiter bestanden, dann kommt man mit dieser Metrik nicht weiter.
Denn die Werte sehen mindestens akzeptabel, wenn icht sogar gut aus.

Aber es könnte halt auch etwas total anderes sein, Daher die Frage.


#13

Sorry, dass ich mich nicht ganz genau ausgedrückt habe.

Ich meinte die Traceroute direkt von deinem Anschluss ohne Freifunk-Tunnel zu den einzelnen Supernodes. Durch den Tunnel kann man nämlich bei deinen bisherigen Tracerouten nicht sehen, wo es auf dieser Strecke genau hakt.

Daher wollte ich eigentlich nur einmal nachhören ob das trotzdem ok ist von den Werten her. :wink:

Die Latenz ist eigentlich ok, aber auf hohem Niveau beschwert wären 60ms etwas länger als nötig. Wenn möglich wäre daher trotzdem gut das ganze einzugrenzen.


#14

…aber trotzdem mal lustig zu sehen, wie man von »innen« wieder nach »aussen« kommt und dabei einmal komplett am Internet vorbeikommt :wink: weil da mittendrin ist nämlich immer noch der FFRL-Backbone (dort wo der Sprung von 1000er auf 3500+ ist :wink: )


#15

Hallo zusammen

Die Werte sollt ihr auch bekommen… :slight_smile:
Nun aus dem WAN Von Node1 bis Node6
Ich würde sagen - Synaix scheint nicht so performant zu sein.

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
192.168.120.1 - 100 561 1 1 1 1 1
No response from host - 100 561 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 1 2755 2754 7 13 49 9
de-fra04a-rc1-ae49-0.aorta.net - 1 2751 2749 11 25 88 17
de-fra01b-ri1-ae1-0.aorta.net - 1 2743 2739 11 17 53 15
rtdecix2-po1-2.netcologne.de - 1 2750 2748 14 21 71 17
ip-core-eup1-ae3.netcologne.de - 1 2747 2744 15 22 69 22
rtkds-vc1-ae3.netcologne.de - 1 2750 2748 14 21 62 17
89.1.1.222 - 1 2740 2735 15 22 95 23
i124ve20.cr128205.synaix.de - 1 2740 2735 16 24 181 25
i131ve30.cr128207.synaix.de - 1 2748 2745 16 25 250 23
01.nodes.freifunk-aachen.de - 1 2744 2740 15 21 51 20
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
192.168.120.1 - 100 565 1 1 1 1 1
No response from host - 100 564 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 0 2774 2774 4 14 84 18
de-fra04a-rc1-ae49-0.aorta.net - 0 2774 2774 11 26 87 17
de-fra01b-ri1-ae1-0.aorta.net - 0 2774 2774 10 18 60 17
rtdecix2-po1-2.netcologne.de - 1 2771 2770 15 22 54 21
ip-core-eup2-ae3.netcologne.de - 0 2774 2774 15 23 95 20
rtkds-vc1-ae4.netcologne.de - 0 2774 2774 14 22 58 21
89.1.1.222 - 0 2774 2774 15 24 110 23
i124ve20.cr128205.synaix.de - 1 2768 2766 15 25 191 24
i121ve1.cr129205.synaix.de - 1 2765 2762 12 24 282 20
i131ve30.cr129207.synaix.de - 0 2774 2774 15 24 106 30
02.nodes.freifunk-aachen.de - 1 2749 2742 15 23 143 23
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
192.168.120.1 - 100 564 1 1 1 1 1
No response from host - 100 563 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 1 2763 2761 6 14 42 12
de-fra04a-rc1-ae49-0.aorta.net - 1 2763 2761 12 25 92 46
de-fra01b-ri1-ae1-0.aorta.net - 1 2764 2762 10 18 68 14
62.157.248.113 - 0 2771 2771 10 18 88 18
217.239.40.242 - 1 2767 2766 12 19 74 35
87.128.239.242 - 0 2771 2771 11 19 49 16
bb1-euraix.relaix.net - 1 2767 2766 12 20 75 19
5.145.135.133 - 0 2771 2771 12 19 50 18
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
192.168.120.1 - 100 564 1 1 1 1 1
No response from host - 100 563 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 0 2772 2772 6 14 49 21
de-fra04a-rc1-ae49-0.aorta.net - 0 2772 2772 9 26 87 15
de-fra01b-ri1-ae1-0.aorta.net - 0 2772 2772 11 18 50 17
62.157.248.113 - 1 2769 2768 10 19 57 17
217.239.52.90 - 1 2768 2767 10 19 70 18
87.128.239.242 - 0 2772 2772 12 20 50 26
bb1-euraix.relaix.net - 0 2772 2772 13 21 53 26
5.145.135.134 - 0 2772 2772 10 20 45 17
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
192.168.120.1 - 100 564 1 1 1 1 1
No response from host - 100 563 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 0 2772 2772 7 14 50 13
de-fra04a-rc1-ae49-0.aorta.net - 0 2772 2772 10 26 87 17
de-fra01b-ri1-ae1-0.aorta.net - 0 2772 2772 11 18 49 14
62.157.248.113 - 0 2772 2772 10 18 52 15
217.239.52.82 - 1 2768 2767 12 19 70 14
87.128.239.242 - 1 2769 2768 12 20 52 19
bb1-euraix.relaix.net - 0 2772 2772 14 21 49 16
5.145.135.135 - 0 2772 2772 12 20 50 18
________________________________________________ ______ ______ ______ ______ ______ ______

|------------------------------------------------------------------------------------------|
| WinMTR statistics |

Host - % Sent Recv Best Avrg Wrst Last
No response from host - 100 563 0 0 0 0 0
No response from host - 100 563 0 0 0 0 0
13NOC-MX960-01-ae10-1110.due.unity-media.net - 0 2772 2772 7 14 47 12
de-fra04a-rc1-ae49-0.aorta.net - 0 2772 2772 12 26 91 14
de-fra01b-ri1-ae1-0.aorta.net - 0 2772 2772 9 19 59 14
62.157.248.113 - 1 2769 2768 10 18 47 15
217.239.39.30 - 1 2765 2763 11 19 84 22
87.128.239.242 - 1 2769 2768 11 19 61 15
bb1-euraix.relaix.net - 1 2769 2768 11 21 50 18
5.145.135.136 - 0 2772 2772 12 19 48 15
________________________________________________ ______ ______ ______ ______ ______ ______

#16

Wer kann mir denn eine Einschätzung zu den Werten geben? :wink:


#17

Moin,

ich habe nicht alles gelesen. Nur schnell zwei Anmerkungen:

Ich habe es in Batmannetzen schon gesehen, dass man plötzlich komisch große Latenzen hatte und Pakete scheinbar ohne Grund verloren gegangen sind. Das war dann immer auf eine Fehlfunktion im Batman zurück zu führen, entweder auf dem Knoten oder auf dem Gateway. Meist eher letzterem. Ein Neustart kann da schon helfen. Manche Batmanversionen waren dafür anfälliger als andere, 2017.2 z. B. lief bei uns ewig stabil.

Und zu Aachen allgemein: Ich hatte da was gehört, dass ein paar Gateways ausgefallen sind. Ich weiß nicht, ob das noch akut ist und oder deine Probleme damit zu haben könnten. Genaueres weiß ich aber nicht und dazu können die Aachener selbst sicher mehr sagen.

Viele Grüße
Matthias


#18

Wo hast du denn so etwas gehört, da ist überhaupt nichts dran!

Es gab mal eine VM die für ein paar Stunden ausgefallen ist, aber das stecken die anderen Supernodes problemlos weg.

Dazu ein Supernode bei dem für rund eine Stunde das Batman Kernel Modul, dank Spectre. Kernel war mit retpoline kompiliert und das Modul noch nicht.

Das wird aber beides nicht mit den beobachteten Problemen zu tun haben.

Was ich im Monitoring auch sehe sind immer wieder auftretende Paketverluste zwischen den Supernodes:



Hier scheint mir teilweise schlicht die Netwerkschnittstelle überlastet zu sein. Wir haben Mittlerweile eine Layer 2 Verbindung zwischen allen Supernodes die wir auch schon nutzen. Momentan noch ein wenig improvisiert, das machen wir den kommenden Tagen noch sauber. Dadurch ist dann auf den Netzwerkschnittstellen für die Außenanbindung auch weniger los.


#19

Man sieht ja am Traceroute dass die Durchschnittswerte sowohl zu Relaix als auch Synaix gut sind. Bei Synaix hat man jedoch bei den “Worst-Case” Werten schon starke Ausreißer, die bei Synaix nicht auftreten.

Anscheinend geht der Weg Unitymedia <-> NetCologne <-> Synaix, d.h. Unitymedia legt die Router über NetCologne als Transitprovider.

In den Statistiken kann man zwei Sprünge sehen: Einmal beim Übergang von Unitymedia zu NetCologne und einmal beim Übergang von NetCologne zu Synaix.

Ich würde nun vermuten, dass NetCologne einfach eine stark ausgeleistete Leitung zu beiden Netzen hat, wodurch ab und zu Pakete auf dem Weg längere Zeit in den Caches “hängen bleiben” oder im schlimmsten Fall gedroppt werden. Mit Unitymedia bzw. Liberty Global kann man nicht so einfach peeren, also kann man das von Seiten Synaix nicht so schnell lösen denke ich.

Soweit ich weiß wollen wir mittelfristig aber eh weiter zu Relaix umziehen (wir haben ja nun auch einen Verein für die Finanzierung gegründet), das Problem sollte sich daher bald lösen.


#22

Dieser Beitrag wurde von der Community gemeldet und ist vorübergehend ausgeblendet.