Gluon v2022.1.4+: Archer C6 v2, 802.11s 5-GHz-Mesh flaky?

Moin,

kann folgendes bitte jemand mal veri- oder auch falsifizieen? Testsetup:

Mesh-Testsetup

Node A: Archer C6 v2 mit Gluon v2022.1.4+, Mesh-VPN über WAN, WiFi-Mesh nur auf 5 GHz (VHT40).
Node X: Fritz!Box 4040 mit Gluon v2021.1.x, kein WAN, WiFi-Mesh nur auf 5 GHz (VHT40).

Bei mir bricht die Mesh-Verbindung nach variabler Zeit (meistens < 60 Minuten) zusammen, das sieht dann so aus:

root@33332-Archer-C6-v2-v2022-5c70:~# iwinfo mesh0 info
mesh0     ESSID: "17:47:de:ca:fb:ad"
          Access Point: 52:B2:D2:F9:45:E1
          Mode: Mesh Point  Channel: unknown (unknown)  HT Mode: NOHT
          Center Channel 1: unknown 2: unknown
          Tx-Power: 23 dBm  Link Quality: unknown/70
          Signal: unknown  Noise: -106 dBm
          Bit Rate: unknown
          Encryption: none
          Type: nl80211  HW Mode(s): 802.11ac/n
          Hardware: 168C:0056 0000:0000 [Qualcomm Atheros QCA9886]
          TX power offset: none
          Frequency offset: none
          Supports VAPs: yes  PHY name: phy0

dmesg:

[  137.307301] batman_adv: bat0: Interface activated: mesh0
[ 1803.383931] ath10k_pci 0000:00:00.0: htt tx: fixing invalid VHT TX rate code 0xff
[ 2662.292373] ath10k_pci 0000:00:00.0: Free vdev map is empty, no more interfaces allowed.
[ 2662.330157] ath10k_pci 0000:00:00.0: mac flush vdev 2 drop 0 queues 0x4 ar->paused: 0x0  arvif->paused: 0x0
[ 2662.365278] batman_adv: bat0: Interface deactivated: mesh0
[ 2662.390245] ath10k_pci 0000:00:00.0: peer-unmap-event: unknown peer id 2
[ 2662.435342] ath10k_pci 0000:00:00.0: rts threshold -1
[ 2662.612912] batman_adv: bat0: Removing interface: mesh0
[ 2669.622602] ath10k_pci 0000:00:00.0: rts threshold -1
[ 6259.886334] ath10k_pci 0000:00:00.0: rts threshold -1

Ein anderes Mal, 33332-Archer-C6-v2-v2022-5c70 nur auf VHT20:

[   68.105475] batman_adv: bat0: Interface activated: mesh-vpn
[  252.151153] ath10k_pci 0000:00:00.0: Invalid peer id 1 or peer stats buffer, peer: 2f54c9cc  sta: 00000000
[  272.051516] ath10k_pci 0000:00:00.0: mac flush vdev 0 drop 0 queues 0x1 ar->paused: 0x0  arvif->paused: 0x0
[ 1009.517921] ath10k_pci 0000:00:00.0: htt tx: fixing invalid VHT TX rate code 0xff
[ 1415.800223] ath10k_pci 0000:00:00.0: wmi: fixing invalid VHT TX rate code 0xff
[ 2177.859328] ath10k_pci 0000:00:00.0: Free vdev map is empty, no more interfaces allowed.
[ 2177.915079] ath10k_pci 0000:00:00.0: mac flush vdev 2 drop 0 queues 0x4 ar->paused: 0x0  arvif->paused: 0x0
[ 2177.947248] batman_adv: bat0: Interface deactivated: mesh0
[ 2177.960620] ath10k_pci 0000:00:00.0: peer-unmap-event: unknown peer id 2
[ 2177.999430] ath10k_pci 0000:00:00.0: rts threshold -1
[ 2178.223779] batman_adv: bat0: Removing interface: mesh0
[ 2185.037524] ath10k_pci 0000:00:00.0: rts threshold -1

Danach ist mesh0 jeweils tot (33332-Archer-C6-v2-v2022-5c70 hat keine Mesh-Links mehr, auch nicht mit neu ins Mesh gebrachten Geräten). Ich habe es erstmal nur gegen Qualcomm-Atheros-IPQ4019-Systeme (genauer: AVM 4040) probiert, mit (v2022) und ohne (v2021) A-MSDU-Patch.

wifi down ; wifi up hält auch nicht lange (jedenfalls, wenn gerade ein iperf3 drüber versucht wird):

[70798.988024] batman_adv: bat0: Adding interface: mesh0
[70798.993748] batman_adv: bat0: Interface activated: mesh0
[71059.342003] ath10k_pci 0000:00:00.0: Free vdev map is empty, no more interfaces allowed.
[71059.394544] ath10k_pci 0000:00:00.0: mac flush vdev 2 drop 0 queues 0x4 ar->paused: 0x0  arvif->paused: 0x0
[71059.433265] batman_adv: bat0: Interface deactivated: mesh0
[71059.448097] ath10k_pci 0000:00:00.0: peer-unmap-event: unknown peer id 2
[71059.487692] ath10k_pci 0000:00:00.0: rts threshold -1
[71059.660430] batman_adv: bat0: Removing interface: mesh0
[71066.528871] ath10k_pci 0000:00:00.0: rts threshold -1

Das passiert nicht immer — aber zu häufig, als daß der Archer C6 v2 einsetzbar wäre :frowning:

Ersetze ich bei Node X die Fritz!Box 4040 durch einen Archer A7 v5 (nutzt ebenfalls ath10k) mit Gluon v2022.1.4 plus A-MDSU-Patch, funktioniert der Link längerfristig:

Sending ...
[  5] local 2a06:e881:260c:1:f061:12d3:cc78:7a39 port 40078 connected to 2001:bf7:1322:17:a2ce:c8ff:fe5b:4714 port 5201
-----
[  5]   0.00-900.00 sec  3.44 GBytes  32.8 Mbits/sec  4125             sender
[  5]   0.00-900.15 sec  3.44 GBytes  32.8 Mbits/sec                  receiver
-----
Min/Max: 2.4/44.3 MBit/sec

Receiving ...
[  5] local 2a06:e881:260c:1:f061:12d3:cc78:7a39 port 48154 connected to 2001:bf7:1322:17:a2ce:c8ff:fe5b:4714 port 5201
-----
[  5]   0.00-900.05 sec  11.2 GBytes   107 Mbits/sec  9524             sender
[  5]   0.00-900.00 sec  11.2 GBytes   107 Mbits/sec                  receiver
-----
Min/Max: 29.3/150.0 MBit/sec
Sending ...
[  5] local 2a06:e881:260c:1:f061:12d3:cc78:7a39 port 56716 connected to 2001:bf7:1322:17:a2ce:c8ff:fe5b:4714 port 5201
-----
[  5]   0.00-900.00 sec  3.45 GBytes  33.0 Mbits/sec  3120             sender
[  5]   0.00-900.04 sec  3.45 GBytes  33.0 Mbits/sec                  receiver
-----
Min/Max: 6.2/44.3 MBit/sec

Receiving ...
[  5] local 2a06:e881:260c:1:f061:12d3:cc78:7a39 port 60260 connected to 2001:bf7:1322:17:a2ce:c8ff:fe5b:4714 port 5201
-----
[  5]   0.00-900.04 sec  11.9 GBytes   114 Mbits/sec  10325             sender
[  5]   0.00-900.00 sec  11.9 GBytes   114 Mbits/sec                  receiver
-----
Min/Max: 37.6/156.0 MBit/sec

Any ideas?

äh puh, keine Ahnung
Das einzige was ich durch Googlen finden konnte:

und diesen Code, der die eine Warnung ausgibt

Ist auf beiden ath10k-ct installiert?
Was gibt folgendes aus? (auf beiden Router ausführen)

opkg list | grep ath

Siehst du auf der Fritz!Box im Log error, wenn das auftritt oder ausschließlich beim Archer C6 v2?