Welche DHCP-Konzepte gibt es?

wusel · 15. November 2015 um 18:27

Hmm. Sonstige Parameter parallel geändert? Authoritativ sollte er sein, weil sonst der Fall „Client kommt mit netzfremder IP“ (sei es ein neuer Client oder Client war zuletzt mit anderem GW verbunden) erst nach Tiemouts bearbeitet wird. Das äußert sich dann in seeeeehr langen Zeiten, bis das Endgerät eine Verbindung meldet.

[quote]Man bräuchte mal ein Testtool, wo man die drei Fälle durchspielen kann.

DHCP-Client hat keine IP
DHCP-Client hat eine IP irgendwo aus dem FF-Netz
DHCP-Client versucht eine netzfremde IP
[/quote]

Hmm, wie meinst Du das? dhcpd deckt doch genau diese Fälle ab und loggt sie? Also zumindest 2 & 3, die im Falle getrennter Ranges pro GW letztlich identisch sind. Den ersten Fall kannst Du simulieren, indem Du den dhcpd killst, Resultat ist i. d. R. bei Android, daß die Verbindung nach laaaanger Zeit als fehlgeschlagen abgelehnt und eine andere versucht wird. Falls (public) v6 per RA verteilt wird, meldet mein Linux (Laptop oder RPi) in dem Fall i. d. R. eine funktionale Verbindung über den Network Manager, wirklich nutzbar war’s aber nur bedingt (keine v4-Ziele erreichbar).

paulinsche · 15. November 2015 um 18:45

Das Problem im Münster war, wenn ich es richtig verstanden habe, dass in einem Netz zwei DHCP-Server standen, die nichts von einander wussten, aber beide „authorative“ waren. Von einem kam ein OFFER vom anderen ein NACK. Wenn ich mich richtig erinnere…

MPW · 15. November 2015 um 18:50

Also müssten wir sie nicht nur wieder auf authorative stellen, sondern auch noch die Relays konfigurieren…

descilla · 15. November 2015 um 18:54

Möglicherweise sollten wir auch mal schauen, ob wir die lease-time etwas hochsetzen.
Wenn ich richtig informiert bin, ist das momentan bei uns wie folgt konfiguriert:

default-lease-time 240;
max-lease-time 1200;

Was in praktisch dazu führt, dass die Clients nach ~ 2 1/2 Minuten einen DHCPREQUEST senden.

wusel · 15. November 2015 um 19:05

IIRC fragen die Clients nach Leasetime/2 nach ihrer aktuellen Adresse; bin mir nur nicht im Klaren, welche der Leastimes hier zählt, ich meine, die default-lease-time

An und für sich muß in einem batman_adv-Netz auf jedem GW, welches auf „batctl gw server“ läuft, auch lokal ein DHCP-Server (ob Daemon oder Relay ist erstmal egal) laufen. Dieser sollte tunlichst authoritativ sein (um Anfragen aus anderen Bereichen direkt zu NACKen), der Range darf sich aber nicht mit denen anderer DHCP-Server im gleichen Mesh überschneiden. (Wobei doppelte/nicht freigegebene IPs zumindest vom ISC-Server angepingt und aus der Verteilung genommen werden scheinen.) Authoritativ sollten sie wie gesagt alle sein, Anfragen bekommen sie ja eben nicht per Broadcast, wie in einem normalen Netz; die DHCPDISCOVERs filtert/kanalisiert batman_adv ja auf ein (zufälliges) GW aus der Liste (batctl gwl), folgende Anfragen gehen eh’ per Unicast.

wusel · 15. November 2015 um 19:51

Ich hab’ die Frage mal in einen neuen Thread gegossen.

void · 16. November 2015 um 22:50

@MPW: Ist umgesetzt, fie DHCP Server in Münster laufen wieder authorative.

MPW · 17. November 2015 um 06:58

Danke! Hoffen wir mal, dass es besser wird.

paulinsche · 17. November 2015 um 08:28

Zusammenfassung:

Aufgrund dieses Threads laufen in Münster wieder zwei, vermutlich identisch konfigurierte DHCP-Server in einem LAN, ohne von einander zu wissen und fühlen sich dort beide autoritativ.

MPW · 17. November 2015 um 09:15

Vielleicht ist unser Problem, dass sie nicht miteinander sprechen? Die sind doch in einem L2, also könnte man mit einem Relay arbeiten?

So wie ich es verstanden habe, macht das theoretisch nichts, weil Batman die Anfragen eh nicht durchlässt und nur zu einem leitet.

Viel interessanter ist, dass laut der neuen Auswertungen die Pools auf ungefähr N-100 voll sind. Das sieht mir eher nach einem Problem aus.

MrMM · 17. November 2015 um 09:30

Genau identisch konfiguriert wäre schlecht, sie sollten jeweils einen eigenen Pool haben aus dem sie verteilen.

Da Batman DHCPv4 Anfragen ausschließlich zum gewählten gw durchläßt muss auf jedem Gateway auch ein solcher dhcp Server laufen.

Freifunker · 17. November 2015 um 13:04

Bei uns: 10.134.0.0/16

GW1: 10.134.10.1 mit DHCP Range 10.134.10.2 - 10.134.19.255
GW2: 10.134.20.1 mit DHCP Range 10.134.20.2 - 10.134.29.255
GW3: 10.134.30.1 mit DHCP Range 10.134.30.2 - 10.134.39.255
GW4: 10.134.40.1 mit DHCP Range 10.134.40.2 - 10.134.49.255

Alle autoritativ. Leasetime und Default Leasetime jeweils 300 Sekunden.

MPW · 17. November 2015 um 13:19

Bei uns hat jedes Gateway ein /21.

@descilla hat ein Skript geschrieben, dass die Daten ins collectd schmeißt: https://github.com/FreiFunkMuenster/ansible-ffms/blob/master/roles/collectd/templates/dhcp.py.j2

Die Auswertung sieht man hier: https://freifunk-muensterland.de/grafana/dashboard/db/gateway-ubersicht

wusel · 18. November 2015 um 06:28

Dies gilt nur für den eigentlichen Broadcast (DHCPDISCOVER), in die Unicast-Kommunikation (DHCPOFFER, DHCPREQUEST, DHCPACK, DHCPNAK) greift batman_adv »meistens« nicht ein, siehe oben.

Siehe u. a. #8 und #2 und letztlich #21. Anders als in einem »normalen« LAN melden sich die Clients im Freifunk-Mesh ja nicht ab; ihre Besitzer wandern einfach aus dem abgedeckten Bereich raus, d. h. der jeweilige Lease bleibt belegt, ergo muß, worst case, der dem GW zugeordnete Bereich so groß sein, wie Ihr in der default-lease-time unterschiedliche Clients erwartet. Je GW, denn batman_adv verteilt nur auf Basis der gwl und dies, zumindest bei uns, nicht symmetrisch. Bei uns waren insgesamt 2000 IPs (/21) für 1000 parallele Clients über 4 GWs (=> 500 IPs/GW) zu wenig, dank zentralem DHCP reichen die jetzt locker aus, bei einer default-lease-time von nun wieder 1800 (vorher 300). Größere default-lease-time => weniger DHCP-Verkehr (Nachfrage nach Verlängerung bei lease-time/2), dafür aber höherer Anteil an nicht genutzten Adressen.

MPW · 18. November 2015 um 11:02

Ich hab mal noch eine Frage dazu, wie man DHCP-Server richtig miteinander kommunizieren lassen kann.

Betrachten wir mal diese Anleitung: http://consultancy.edvoncken.net/index.php/HOWTO_Configure_DHCP_failover

Kann man denn auch mehrere secondary DHCP-Server haben? Denn dort ist nur von zwei DHCP-Servern die Rede, die miteinander sprechen.

Wenn wir, wie oben bereits besprochen, aber an jedem Gateway einen authorativen DHCP-Server brauchen, dann bräuchten wir ja mehrere secondary DHCP-Server. Oder wie macht man das dann?

descilla · 18. November 2015 um 13:31

@MPW Unsere Idee war ja an jeden batman „endpunkt“ einen DHCP Relay setzen, der dann mit einem zentralen DHCP spricht, das ist imo erstmal unabhängig von failover.

Da das dhcp relay aber primär gedacht ist, mehrere subnetze mit einem DHCP sprechen zu lassen, kam bei mir die Frage auf, ob das überhaupt vernünftig läuft, wenn mehrere relays in einem subnet sind und ob uns nicht letztendlich batman einen knüppel zwischen die Beine wirft.

Hat da jemand Erfahrung/Mutmaßungen?

PS: In meinem Script bedeuten Aktive Leases, Leases deren startzeit kleiner und endzeit größer als die aktuelle utc zeit sind. Touched leases sind alle adressen, die jemals herausgegeben wurden, aber gerade nicht aktiv sind. Dieser wert ist daher imo (für unser problem) recht uninteressant. Ich habe ihn aber in diversen anderen auswerte tools ( z.B. Dhcpd-pool) gesehen und daher mit aufgenommen. Ggf. Interessant wäre noch, in erfahrung zu bringen, ob es rine dauer gibt, ab der ein inaktives lease erst wirder vergeben wird.

wusel · 18. November 2015 um 22:51

Das ist das, was wir umgesetzt haben derzeit. „Man“ „will“ an sich natürlich diesen DHCP-Server redundant aufgesetzt, bei uns steht das noch aus. Wahrscheinlich wird zum Wochenende auf einer 2. VM ein 2. DHCP-Server gestartet, der sich ganz normal im LAN mit dem 1. abgleicht und von dern DHCP-Relays entsprechend quasi-parallen angesprochen wird.

Für das DHCP-Relay ist das mit den verschiedenen Subnetzen relativ; faktisch hat man „vorher“ verschiedene Subnetze in einem L2-Netz gefahren, denn jedes GW hatte einen eigenen IP-Bereich. Statt nun auch 4x 512 IPs wird dank Relay nun aus 1x 2048 vergeben – es sollte einleuchten, daß, und warum daß. sinnvoller, besser ist.

MPW · 19. November 2015 um 00:35

Ich dachte Batman fängt die Dinger ab? Dann muss doch an jedem Batmanknoten im Gatewaymodus auch ein DHCP-Server sitzen, oder?

Oder prüft Batman nochmal separat und sieht sich sonder woanders um? Das ist der Teil, der mir noch nicht so ganz klar ist.

wusel · 19. November 2015 um 07:15

?

https://www.open-mesh.org/projects/batman-adv/wiki/Gateways:

As the whole gateway functionality is based on DHCP, the protocol assumes each gateway runs its own DHCP server and each client runs a DHCP client. When a DHCP client is started it will issue a DHCP request which is broadcasted in the entire network. Every DHCP server will send a reply via unicast back to the client which then has to choose one of the responding DHCP servers as its gateway.[/quote]

Das wäre der Normalfall.

[quote]DHCP behavior with batman-adv gateway client mode enabled:

DHCP requests issued by non-mesh clients will not be broadcasted by batman-adv but only sent to the chosen batman-adv gateway via unicast. The DHCP client will then select the gateway batman-adv prefers as only this gateway replied to the request.

To inform clients possessing a valid DHCP release about a gateway change (the link quality to the gateway could have dropped or the client is roaming around) batman-adv will also inspect incoming DHCP renewal packets. If their destination is not the currently selected gateway and below a certain TQ threshold (currently defaulting to a TQ of 50), the DHCP renewal packet is not forwarded, thereby forcing the client to request a new DHCP lease from a better connected gateway.

Insbesondere die Grafik dort macht den Ablauf imho sehr deutlich?

descilla · 20. November 2015 um 12:06

Magst du mal eure Konfiguration, respektive config-files veröffentlichen?