Autoupdater-server check_mk localcheck

@pvitt
Du hattest Dich daran gemacht, da einen Check zu bauen, um einen Graphen zu bekommen für

  • a) Manifests abgeholt „ok“ vs „fail“
  • b) Images abgeholg „OK“ vs „fail“

Ich vermute mal, dass das ein Parsing des webserver(-apache?)-Logs ist.
Wie sollte man da eine Metrik für erstellen? OK/Fail-Rate binnen der letzten Stunde?
OK-Total binnen der letzten Stunde?
Wie willst Du unterschiedliche Firmware-Stände unterscheiden, wenn da z.B.

  • eine stable und eine experimental liegt.
  • Oder eine für Siegen und eine für Hilchenbach?

(Nur um mal zwei Orte zu nennen. Potentiell möchte ich gerne ähnlich wie beim Mapserver eigentlich gern auch den Firmware-Server zentralisieren, damit das Monitoring einfacher wird.)

Exakt.

Ich hab im ersten Schuss einfach nur das aktuelle Logfile geparst. Das heißt also, dass die Requests/Node über den Tag stündlich steigen. Nachteil ist, dass in der Stunde nach dem Logroll eventuelle Warnungen verschwinden.
Eine OK/Fail-Rate finde ich auf den ersten Blick recht unattraktiv. Viel mehr interessiert mich der absolute Werte der Fails. Wenn der größer 0 ist, versucht mindestens ein Client, ein/e Manifest/Firmware abzurufen, die es nicht gibt. Und dann sollte man mal schauen, warum.

Naja, das kann man am Pfad der angefragten Datei erkennen. Ich habe mir aber noch keine Gedanken gemacht, ob man das automatisieren kann (dass der Parser also automatisch eine neue Domain erkennen würde). Prinzipiell sollte das mit einer RegEx aber machbar sein.

Würde dir das Wissen (welche Domäne, welche Firmware-Version) denn einen Mehrwert bringen? Sobald man erkennt, dass ein/e Manifest/Firmware angefragt wird, die nicht da ist, muss man ja eh mal genauer schauen. Und dann sieht man ja, was angefragt wurde.
Andersherum würde man natürlich die Möglichkeit bekommen, abzugleichen, ob alle Nodes mit aktivem Autoupdater auch den Firmware-Server erreichen.