Fortsetzung der Diskussion von Überblick Alfred Daten:
Momentan bin ich dabei einen Webservice zu schreiben, der periodisch Alfred abfrägt, und Informationen zu den Nodes in eine Datenbank wirft.
Diese Daten kann man dann in sinnvollen Zusammenstellungen auf der Webseite in Tabellen, Auflistungen und als Graphen darstellen, und sollen als json per rest abfragbar sein.
Soll alles so werden, denn momentan scheitert es an mehren Aspekten:
Ich habe drei Tabellen: Eine mit Messpunkten, eine mit allen jemals gesichteten Nodes, deren Daten sind der Hostname und die Mac, und noch eine Status-Tabelle, die als Fremdschlüssel einmal auf einen Messpunkt und einmal auf eine Node zeigt. Darin speichere ich nun die Daten die ich im Laufe der Zeit verfolgen will: Firmware, Uptime, Clients, etc…
Das Problem ist: Gehen wir davon aus, dass durchschnittlich 100 Nodes online sind, dann wächst die Status-Tabelle mit jedem Durchlauf auch um 100 Einträge. Nun, drei/vier Zahlen und ein/zwei Strings sind so 20 bis 100 Bytes, jedoch gemessen auf die Dauer, wie lange das laufen soll wird das schnell sehr viel, vor allem bei kurzen Intervallen.
Zweitens: Ich finde, dass Datenschutz im Freifunk wichtig sein sollte, und leider in vielen Anwendungen zu wenig beachtet wird.
Man muss sich vor Augen halten: Was man hier macht, ist von außen in den persönlichen Lebensbereich von Menschen einzudringen, aus der Sicht der Anwendung sind die Nodes eigentlich nur Sensoren die in den Wohnungen von irgendwelchen Freifunkern stehen.
Das dümmste Beispiel wäre, dass man daraus ablesen kann, ist wann bei jemanden der Strom ausgefallen ist.
Aber anhand der Clients und der längerer Beobachtung dessen Verlaufes, weiss man wann jemand zu Hause ist, oder im Urlaub.
Es interessieren mich nun folgende Fragen:
@stv0g Was in etwa hattest du angedacht?
Wie gehe ich das Problem mit den massiv wachsenden Daten an?
Ich dachte eine Art Vergessen zu Implementieren, die Einträge in der Status-Tabelle sollen nicht älter als 3 Monate werden, jedoch muss man sich um Hand darum kümmern die Relationen innerhalb der Datenbank nicht zu zerstören, jedoch wär damit zumindest ein bisschen Datenschutz gegeben…
Was für Daten sind eigentlich auf lange Sicht überhaupt relevant für eine Community?
Das Projekt kommt leider gar nicht voran, da ich nicht weiß, wie ich das abspeichern soll, und bin erstaunt wie wenig Software es gibt, Daten in Verbindung mit einer Zeitachse verwalten kann.
So klassische Monitoring-Tools sind zwar ganz nett, aber eine RRD-Tool überschreibt sich ja nach einer gewissen Zeitspanne wieder selbst, so dass man immer nur ein Zeitfenster hat, und nicht alle Daten von Anfang an.
Schöne Grüße