Apache Cassandra: Vorstellung, Funktionen, Vorteile + erste Schritte

Als echtes verteiltes System verwendet Cassandra keinen Grasp. Alle Cluster sind gleichberechtigt und können jede Datenbankanfrage bearbeiten, was die Leistungsfähigkeit deutlich erhöht. Die Daten liegen auf den Knoten verteilt. Durch das einfache Hinzufügen weiterer Knoten ist das System zudem leicht skalierbar. Nach der Set up gilt es lediglich, die Konfigurationsdateien auf den neuen Knoten zu verteilen. Cassandra liefert dazu geeignete Werkzeuge.

Um die Ausfallsicherheit und im Notfall auch die Wiederherstellung der Daten zu garantieren, verfügt Apache Cassandra über ein bedarfsgerecht konfigurierbares Replikationssystem. Die Fehlertoleranz wird minimiert, indem die Daten automatisch zwischen den Knoten repliziert werden. Ausgefallene Knoten lassen sich leicht ersetzen. Das System bleibt für Anfragen jederzeit verfügbar.

Cassandra bietet zudem eine hohe Verfügbarkeit und Partitionstoleranz. Nach dem CAP-Theorem der Informatik ist es niemals möglich, Konsistenz (Consistency), Verfügbarkeit (Availability) und Partitionstoleranz (Partition tolerance) garantiert gleichzeitig zu erfüllen. Dabei räumt man der Konsistenz, was bedeutet, dass alle Knoten zu jeder Zeit dieselben Daten sehen, wie bei vielen Massive-Information-Systemen die geringste Priorität ein. Nach einem Ausfall lässt sich die Konsistenz durch Datenwiederherstellung zeitnah wieder gewährleisten, wohingegen die beiden anderen Eigenschaften jederzeit sichergestellt sein müssen.

Cassandra-Datenbanken unterstützen das von Google entwickelte Programmiermodell MapReduce für Berechnungen mit großen Datenmengen auf verteilten Systemen. Die eigene Datenbankabfragesprache CQL (Cassandra Question Sprache) ist speziell an die Datenstrukturen von Cassandra angepasst.

Source link

Schreibe einen Kommentar Antwort abbrechen