Plattform

Die Open Source Datenplattform

Kombination von best practices

Beliebte Data Apps, einfach zu verwenden

Stackable bietet Dir eine abgestimmte Auswahl der besten Open-Source Data-Apps wie Kafka, Druid, Trino oder Spark. Speichere, verarbeite und visualisiere Deine Daten mit den neuesten Versionen. Bleibe auf der Höhe der Zeit, nicht hinter ihr.

Alle Data-Apps arbeiten nahtlos zusammen und können im Handumdrehen hinzugefügt oder entfernt werden. Basierend auf Kubernetes läuft es in allen Umgebungen – on prem oder in der Cloud.

Erstelle einzigartige und unternehmensweite Datenarchitekturen. Die Plattform unterstützt z.B. moderne Data Warehouses, Data Lakes, Event Streaming, Machine Learning oder Data Meshes.

Operatoren der Plattform

Stackable Module sind reguläre Kubernetes-Operatoren. Wegen der ausgezeichneten Performance, dem geringen Speicherbedarf sowie der Speicher- und Thread-Sicherheit haben uns dabei für die Programmiersprache Rust entschieden.

Kafka Operator

Der Stackable Kafka Operator ermöglicht das automatisierte Ausrollen und Verwalten von Apache-Kafka in Kubernetes-Clustern. Er unterstützt die Stackable Autorisierung und Überwachung.

Druid Operator

Der Stackable Druid Operator für Kubernetes verwaltet Apache Druid-Cluster. Apache Druid ist eine Echtzeit-Datenbank zur Unterstützung moderner Analyseanwendungen.

Spark Operator

Der Spark Operator ermöglicht, einen Spark-Cluster auf Kubernetes im Standalone-Modus auszurollen. Er bietet auch die Möglichkeit, Spark-Aufträge auf dem Cluster zu starten.

Superset Operator

Der Stackable Apache Superset Operator verwaltet Apache Superset. Apache Superset ist eine moderne Plattform zur Datenexploration und -visualisierung. Mit Stackable wird Superset für die Zusammenarbeit mit Trino und Apache Druid konfiguriert.

Trino Operator

Der Stackable Trino Operator bietet vorkonfigurierten Zugriff auf HDFS oder einen beliebigen S3-kompatiblen Cloud-Speicher. Trino erlaubt föderierte Abfragen aus einer Vielzahl von Datenquellen.

Airflow Operator

Der Stackable Airflow Operator verwaltet Apache Airflow-Cluster. Airflow ist eine Workflow-Engine, die das programmatische Erstellen, Ausführen und überwachen von Daten-Pipelines erlaubt und Ihr Ersatz, wenn Sie Apache Oozie verwenden.

Nifi Operator

Der Stackable Nifi Operator ermöglicht das automatisierte Ausrollen und Verwalten von Apache Nifi. Nifi unterstützt leistungsstarke und skalierbare Datenflüsse.

OPA (OpenPolicyAgent) Operator

Der Stackable OPA (OpenPolicyAgent) Operator verwaltet OPA-Server. Mit OPA können flexibel Regeln und Richtlinien für den Daten-Zugriff „as Code“ definiert werden.

Hbase Operator

Der Stackable Hbase Operator verwaltet Apache HBase-Cluster. HBase ist ein verteilter, skalierbarer Big-Data-Speicher.

HDFS Operator

Der Stackable HDFS Operator verwaltet Apache HDFS-Cluster. HDFS ist ein verteiltes Dateisystem, das den Zugriff auf Daten mit hohem Durchsatz ermöglicht.

Hive Operator

Der Stackable Hive Operator verwaltet Apache Hive. Derzeit unterstützt es den Hive Metastore. Die Data-Warehouse-Software Apache Hive erleichtert das Lesen, Schreiben und Verwalten großer Datensätze, die sich in einem verteilten Speicher befinden, mit SQL.

ZooKeeper Operator

Der Stackable ZooKeeper Operator ermöglicht das automatisierte Ausrollen und Verwalten von Apache ZooKeeper-Ensembles. Apache Zookeeper wird von vielen Big-Data-Produkten als äußerst zuverlässiger Koordinator verteilter Systeme eingesetzt.

OPERATOREN DER PLATTFORM

Kafka Operator

Der Stackable Kafka Operator ermöglicht das automatisierte Ausrollen und Verwalten von Apache-Kafka in Kubernetes-Clustern. Er unterstützt die Stackable Autorisierung und Überwachung.

Druid Operator

Der Stackable Druid Operator für Kubernetes verwaltet Apache Druid-Cluster. Apache Druid ist eine Echtzeit-Datenbank zur Unterstützung moderner Analyseanwendungen.

Spark Operator

Der Spark Operator ermöglicht, einen Spark-Cluster auf Kubernetes im Standalone-Modus auszurollen. Er bietet auch die Möglichkeit, Spark-Aufträge auf dem Cluster zu starten.

Superset Operator

Trino Operator

Der Stackable Trino Operator bietet vorkonfigurierten Zugriff auf HDFS oder einen beliebigen S3-kompatiblen Cloud-Speicher. Trino erlaubt föderierte Abfragen aus einer Vielzahl von Datenquellen.

Airflow Operator

Nifi Operator

Der Stackable Nifi Operator ermöglicht das automatisierte Ausrollen und Verwalten von Apache Nifi. Nifi unterstützt leistungsstarke und skalierbare Datenflüsse.

OPA (OpenPolicyAgent) Operator

Der Stackable OPA (OpenPolicyAgent) Operator verwaltet OPA-Server. Mit OPA können flexibel Regeln und Richtlinien für den Daten-Zugriff „as Code“ definiert werden.

Hbase Operator

Der Stackable Hbase Operator verwaltet Apache HBase-Cluster. HBase ist ein verteilter, skalierbarer Big-Data-Speicher.

HDFS Operator

Der Stackable HDFS Operator verwaltet Apache HDFS-Cluster. HDFS ist ein verteiltes Dateisystem, das den Zugriff auf Daten mit hohem Durchsatz ermöglicht.

Hive Operator

ZooKeeper Operator

So geht's

Von einfachen bis zu komplexen Umgebungen mit Infrastructure-as-Code

Stackable bietet die Flexibilität, sowohl einfache als auch komplexe Datenszenarien zu definieren. So oder so, die Einrichtung ist immer so einfach wie hier:

1. In Schritt eins wählst Du die Stackable-Operatoren für die Data-Apps aus, die du für deine Datenplattform benötigst und installierst sie mit stackablectl oder direkt über Helm.

2. In Schritt zwei installierst Du Deine Data-Apps im Kubernetes Cluster, indem Du die passenden Konfigurationen (CRDs) mit stackablectl oder direkt über kubectl an die Operatoren übergibst.

Alle diese Definitionen werden als Infrastructure-as-Code verwaltet, sodass auch die Einrichtung testbar und wiederholbar bleibt und eine Standardisierung ermöglicht.

1. Operatoren und...

2. ... Konfigurationen

1. Operatoren und...

2. ... Konfigurationen

1. Operatoren und...

2. ... Konfigurationen

1. Operatoren und...

2. ... Konfigurationen

Operator Framework

Der Stackable Operator framework ist eine Rust-Bibliothek, die die schnelle und einheitliche Entwicklung von Kubernetes-Controllern und Operatoren unterstützt.

Docker Images Repository

Das Stackable Docker Image Repository enthält Docker-Dateien und Skripte zur Erstellung von Basis-Images von Open-Source-Produkten, die von Stackable unterstützt werden und in Stackable verwendet werden können.

Newsletter

Zum Newsletter anmelden

Mit dem Stackable Newsletter bist Du immer auf dem Laufenden, wenn es um Updates rund um Stackable geht!

Release 1 der Stackable Data Platform erscheint am 30. Juni - stay tuned!

Plattform

Die Open Source Datenplattform

Beliebte Data Apps, einfach zu verwenden

Von einfachen bis zu komplexen Umgebungen mit Infrastructure-as-Code

Zum Newsletter anmelden

Unternehmen

Support

Get in touch

Unternehmen

Support

Get in touch