Zum Inhalt springen
DevOps & Cloud

Apache Spark

Verteiltes Framework zur Verarbeitung und Analyse großer Datenmengen.

Apache Spark ist ein quelloffenes Framework für die verteilte Verarbeitung großer Datenmengen. Es verteilt Berechnungen über ein Cluster aus mehreren Rechnern und hält Zwischenergebnisse soweit möglich im Arbeitsspeicher, was viele Analyseaufgaben gegenüber rein festplattenbasierten Ansätzen beschleunigt.

Spark stellt Programmierschnittstellen unter anderem für Scala, Java, Python und R bereit und umfasst Bibliotheken für SQL-Abfragen, Stream-Verarbeitung sowie maschinelles Lernen (MLlib). Damit eignet es sich für Datenpipelines und datenintensive Analysen.

Praxis bei Provimedia

Wofür Provimedia es einsetzt

Provimedia setzt Apache Spark ein, wenn große Datenmengen für Analysen oder KI-Vorhaben verteilt verarbeitet werden müssen.

Apache Spark für Ihr Projekt nutzen?

Lassen Sie uns in einem kostenlosen Gespräch herausfinden, wie wir das für Sie umsetzen.