Du suchst deine bereits erworbenen Lerninhalte? Dann geht es hier entlang: Zum academy Campus
Dieser Kurs bietet eine praxisorientierte Einführung in Spark SQL – vom Filtern, Sortieren und Aggregieren von Daten über Joins und Unterabfragen bis hin zur Query-Optimierung. Der Data-Science-Experte Fabio Basler zeigt in seinem Videokurs alle Inhalte praxisnah und Schritt für Schritt. Das neu erworbene Wissen lässt sich durch direktes Mitmachen in Übungsaufgaben und Quizfragen überprüfen und festigen.
Flexible IT Weiterbildung on demand, schon als monatliches Abo erhältlich
Im dritten Teil unserer PySpark-Reihe steht die Datenverarbeitung mit Spark SQL im Mittelpunkt. Spark SQL ermöglicht es, strukturierte Daten in Apache Spark mit vertrauter SQL-Syntax abzufragen und zu analysieren – kombiniert mit der Skalierbarkeit verteilter Big-Data-Verarbeitung und der nahtlosen Integration von Python.
Wir beginnen mit einem Überblick über die Architektur und Funktionsweise von Spark SQL. Anschließend lernst du, Daten zu filtern, zu sortieren und zu aggregieren. Darüber hinaus vertiefst du dein Wissen durch die Anwendung von Joins, Unterabfragen (Subqueries) und fortgeschritteneren SQL-Abfragen. Zum Schluss erfährst du, wie du deine Abfragen mit dem Catalyst Optimizer optimierst.
Übungsaufgaben begleiten dich durch diesen Kurs. Damit kannst du das Gelernte praktisch anwenden und festigen.
Die Reihe zu PySpark umfasst folgende Kurse:
Klicken zum Abspielen
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Herzlich willkommen zu diesem Kurs
Kapitelüberblick
Kurzeinführung in PySpark
Kapitelüberblick
Theorie: Überblick über Spark SQL und seine Architektur
Spark SQL in der Praxis
Einfache Filterungen
Erweiterte Filterungen
Ordnen und Sortieren von Datensätzen
Aufgabe: Sortieren und Filtern von Datensätzen
Lösung: Sortieren und Filtern von Datensätzen
Gruppierungen und Aggregationen
Fehlende Daten mit NULL
Join-Operationen zwischen DataFrames
Unterabfragen (Subqueries)
Komplexere Abfragen
Catalyst Optimizer
Aufgabe: Gruppierungen und Joins
Lösung: Gruppierungen und Joins
Quiz: Datenverarbeitung mit Spark SQL
Fazit und Kursabschluss
In den Videokursen der heise academy lernst du IT-Themen anschaulich und verständlich. Du siehst den Experten bei der praktischen Arbeit zu und lässt dir dabei alles genau erklären. Das Wissen ist in kompakte Lerneinheiten unterteilt, sodass du den Kurs Schritt für Schritt durcharbeiten oder gezielt zu Lektionen springen kannst, die dich interessieren. Die persönliche Lernumgebung der heise academy hält viele Funktionen für dich bereit, die dich beim Lernen unterstützen:
Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten
Wissensquiz zur Lernkontrolle
Lernhistorie und Lernfortschritt
Lesezeichen und Notizen
Volltextsuche in den Videos
Frage-den-Experten-Modul
Übungsmaterial zum Mitmachen
Responsive Web-App und Videostreaming für alle Endgeräte
Für diesen Videokurs werden lediglich ein Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.
Fabio Basler hat schon zu Beginn seines Studiums eine große Leidenschaft für die Methoden der Statistik und Data Science entwickelt. Über mehrere Semester hinweg konnte er als Tutor zahlreiche Studierende erfolgreich auf ihre Prüfungen und den Berufsalltag vorbereiten. Fabio Basler arbeitet als Datenanalyst in einem großen Industriekonzern. Mit großer Freude am Unterrichten gibt er sein Wissen in Online-Kursen und Seminaren weiter.
Füllen Sie ganz einfach und bequem das Kontaktformular aus und wir werden Ihnen Ihre Fragen schnellstmöglich beantworten.
Telefonisch erreichbar: Mo – Fr | 8.30 – 16 Uhr

