Du suchst deine bereits erworbenen Lerninhalte? Dann geht es hier entlang: Zum academy Campus

heise academy Logo
Videokurse

PySpark – Teil 3: Datenverarbeitung mit Spark SQL

Dieser Kurs bietet eine praxisorientierte Einführung in Spark SQL – vom Filtern, Sortieren und Aggregieren von Daten über Joins und Unterabfragen bis hin zur Query-Optimierung. Der Data-Science-Experte Fabio Basler zeigt in seinem Videokurs alle Inhalte praxisnah und Schritt für Schritt. Das neu erworbene Wissen lässt sich durch direktes Mitmachen in Übungsaufgaben und Quizfragen überprüfen und festigen.

Im Essential Pass enthalten

Flexible IT Weiterbildung on demand, schon als monatliches Abo erhältlich

Mehr Infos & Kauf
Sie haben bereits einen academy Pass?
Enterprise
Essential
Professional

PySpark – Teil 3: Datenverarbeitung mit Spark SQL

Online
Stopwatch Icon1:45 h
95,00 *
Überblick

Im dritten Teil unserer PySpark-Reihe steht die Datenverarbeitung mit Spark SQL im Mittelpunkt. Spark SQL ermöglicht es, strukturierte Daten in Apache Spark mit vertrauter SQL-Syntax abzufragen und zu analysieren – kombiniert mit der Skalierbarkeit verteilter Big-Data-Verarbeitung und der nahtlosen Integration von Python.

Wir beginnen mit einem Überblick über die Architektur und Funktionsweise von Spark SQL. Anschließend lernst du, Daten zu filtern, zu sortieren und zu aggregieren. Darüber hinaus vertiefst du dein Wissen durch die Anwendung von Joins, Unterabfragen (Subqueries) und fortgeschritteneren SQL-Abfragen. Zum Schluss erfährst du, wie du deine Abfragen mit dem Catalyst Optimizer optimierst.

Übungsaufgaben begleiten dich durch diesen Kurs. Damit kannst du das Gelernte praktisch anwenden und festigen.

Die Reihe zu PySpark umfasst folgende Kurse:

Klicken zum Abspielen

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Alle Lektionen im Überblick:

  • 1. Vorstellung und Infos zum Kurs

  • 2. Schnelleinstieg in PySpark

  • 3. Datenverarbeitung mit Spark SQL

  • 4. Abschluss

So lernst du mit diesem Videokurs:

In den Videokursen der heise academy lernst du IT-Themen anschaulich und verständlich. Du siehst den Experten bei der praktischen Arbeit zu und lässt dir dabei alles genau erklären. Das Wissen ist in kompakte Lerneinheiten unterteilt, sodass du den Kurs Schritt für Schritt durcharbeiten oder gezielt zu Lektionen springen kannst, die dich interessieren. Die persönliche Lernumgebung der heise academy hält viele Funktionen für dich bereit, die dich beim Lernen unterstützen:

  • Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten

  • Wissensquiz zur Lernkontrolle

  • Lernhistorie und Lernfortschritt

  • Lesezeichen und Notizen

  • Volltextsuche in den Videos

  • Frage-den-Experten-Modul

  • Übungsmaterial zum Mitmachen

  • Responsive Web-App und Videostreaming für alle Endgeräte

Technische Voraussetzungen:

Für diesen Videokurs werden lediglich ein Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.

Foto von Fabio Basler

Fabio Basler

Data Scientist und Statistik-Trainer | Selbstständig

Zum Profil
Enterprise
Essential
Professional

PySpark – Teil 3: Datenverarbeitung mit Spark SQL

Online
Stopwatch Icon1:45 h
95,00 *

Du hast Fragen zu unseren academy Videokursen? Wir helfen dir gern weiter.

Füllen Sie ganz einfach und bequem das Kontaktformular aus und wir werden Ihnen Ihre Fragen schnellstmöglich beantworten.

heise academy Content-Team

content@heise-academy.de

+49 511 5352 599

Telefonisch erreichbar: Mo – Fr | 8.30 – 16 Uhr

Unsere Antworten auf die häufigsten Fragen

Kontaktformular

Bei Betätigen des Absenden-Buttons verarbeiten wir die von Ihnen angegebenen personenbezogenen Daten ausschließlich für den Zweck Ihrer Anfrage. Weitere Informationen zum Datenschutz finden Sie in unserer Datenschutzerklärung.