Du suchst deine bereits erworbenen Lerninhalte? Dann geht es hier entlang: Zum academy Campus
Datenaufbereitung ist der wichtigste Teil zu Beginn eines Machine-Learning-Projekts. Lerne diese Aufgabe mit Python, NumPy und pandas zu erledigen.
Du frischst deine Python-Grundlagen auf und legst damit das Fundament für die weiterführenden Themen des Classrooms.
Du lernst, wie du mit NumPy große Mengen numerischer Daten effizient verarbeitest und analysierst.
Du erhältst einen fundierten Einstieg in pandas als Standardbibliothek für die Arbeit mit heterogenen Datenstrukturen.
Ohne eine gründliche Datenaufbereitung, solltest du kein Machine-Learning-Projekt in Python beginnen. Zwei mächtige Tools helfen dir bei dieser Aufgabe. Unser Experte widmet sich nach einer kurzen Python-Einführung zunächst NumPy. Dabei handelt es sich um eine numerische Bibliothek für Python, welche die Grundlage vieler anderer Machine-Learning-Module bildet. Du lernst den Unterschied zwischen NumPy-Arrays und herkömmlichen Python-Datenstrukturen kennen und erfährst, wie du (Vektor-)Funktionen auf NumPy-Arrays anwendest.
Als zweites Tool lernst du pandas kennen. Dieses dient bevorzugt dazu, heterogene, also auch nicht-numerische Datenstrukturen, zu bearbeiten. Du erhältst einen ersten Einblick in die Möglichkeiten von pandas, das in Sachen Datenverarbeitung kaum Wünsche offen lässt.
Der Classroom richtet sich an alle Personen aus dem Softwarebereich mit Programmiererfahrung in einer höheren Programmiersprache (idealerweise Python), die einen fundierten, praxisorientierten Einstieg in das maschinelle Lernen suchen. Angesprochen sind insbesondere Softwareentwicklerinnen und -entwickler, Data Analysts sowie technisch versierte Fachkräfte, die Machine-Learning-Methoden verstehen, einordnen und in eigenen Projekten anwenden möchten.
Kenntnisse einer höheren Programmiersprache werden vorausgesetzt. Elementare Python-Grundlagen sind hilfreich. Die Python-typischen Spracheigenschaften, auf die es beim Machine Learning besonders ankommt, werden zu Beginn kurz aufgefrischt.
Auffrischung der Python-Grundlagen mit besonderem Fokus auf Spracheigenschaften, die beim Machine Learning relevant sind
Einführung in NumPy als numerische Bibliothek
Unterschiede zwischen NumPy-Arrays und herkömmlichen Python-Datenstrukturen
Anwendung von Vektorfunktionen auf NumPy-Arrays zur effizienten Verarbeitung großer numerischer Datenmengen
Einstieg in pandas als Standardbibliothek für die Arbeit mit heterogenen und nicht-numerischen Datenstrukturen
Praktische Möglichkeiten von pandas zur umfassenden Datenverarbeitung und Datenaufbereitung
Christian Heitzmann ist Java-, Python- und Spring-zertifizierter Softwareentwickler mit einem CAS in Machine Learning und Inhaber der SimplexaCode AG in Luzern. Er entwickelt seit über 20 Jahren Software und gibt seit über 12 Jahren Unterricht und Kurse im Bereich der Java- und Python-Programmierung, Mathematik und Algorithmik. Als Technical Writer dokumentiert er Softwarearchitekturen für Unternehmen und schreibt regelmäßig Artikel für IT-Fachzeitschriften.

