Bootcamp - Machine Learning und Data Science mit Python

Seminar Inhouse Individuell

DURCHFÜHRUNG MIT TERMIN

Dauer

35 Stunden

Preis

2.490,00 € netto
2.963,10 € inkl. 19% MwSt.

Nr.

54412

Termine und Orte anzeigen

Jetzt buchen

TERMIN UND ORT NACH ABSPRACHE

Nr.

54412

Dauer

35 Stunden

Inhouse-Paket - Erfahren Sie mehr über unser Inhouse Seminarangebot

Auf Anfrage

Kontaktieren Sie uns für ein Angebot!

On-demand Training

Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Kontaktieren Sie uns

Download als PDF

Zur Merkliste hinzufügen

Kontaktieren Sie uns

Dieses einwöchige Data Science Bootcamp beginnt mit den grundlegenden Konzepten von Python für die Datenanalyse und vermittelt alle erforderlichen Kenntnisse, um am Ende Machine Learning Algorithmen mit scikit-learn zu programmieren. In diesem intensiven Seminar werden die Grundlagen eines Data Scientist erlernt.

Die Algorithmen werden theoretisch erklärt, wobei der Schwerpunkt auf der praktischen Umsetzung der Datenanalyse und Algorithmen in Python liegt. Am Ende des Seminars sind die Teilnehmer in der Lage, eigenständig erste Datenanalysen durchzuführen, Machine Learning Algorithmen anzuwenden und die Ergebnisse zu interpretieren.

Besonderes Augenmerk wird auf das Paket pandas gelegt, da es in den Bereichen Data Science, Data Engineering und Data Mining Anwendung findet. Die wichtigsten Schritte zur Datenaufbereitung werden geübt. Für die Erstellung von Plots und Grafiken wird das Paket seaborn verwendet, mit einer kurzen Einführung in matplotlib. Matplotlib bietet eine Vielzahl von Anpassungsmöglichkeiten für Plots, während seaborn komplexe Plots mit wenig Code erstellen kann. Es werden auch die Grundlagen von numpy vermittelt, um dieses wichtige Paket im Data Mining einsetzen zu können.

Nach einer Einführung in die Grundlagen von Python (Datenstrukturen, Schreiben eigener Funktionen) und einer Erläuterung von pandas für die Datenanalyse folgt der nächste Schritt zur Weiterbildung als Data Scientist: Die Erklärung von Machine Learning Algorithmen und deren Umsetzung in Python mit dem Paket scikit-learn. Dabei werden die bekanntesten Algorithmen (Lineare und logistische Regression, Entscheidungsbaum, Random Forest, SVM, Ensemble Learning, AdaBoost, K-Means, DBSCAN Clustering) behandelt.

Nach Abschluss dieser einwöchigen Fortbildung werden die Teilnehmer in der Lage sein, Daten aus verschiedenen Formaten und Datenbanken einzulesen, Daten zu plotten und zu bereinigen sowie Berechnungen durchzuführen. Sie werden die wichtigsten Datentypen in Python kennen, einfache Funktionen schreiben können und das Konzept von Control Flows verstehen. Darüber hinaus werden sie in der Lage sein, Data Wrangling und Data Cleaning mit pandas durchzuführen und Daten für die Umsetzung von Algorithmen mit scikit-learn vorzubereiten.

Ein wichtiger Bestandteil des Kurses ist das eigenständige Arbeiten und Lösen von Übungsaufgaben (mit Unterstützung des Dozenten), um das Gelernte direkt in der Praxis umzusetzen und in Python zu programmieren.

Lesen Sie mehr

Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

Die Weiterbildung zum Data Scientist, die über einen Zeitraum von fünf Tagen stattfindet, richtet sich an Personen, die Interesse daran haben, Python zu erlernen, um Datenanalysen durchzuführen. Neben einer Einführung in Python werden in diesem Kurs auch Grundlagen des Maschinenlernens behandelt.

Voraussetzungen

Unser Data Science Bootcamp erfordert keine vorherigen Kenntnisse in Python. Es ist jedoch wichtig, dass die Teilnehmer über Grundkenntnisse in einer anderen Programmiersprache verfügen und wissen, was eine Variable ist, wie man einer Variable einen Wert zuweist und was Funktionen und for-Schleifen sind.

Grundkenntnisse in Statistik sind für die Data Mining Weiterbildung erforderlich. Es ist wichtig, dass die Teilnehmer wissen, was ein Mittelwert, Median, Normalverteilung und Standardabweichung sind. Da gelegentlich mathematische Formeln verwendet werden, sollten die Teilnehmer mit mathematischen Symbolen wie dem Integral, dem Summenzeichen und Konzepten wie Funktionen, Ableitungen und der Exponentialfunktion vertraut sein. Wir verwenden auch logische Operatoren, daher sind Kenntnisse der booleschen Algebra mit den Operatoren Nicht-Und-Oder sehr hilfreich.

Die Teilnehmer haben in der Regel bereits mit Daten in einer BI-Software oder in Excel gearbeitet und sind daher mit einfachen Berechnungen vertraut, die auf Daten angewendet werden können (z.B. Berechnung der Summe einer Spalte).

Die Schulungssprache ist Deutsch. Da die Dokumentation von Python und die Fachbegriffe im Bereich Machine Learning meistens auf Englisch sind, werden die Folien im Seminar auf Englisch gehalten. Grundlegende Englischkenntnisse zum Lesen von Texten sind daher sehr hilfreich.

Trainingsprogramm

Python-Essentials:

Installation von neuen Modulen
Jupyter Notebooks / Jupyter Lab
Verwendung von Funktionen und Methoden
Python im Vergleich zu anderen Sprachen

Grundlegende Datenstrukturen:

Einführung in grundlegende Datentypen (String, Integer, Float, NaN)
Erläuterung wichtiger Strukturen: Liste, Tupel, Wörterbuch
Einführung in List Comprehension

pandas-Datenverarbeitung - DataFrames:

Erkunden der DataFrame-Struktur (Zeilen, Spalten)
Auswahl von Zeilen/Spalten
Erstellen, Löschen und Bearbeiten von Zeilen/Spalten
Boolean Indexing für Zeilenauswahl

Statistiken direkt in pandas DataFrames berechnen:

Einfache Statistiken auf DataFrames (Mittelwert, Min, Max, Summe, Median, Varianz usw.)
Daten aggregieren und filtern
Fehlende Werte behandeln
Kreuztabellen erstellen

Programmablaufsteuerung:

Eigene Funktionen erstellen
Default-Parameter in Funktionen festlegen (Positional und Keyword Arguments)
For-Schleifen verwenden
If-Else-Bedingungen implementieren

Datendarstellung mit seaborn / matplotlib:

Grundlagen von matplotlib kennenlernen
Anpassung von Achsen, Legende, Titel
Diagramme speichern
In seaborn verschiedene Diagrammtypen erstellen
Darstellungen variieren/festsetzen (Größe, Farbe, Gruppierung)

Daten einlesen und speichern:

Arbeitsverzeichnis in Python und spyder festlegen
Einlesen und Speichern von CSV- und Excel-Dateien
Daten von URLs beziehen
Überblick über Parameter
Lesen und Schreiben im Python-Format pickle
Umgang mit großen Daten

Datenbankzugriff mit SQLAlchemy:

Verbindung zur Datenbank herstellen
Tabellen extrahieren/schreiben
SQL-Befehle an die Datenbank senden
Datenabfragen per SQL-Statement direkt aus Python

Numpy-Einführung:

Einführung in numpy-Arrays und deren Attribute
Arrays erstellen und befüllen
Mathematische Operationen und Statistikfunktionen

Datenverarbeitung:

Daten normalisieren
Fehlende Werte ergänzen
Dummy-Variablen und One-Hot-Encoding

Machine Learning-Überblick:

Grundlagen des Machine Learning
Praktische Anwendungen
Unterschiede von KI, Machine Learning und Deep Learning
Überwachtes und unüberwachtes Lernen
Vermeidung von Overfitting, Train-Test-Split

Lineare Regression mit scikit-learn:

Aufteilung der Daten, Modellbau und Validierung
Grundlagen der linearen Regression
Implementierung in Python mit scikit-learn
Validierung der Ergebnisse (MSE)

Logistische Regression mit statsmodels:

Verwendung von statsmodels für statistische Modelle
Modellbau und Validierung
Grundlagen der logistischen Regression
Ergebnisvalidierung

Entscheidungsbaum mit scikit-learn:

Datenaufteilung, Modellbau und Validierung
Grundlagen des Entscheidungsbaums
Implementierung in Python
Validierung der Ergebnisse (u.a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
Anpassung von Hyperparametern

Ensemblemethoden (+ AdaBoost):

Erstellung und Training von Ensembles mit scikit-learn
Bagging und Boosting
Grundlagen von AdaBoost für Klassifikation und Regression
Implementierung und Validierung

Random Forest:

Datenaufteilung, Modellbau und Validierung
Grundlagen des Random-Forest-Algorithmus
Validierung der Ergebnisse
Out-of-bag error
Random Forest für Regression
Anpassung von Hyperparametern

Weitere Algorithmen im Überblick:

Einführung in K-nearest Neighbor und einfache neuronale Netzwerke (MLP) mit scikit-learn
Implementierung und Validierung
Anwendung weiterer Algorithmen mit scikit-learn

Grid Search & Cross Validation:

Kreuzvalidierung und Grid Search mit scikit-learn
Automatisierte Suche nach Hyperparametern
Training des finalen Modells nach Kreuzvalidierung

Clustering (K-Means, DBSCAN):

Erstellung und Validierung von Cluster-Modellen
Grundlagen von K-Means und DBSCAN
Implementierung und Validierung

Abschluss und Fallstudie:

Auswahl des geeigneten Algorithmus
Visualisierung von Entscheidungsgrenzen
Fallstudie zur Wiederholung und Diskussion

Schulungsmethode

Unser Fokus in der umfangreichen Data Science Weiterbildung liegt auf der praktischen Anwendung. Die Teilnehmer haben die Möglichkeit, eigenständig Übungsaufgaben in Python mit der Entwicklungsumgebung Spyder zu bearbeiten, um die neuen Konzepte besser zu verstehen. Bei auftretenden Fragen oder Unklarheiten steht der Trainer direkt zur Verfügung, um die Teilnehmer zu unterstützen und einen hohen Lernerfolg zu gewährleisten.

Hinweis

Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-Mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschaltet ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.
Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Hinweis für Online-Schulungen:

Für unsere Online-Schulungen möchten wir Sie darauf hinweisen, dass es von Vorteil ist, wenn Sie über zwei Bildschirme verfügen. Ein zusätzlicher Bildschirm ermöglicht es Ihnen, die Schulungsinhalte auf einem Bildschirm anzuzeigen, während Sie auf dem anderen Bildschirm praktische Übungen durchführen oder Anwendungen parallel öffnen können.

Durch die Verwendung von zwei Bildschirmen können Sie die Schulungsinhalte effektiver verfolgen und gleichzeitig interaktiv an den Übungen teilnehmen, ohne zwischen Fenstern hin- und herwechseln zu müssen.

Wir empfehlen daher, sich im Vorfeld auf die Schulung mit einem zusätzlichen Bildschirm vorzubereiten, um das bestmögliche Lernerlebnis zu gewährleisten

Weitere Seminare aus dem Bereich Data Science, Machine Learning & KI

Weitere Informationen

Anfahrtsinformationen

Sessions

2.490,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training
2.490,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training
2.490,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training

Schulung - Bootcamp - Machine Learning und Data Science mit Python

Inhouse Seminare

Sparen Sie Zeit und Geld mit den Inhouse Seminaren von Integrata

Alle Seminare aus unserem offenen Angebot können Sie auch als Inhouse-Veranstaltung buchen. Im Fokus steht Ihr Unternehmen und Ihre Mitarbeiter. Wir bieten Ihnen die Möglichkeit, individuelle Anforderungen und Anpassungen der Inhalte an Ihr Unternehmen vorzunehmen.

Die individuelle Lösung:

- Individueller Termin
- Individueller Ort, entweder in unseren Trainingszentren oder in Ihren eigenen Räumen
- Auf Wunsch, individuelle, auf Ihre Bedürfnisse zugeschnittene Inhalte

Inhouse Seminare

Das Inhouse-Paket umfasst:

- die Durchführung als Live Online, Hybrid oder Präsenz Training
- die Umsetzung durch praxiserprobte und branchenerfahrene Trainer

In Abhängigkeit von Teilnehmerzahl, Akkreditierung oder Lizenzgebühren können zusätzliche Kosten anfallen. Nicht im Preis enthalten sind dabei z.B. Raum- und Bewirtungskosten, ebenso Mehrkosten durch Seminarmaterialien.

Bitte sprechen Sie uns gerne dazu an und lassen Sie sich jetzt Ihr individuelles Angebot erstellen.

Recevoir le programme par email

Das Seminarprogramm wurde weiterentwickelt

Sie haben einen Termin aus dem Jahr ausgewählt, das Seminarprogramm wurde seither weiterentwickelt. Möchten Sie:

Sehen Sie sich das Programm für oder Ihre Buchung fortsetzen

Envoyer le programme à un collaborateur

Preis

Es entstehen keine zusätzlichen Liefer- & Versandkosten

Schulung - Bootcamp - Machine Learning und Data Science mit Python