Data Science mit R

Seminar Inhouse Individuell

DURCHFÜHRUNG MIT TERMIN

Dauer

21 Stunden

Preis

1.790,00 € netto
2.130,10 € inkl. 19% MwSt.

Nr.

54410

Termine und Orte anzeigen

Jetzt buchen

TERMIN UND ORT NACH ABSPRACHE

Nr.

54410

Dauer

21 Stunden

Inhouse-Paket - Erfahren Sie mehr über unser Inhouse Seminarangebot

Auf Anfrage

Kontaktieren Sie uns für ein Angebot!

On-demand Training

Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Kontaktieren Sie uns

Download als PDF

Zur Merkliste hinzufügen

Kontaktieren Sie uns

In diesem Kurs werden Ihnen grundlegende Kenntnisse über die Programmiersprache R vermittelt, die in den Bereichen Statistik, Data Science und Machine Learning weit verbreitet ist. Sie werden RStudio als Entwicklungsumgebung kennenlernen, die am häufigsten für R verwendet wird. Nach Abschluss des Kurses werden Sie in der Lage sein, Daten aus verschiedenen Formaten einzulesen, Daten mit ggplot2 zu visualisieren und Daten mit dplyr aus tidyverse zu bereinigen (z.B. fehlende Werte ersetzen, Zeilen und Spalten anpassen, neue Spalten erstellen).

Sie werden in der Lage sein, eigene einfache Funktionen zu schreiben und Control Flows (z.B. For-Schleifen, If-Else-Anweisungen) in R umzusetzen. Sie werden das Grundkonzept von tidyverse/dplyr verstehen und in der Lage sein, Data Wrangling und Data Cleaning durchzuführen.

Der Kurs wird Ihnen die verschiedenen Arten des Machine Learning (überwacht, unüberwacht und verstärkt) vorstellen. Sie werden in der Lage sein, Algorithmen in R eigenständig zu trainieren, zu validieren, einen Train-Test Split durchzuführen und Gütekriterien zur Bewertung von Algorithmen zu berechnen und zu interpretieren. Sie werden bekannte Machine Learning Algorithmen wie lineare Regression, logistische Regression, Entscheidungsbaum, Random Forest und k-means Clustering verstehen und in R implementieren können.

Nach Abschluss des Kurses werden Sie in der Lage sein, R eigenständig für Machine Learning und Data Science zu verwenden und Ihr Wissen weiter auszubauen. Der Schwerpunkt des Kurses liegt auf der praktischen Anwendung in RStudio mit Unterstützung des Dozenten.

Lesen Sie mehr

Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

Dieses Seminar richtet sich an Fachleute, die in ihrem Unternehmen in den Bereichen Data Science, Datenanalyse mit R oder verwandten Bereichen wie Machine Learning oder Data Analysis tätig sind oder sein werden. Es konzentriert sich auf den Einsatz von Machine Learning-Algorithmen.

Voraussetzungen

Die Teilnahme am Data Science in R Kurs erfordert keine vorherigen Kenntnisse in R. Es ist jedoch wichtig, grundlegende Programmierkenntnisse in einer anderen Sprache zu haben, da wir in R Variablen erstellen, Werte zuweisen und eigene Funktionen oder for-Schleifen schreiben.

Statistische Grundlagen sind ebenfalls erforderlich. Teilnehmer sollten mit Begriffen wie Mittelwert, Standardabweichung, Median und Normalverteilung vertraut sein. Kenntnisse über das Summenzeichen, das Integral und mathematische Funktionen sind ebenfalls hilfreich. Es ist auch wichtig, die drei logischen Operatoren UND, ODER und NICHT zu kennen.

Da wir Daten mit R analysieren, sollten die Teilnehmer bereits mit der Arbeit mit Daten in Excel oder einer BI-Software vertraut sein, da wir beispielsweise spaltenweise einfache Statistiken wie den Mittelwert oder die Varianz berechnen.

Die Dokumentation und weitere Ressourcen zu R sind hauptsächlich in englischer Sprache verfügbar. Daher werden die Folien dieses Kurses auf Englisch sein. Das Seminar selbst wird jedoch auf Deutsch abgehalten.

Trainingsprogramm

Grundlagen von R:

R und RStudio kennenlernen
Unterschiede von R zu anderen Programmiersprachen verstehen
Datenüberblick verschaffen und erste Diagramme erstellen
Installation von Paketen und deren Laden

dplyr (tidyverse) - Grundlagen:

Tidyverse kennenlernen
Tibble als erweiterte Form von data.frames erkunden
Grundlegende Funktionen von dplyr zur Spaltenauswahl kennenlernen
Nutzung von select(), filter(), rename() und slice()

Datenmanipulation mit dplyr:

Zeilen mit arrange() sortieren
Neue Spalten mit mutate() berechnen
Statistiken mit summarise() erstellen
Verwendung des Pipe Operators %>%
Daten mit group_by() gruppieren
Umgang mit fehlenden Werten: drop_na() und replace_na()

Berechnung von Statistiken mit dplyr:

Wesentliche deskriptive Statistiken anwenden
Zufällige Stichproben ziehen
Berechnung von Korrelationen
Erstellung von Kontingenztabellen

Kontrollstrukturen:

Eigene Funktionen erstellen
Standardparameter für Funktionen festlegen
Anwendung von For-Schleifen
Implementierung von If-Else-Bedingungen

Datenvisualisierung mit ggplot2:

Konzept der Grammar of Graphics verstehen
Nutzung von ggplot2-Layern zur Diagrammerstellung und statistischen Visualisierung
Variabilität oder Festsetzung von Darstellungen (Punktgröße, Farbe, Gruppierung) mithilfe einer Variable
Erstellung mehrerer Subplots, Anpassung und Speicherung von Diagrammen

Daten einlesen und schreiben:

Arbeitsverzeichnis in R und RStudio festlegen
Einlesen und Schreiben von CSV-, Excel- und SPSS-Dateien
Überblick über nützliche Parameter
Verwendung der fread()-Funktion für große Datensätze

Machine Learning:

Einführung
Anwendungsbeispiele von Machine Learning kennenlernen
Unterscheidung zwischen Künstlicher Intelligenz, Machine Learning und Deep Learning
Unterschiede zwischen überwachtem und unüberwachtem Lernen verstehen
Überfitting, Train-Test-Split und Kreuzvalidierung kennenlernen

Lineare Regression:

Daten in Test- und Trainingsdaten aufteilen, Modell erstellen und validieren
Grundlagen der linearen Regression verstehen
Umsetzung der linearen Regression in R
Ergebnisse validieren, z. B. durch die mittlere quadratische Abweichung (mean squared error)

Entscheidungsbaum in R:

Daten in Test- und Trainingsdaten aufteilen, Modell erstellen und validieren
Grundlagen von Entscheidungsbäumen verstehen
Umsetzung eines Entscheidungsbaums in R
Ergebnisse validieren, u. a. durch Verwendung der Verwirrungsmatrix, Sensitivität und Genauigkeit
Anpassung von Hyperparametern während des Trainings

Weitere Machine Learning-Algorithmen in R:

Überblick über Random Forest und K-means erhalten
Umsetzung der Algorithmen in R kennenlernen
Ergebnisse der Algorithmen validieren und interpretieren

Schulungsmethode

In diesem Data Mining Training liegt der Fokus auf der praktischen Anwendung. Die Teilnehmer haben die Möglichkeit, eigenständig mit RStudio zu programmieren, um das Gelernte zu üben und eventuelle Unklarheiten sofort zu klären. Der Trainer steht zur Verfügung, um bei Lösungen zu unterstützen und weiterführende Fragen zu beantworten.

Hinweis

Technik im Data Science mit R Seminar
Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-Mail zugesandt.
Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschalten ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.
In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Hinweis für Online-Schulungen:

Für unsere Online-Schulungen möchten wir Sie darauf hinweisen, dass es von Vorteil ist, wenn Sie über zwei Bildschirme verfügen. Ein zusätzlicher Bildschirm ermöglicht es Ihnen, die Schulungsinhalte auf einem Bildschirm anzuzeigen, während Sie auf dem anderen Bildschirm praktische Übungen durchführen oder Anwendungen parallel öffnen können.

Durch die Verwendung von zwei Bildschirmen können Sie die Schulungsinhalte effektiver verfolgen und gleichzeitig interaktiv an den Übungen teilnehmen, ohne zwischen Fenstern hin- und herwechseln zu müssen.

Wir empfehlen daher, sich im Vorfeld auf die Schulung mit einem zusätzlichen Bildschirm vorzubereiten, um das bestmögliche Lernerlebnis zu gewährleisten

Weitere Seminare aus dem Bereich Data Science, Machine Learning & KI

Weitere Informationen

Anfahrtsinformationen

Sessions

1.790,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training
1.790,00 € Netto
Noch freie Plätze
Jetzt buchen
online Training
Live Online Training

Schulung - Data Science mit R

Inhouse Seminare

Sparen Sie Zeit und Geld mit den Inhouse Seminaren von Integrata

Alle Seminare aus unserem offenen Angebot können Sie auch als Inhouse-Veranstaltung buchen. Im Fokus steht Ihr Unternehmen und Ihre Mitarbeiter. Wir bieten Ihnen die Möglichkeit, individuelle Anforderungen und Anpassungen der Inhalte an Ihr Unternehmen vorzunehmen.

Die individuelle Lösung:

- Individueller Termin
- Individueller Ort, entweder in unseren Trainingszentren oder in Ihren eigenen Räumen
- Auf Wunsch, individuelle, auf Ihre Bedürfnisse zugeschnittene Inhalte

Inhouse Seminare

Das Inhouse-Paket umfasst:

- die Durchführung als Live Online, Hybrid oder Präsenz Training
- die Umsetzung durch praxiserprobte und branchenerfahrene Trainer

In Abhängigkeit von Teilnehmerzahl, Akkreditierung oder Lizenzgebühren können zusätzliche Kosten anfallen. Nicht im Preis enthalten sind dabei z.B. Raum- und Bewirtungskosten, ebenso Mehrkosten durch Seminarmaterialien.

Bitte sprechen Sie uns gerne dazu an und lassen Sie sich jetzt Ihr individuelles Angebot erstellen.

Recevoir le programme par email

Das Seminarprogramm wurde weiterentwickelt

Sie haben einen Termin aus dem Jahr ausgewählt, das Seminarprogramm wurde seither weiterentwickelt. Möchten Sie:

Sehen Sie sich das Programm für oder Ihre Buchung fortsetzen

Envoyer le programme à un collaborateur

Preis

Es entstehen keine zusätzlichen Liefer- & Versandkosten

Schulung - Data Science mit R

Datenanalyse und Statistik ohne Vorkenntnisse