Einführung in Data Science für Marktforscher/innen mit R / Online / Data Science und Statistik
Data Scientist: The Sexiest Job of the 21st Century so prophezeite vor zehn Jahren die Harvard Business Review. Mittlerweile hat sich Data Science in allen datengetriebenen, innovativen Unternehmen etabliert. Die klassische Marktforschung gerät dabei zunehmend aus dem Fokus der Chefetagen.
Dieses Seminar wendet sich daher an Marktforscher/innen, die einen Einblick in Data Science anhand operativer Fragestellungen gewinnen wollen und bereits über Grundkenntnisse in der Open-Source-Entwickungsumgebung R verfügen.
Das Seminar nimmt Anleihen bei R for Data Science: Import, Tidy, Transform, Visualize, and Model Data von Hadley Wickham und An Introduction to Statistical Learning with Applications in R, 2nd edition von Gareth James et.al. Ersteres kann online frei als HTML-Edition, Statistical Learning ebenfalls frei als PDF-Datei geladen werden. Beide Bücher werden auch im Seminar zur individuellen Nutzung bereitgestellt.
Im Vordergrund des Seminars steht die eigene praktische Anwendung von Befehlen und Methoden aus Data-Science-relevanten R-Packages. Anhand von beispielhaften Datensätzen werden Wege der Datenaufbereitung für das maschinelle Lernen geübt. Anschließend folgen Modellentwicklung, Prognose und Kommunikation der Ergebnisse. Der Beispieldatensatz mit Marktforschungsbezug stammt aus einem US-amerikanischen Direct-Marketing-Case.
Als Modelle werden zunächst die Lineare Regression zur Verdeutlichung grundlegender Fragen und sodann Entscheidungs- und Regressionsbäume verwendet. Baumverfahren eignen sich bestens zur Visualisierung und Kommunikation von Prognosen. Davon ausgehend erschließen sich performantere Verfahren wie Random Forests bis hin zu XGBoost.
Für das Seminar werden in der RStudio-Cloud-Workspaces teilnehmerindividuell bereitgestellt. Man benötigt daher nur einen Webbrowser. Somit gibt es keine Probleme mit der genutzten R-Version und dem Nachladen benötigter Packages.
Am Ende des Seminars werden alle Teilnehmer/innen mit den R-Werkzeugen einen vollständigen Data Science Use Case realisiert haben. Die eigene R-Studio-Cloud-Arbeitsumgebung kann abschließend heruntergeladen und in einer lokalen R-Installation weiterverwendet werden.
Lernziele
- Prozess und Workflow von Data Science-Projekten nachvollziehen
- Elementare Grundlagen von Machine Learning (ML)/Predictive Modelling verstehen
- Die gängigsten Methoden von Supervised und Unsupervised ML einordnen
- Mit dem dplyr-Package Daten bereinigen, Variablen transformieren und aggregieren, mit dem gglpot2-Package explorative Datenanalyse visualisieren und mit dem map-Befehl aus dem purr-Package Funktionen auf Datensätze anwenden
- Datensätze für das Training und die Evaluierung von ML-Modellen aufteilen
- Einfache lineare Modelle sowie Entscheidungs- und Regressionsbäume erstellen, visualisieren, die Ergebnisse interpretieren und für Vorhersagen nutzen
- Eigene Funktionen für die Automatisierung von Prozessen schreiben
- Reproduzierbare HTML-Reports mit R-Markdown erstellen
- Mit Shiny Prognosen als interaktive Weboberflächen bereitstellen
Für wen gedacht?
Das Seminar erfordert nur elementare R-Kenntnisse und richtet sich anTeilnehmer/innen mit Grundkenntnissen in R, die einen anwendungsorientierten Einblick in Data Science, Machine Learning und Predictive Modelling erhalten wollen.
Methoden
Kurze Vorträge des Referenten, selbständiges Arbeiten allein oder auch in Kleingruppen in Breakout-Sessions mit den Beispieldatensätzen.
Die persönlichen RStudio-Cloud-Arbeitsumgebungen enthalten den im Seminar verwendeten R-Code sowie Erläuterungen in Form von R-Markdown-Dateien. So lassen sich schnell die Arbeitsschritte nachvollziehen, ohne mitschreiben zu müssen.
Programm
- Einführung in den Data Science-Workflow mit R
- Überblick über wesentliche Machine-Learning-Verfahren
- Erläuterung des tidyverse-Ansatzes in R
- Eigenes Arbeiten mit simulierten Datensätzen sowie einem in Base-R mitgelieferten Datensatz
- Explorative Datenanalyse eines Direct-Marketing-Datensatzes
- Entwicklung von Regressions- und Entscheidungsbäumen, um Umsatzgrößen vorherzusagen
- Reporting des Use Cases in R-Markdown und ggf. Flexdashboard
- Entwicklung einer Shiny-Anwendung, mit der sich Umsatzerwartungen prognostizieren lassen
Modalitäten
Seminarmodalitäten
Anmeldung
Bitte melden Sie Ihre Teilnahme möglichst bis 6 Wochen vor Seminarbeginn über das jeweilige Anmeldeformular auf der BVM-Website an. Wenn Sie sich per Brief oder Fax anmelden möchten, wenden Sie sich bitte an die BVM-Geschäftsstelle. Nach der Anmeldung erhalten Sie eine Anmeldebestätigung.
Gebühren
Die Teilnahmegebühren beinhalten digitale Seminarunterlagen, Tagungsgetränke, Snacks und Mittagessen an allen Präsenz-Seminartagen. Die Gebühren der einzelnen Seminare entnehmen Sie bitte den Veranstaltungsbeschreibungen. Die Teilnahmegebühr wird sofort nach Rechnungsstellung ohne Abzüge fällig. Die Kosten für Anreise und Übernachtung tragen die Teilnehmer/innen selbst.
Veranstaltungsorte
Finden Seminare nicht online statt, werden sie entweder im NH Collection oder in der BVM-Geschäftsstelle durchgeführt.
Die entsprechenden Informationen dazu erhalten Sie mit der Anmeldebestätigung.
NH Collection Berlin-Mitte am Checkpoint Charlie
Leipziger Straße 106-111
10117 Berlin
Tel.: +49 30 203760
E-Mail: nhberlinmitte@nh-hotels.com
BVM-Bundesgeschäftsstelle
Friedrichstr. 187
10117 Berlin
Tel.: +49 30 9203128-34
E-Mail: seminar-anmeldung@bvm.org
Zimmerreservierung
Empfehlungen und Informationen zu Abrufkontingenten erhalten Sie mit der Bestätigung, dass das Seminar stattfindet. Das NH Collection Berlin-Mitte am Checkpoint Charlie und das MotelOne am Leipziger Platz sind fußläufig zu den Veranstaltungsorten erreichbar. Die Reservierung und Übernachtungskosten übernehmen die Teilnehmer/innen selbst.
Teilnehmer
Die Teilnehmeranzahl pro Seminar beträgt mindestens 6 Personen.
Rabatt für Frühbucher
Für Seminare, die bis zu den jeweiligen Stichtagen im Frühjahr und Herbst gebucht werden, wird folgender Rabatt gewährt:
a) 100,- Euro für Ein-Tagesseminare
b) 200,- Euro für Zwei- und Mehrtagesseminare
Rücktritt
Eine Stornierung der Seminarteilnahme ist schriftlich (per Post, Fax oder E-Mail) vorzunehmen. Bei Stornierung bis spätestens 31 Tage vor Beginn eines gebuchten Seminars, wird die Teilnahmegebühr in voller Höhe zurückerstattet. Bis 21 Tage vor Seminarbeginn wird eine Bearbeitungsgebühr in Höhe von 120 Euro erhoben. Danach werden die Teilnahmegebühren in voller Höhe fällig. Ohne zusätzliche Kosten kann ein/e Ersatzteilnehmer/in genannt werden. Ermäßigte Teilnahmegebühren können Ersatzteilnehmer/innen jedoch nur bei bestehender BVM-Mitgliedschaft in Anspruch nehmen.
Absage durch den BVM
Haben sich bis 10 Tage vor Beginn eines Präsenz-Seminars bzw. 7 Tage vor Beginn eines Online-Seminars weniger als 6 Teilnehmer angemeldet, kann der BVM die Veranstaltung absagen. Dies gilt auch für den Fall, dass durch die kurzfristige Absage der Seminarleitung ein Ersatz ohne Verlegung des Seminars nicht gefunden werden kann. In diesem Fall werden die Teilnahmegebühren in voller Höhe zurückerstattet. Stornogebühren des BVM fallen nicht an.
Stornierungskosten für vorgenommene Reisebuchungen bei Ausfall eines Seminars können vom BVM nicht übernommen werden. Der BVM behält sich vor, Änderungen im Seminarprogramm vorzunehmen und bei Absage der Seminarleitung für Ersatz zu sorgen.
Das aktuelle Seminarprogramm finden Sie stets auf der BVM-Website.
Allgemeine Datenschutzhinweise
Die für die Buchung von BVM-Seminaren elektronisch erfassten Daten werden nach der Veranstaltung nicht weiterverwendet, wenn Sie nicht eingewilligt haben, über das BVM-Seminarangebot oder Verbandsservices informiert zu werden. Weitere Informationen finden sie in der Datenschutzerklärung des BVM.
Datenschutzhinweis zur technischen Durchführung von Online-Seminaren
Für die Durchführung von Videokonferenzen setzt der BVM Berufsverband Deutscher Markt- und Sozialforscher e.V. (Verantwortlicher) einen Dienst des Auftragsverarbeiters Zoom Video Communications, Inc. (55 Almaden Blvd, Suite 600, San Jose, Kalifornien (95113), USA - nachfolgend „Zoom“) ein. Die entsprechenden Verträge (Auftragsverarbeitungsvereinbarung und Standard-Datenschutz-Klauseln) wurden abgeschlossen. Zudem wurden die Datenschutzeinstellungen so gesetzt, dass die Meetingdaten grundsätzlich über europäische Server verarbeitet werden. Weitere Informationen zur Verarbeitung Ihrer Daten und Ihren Rechten finden auf der Website von Zoom. Werden Daten außerhalb der Europäischen Union und des europäischen Wirtschaftsraums und in ein Land, welches kein angemessenes Datenschutzniveau bietet übertragen, bestehen gewisse Risiken. Bei einer Übertragung der Daten in die USA (derzeit ein Land ohne angemessenes Datenschutzniveau) besteht die Gefahr, dass Ihre Daten von amerikanischen Behörden zu Kontroll- und Überwachungszwecken verarbeitet werden können, ohne dass Ihnen möglicherweise Rechtsbehelfsmöglichkeiten zustehen.
Urheberrechte/Nutzung der Seminarunterlagen
Jegliche Inhalte des Seminars dürfen nur für eigene und interne Markt- und Sozialforschungszwecke der Teilnehmenden und des Arbeitgebers der Seminarteilnehmer/innen genutzt werden. Sie dürfen nicht für Werbung verwendet und ohne Zustimmung des BVM nicht an Dritte – auch nicht in Form eigener Lehr- und Weiterbildungsveranstaltungen, an denen Dritte teilnehmen können – weitergegeben werden.
Die den Teilnehmenden überlassenen Seminarunterlagen, sei es in papierener oder elektronischer Form, dürfen nur für interne Zwecke des Arbeitgebers des Teilnehmenden (z.B. interne, auf die Mitarbeiter des Arbeitgebers beschränkte Weiterbildungs- und Lehrveranstaltungen) vervielfältigt und verbreitet werden. Ein Zugänglichmachen im Internet oder in und mit Hilfe anderer Medien ist nicht gestattet.
Gerichtsstand ist Berlin.
Stand: August 2020