Seitenanfang

Data Science als effizienter Workflow / Online / Data Science und Statistik

Für die Entwicklung und den Einsatz von Data-Science-(DS)-Verfahren und Machine-Learning-(ML)-Modellen in der Marktforschung ist die R-Open-Source-Programmierumgebung das Mittel der Wahl. Vor allem, wenn man sich mit einem sozialwissenschaflich-statistischen Hintergrund mit dieser Thematik beschäftigt - und überdies überzeugende Visualisierungen der Ergebnisse erforderlich sind.

Sollen in der Marktforschung regelmäßig ML-Modelle angewendet werden, kann das Arbeiten mit den relevanten R-Funktionen und Packages aber sehr zeitaufwändig und unübersichtlich werden. Denn es gibt keine einheitliche Eingabesyntax bei der Vielzahl unterschiedlicher ML-Methoden. Bei der Ergebnisausgabe wird es meist noch unübersichtlicher.

Aber es bieten sich mittlerweile gute Lösungen für diese Herausforderung an: Mehrere neue Meta-Packages ermöglichen einen klar strukturierten Workflow bei DS/ML-Projekten in der Marktforschung. Angefangen bei der Datenvorbereitung, der explorativen Datenanalyse über die Variablenauswahl, den Methodenvergleich, das Resampling bis hin zur Anpassung und Evaluierung konkurrierender Modelle.

Das Meta-Package mit der besten Unterstützung durch die weltweite R-Community ist das tidymodel-Framework unter Federführung von Max Kuhn. Es beruht auf der tidyverse-Philosophie, die vor rund einem Jahrzehnt von Hadley Wickham überzeugend initiiert wurde..

Dieses Seminar wendet sich daher an Marktforscher/innen, die häufiger ML-Modelle effizient anwenden oder zukünftig einsetzen wollen. Das Seminar orientiert sich an dem Buch von Max Kuhn und Julia Silge, Tidy Modeling with R, das unter https://www.tmwr.org/ frei verfügbar ist sowie weiteren begleitenden Webseiten.

Für das Seminar werden in der RStudio-Cloud-Workspaces teilnehmerindividuell bereitgestellt. Man benötigt daher nur einen Webbrowser. Somit gibt es keine Probleme mit der genutzten R-Version und dem Nachladen benötigter Packages.

Im Vordergrund des Seminars steht die eigene praktische Anwendung von Befehlen und Methoden aus tidymodels-relevanten R-Packages. Anhand von beispielhaften Datensätzen werden Wege des effizienten Workflows für das maschinelle Lernen geübt. Nach einem einfachen Beispieldatensatz erfolgen die weiteren Übungen an Datensätzen mit Marktforschungsbezug.

Lernziele

  • Prozess und Workflow von DS/ML-Projekten nachvollziehen können
  • Vorbereitung der Ausgangsdaten (Preprocessing) mit recipes
  • Dazu zählen auch die Handhabung von Variablen (Feature Engineering) und die finale Variablenauswahl
  • Optimierung des Outputs statistischer Modelle mit broom
  • Das Resampling von Datensätzen für das Trainieren und Testen, einschließlich Kreuzvalidierung und Bootstrapping mit rsample
  • Die Anpassung (Fit) von statistischen Modellen und ihren schnellen Vergleich mit parsnip
  • Die Evaluierung von Modellperformance mit yardstick
  • Der Aufbau und die Entwicklung von ML-Pipelines mit workflows

Für wen gedacht?

Das Seminar an Teilnehmer/innen mit grundlegenen Kenntnissen in R oder einer vergleichbaren Kommandozeilen-orientierten Sprache (Python, SAS, Stata), die ML-Modelle in ihrem Arbeitsalltag schon einsetzen oder einsetzen wollen.

Methoden

Kurze Vorträge des Referenten, selbständiges Arbeiten allein oder auch in Kleingruppen in Breakout-Sessions mit den Beispieldatensätzen.Die persönlichen RStudio-Arbeitsumgebungen in der Cloud enthalten den im Seminar verwendeten R-Code sowie Erläuterungen in Form von R-Markdown-Dateien. So lassen sich schnell die Arbeitsschritte nachvollziehen, ohne mitschreiben zu müssen.

Programm

  1. Einführung in grundlegende Fragestellungen bei der Anwendung von ML-Modellen
  2. Eine Übersicht über ML-Frameworks / Metapackages in R
  3. Der ML-Workflow aus Sicht des tidyverse/tidymodel - Ansatzes in R
  4. Beispielhafte Präsentation der tidymodels – Packages an einem Beispieldatensatz
  5. Selbständige Anwendung der wichtigsten Packages und ihrer Methoden aus dem tidymodels-Framework


  6. Im Vordergrund des Seminars steht die eigene praktische Anwendung von Befehlen und Methoden aus tidymodels-relevanten R-Packages. Anhand von beispielhaften Datensätzen werden Wege des effizienten Workflows für das maschinelle Lernen geübt. Nach einem einfachen Beispieldatensatz erfolgen die weiteren Übungen an Datensätzen mit Marktforschungsbezug.

    Für das Seminar werden in der Cloud teilnehmerindividuelle RStudio-Workspaces bereitgestellt. Für die Teilnahme benötigt man daher nur einen Webbrowser. Somit gibt es keine Probleme mit der genutzten R-Version und dem Nachladen benötigter Packages.

    Voraussetzung für eine erfolgreiche Teilnahme sind gute Grundkenntnisse in R oder einer vergleichbaren Software mit Konsoleneingabe sowie erste Erfahrungen mit dem tidyverse-Ansatz, vor allem durch Nutzung der Packages dplyr und ggplot. Ideal ist auch die Teilnahme an dem einführenden und zeitlich vorangehenden BVM-Seminar Einführung in Data Science Science für Marktforscher/innen mit R.

    Am Ende des Seminars werden alle Teilnehmer/innen mit den R-Werkzeugen einen vollständigen tidymodel-Anwendungsfall mit Marktforschungsbezug realisiert haben. Die eigene R-Studio-Cloud-Arbeitsumgebung kann abschließend heruntergeladen und in einer lokalen RStudio-Installation weiterverwendet werden.

Modalitäten

Seminarmodalitäten

Anmeldung

Bitte melden Sie Ihre Teilnahme möglichst bis 6 Wochen vor Seminarbeginn über das jeweilige Anmeldeformular auf der BVM-Website an. Wenn Sie sich per Brief oder Fax anmelden möchten, wenden Sie sich bitte an die BVM-Geschäftsstelle. Nach der Anmeldung erhalten Sie eine Anmeldebestätigung.

Gebühren

Die Teilnahmegebühren beinhalten digitale Seminarunterlagen, Tagungsgetränke, Snacks und Mittagessen an allen Präsenz-Seminartagen. Die Gebühren der einzelnen Seminare entnehmen Sie bitte den Veranstaltungsbeschreibungen. Die Teilnahmegebühr wird sofort nach Rechnungsstellung ohne Abzüge fällig. Die Kosten für Anreise und Übernachtung tragen die Teilnehmer/innen selbst.

Veranstaltungsorte

Finden Seminare nicht online statt, werden sie entweder im NH Collection oder in der BVM-Geschäftsstelle durchgeführt.
Die entsprechenden Informationen dazu erhalten Sie mit der Anmeldebestätigung.

NH Collection Berlin-Mitte am Checkpoint Charlie
Leipziger Straße 106-111
10117 Berlin
Tel.: +49 30 203760
E-Mail: nhberlinmitte@nh-hotels.com

BVM-Bundesgeschäftsstelle
Friedrichstr. 187
10117 Berlin
Tel.: +49 30 9203128-34
E-Mail: seminar-anmeldung@bvm.org

Zimmerreservierung

Empfehlungen und Informationen zu Abrufkontingenten erhalten Sie mit der Bestätigung, dass das Seminar stattfindet. Das NH Collection Berlin-Mitte am Checkpoint Charlie und das MotelOne am Leipziger Platz sind fußläufig zu den Veranstaltungsorten erreichbar. Die Reservierung und Übernachtungskosten übernehmen die Teilnehmer/innen selbst.

Teilnehmer

Die Teilnehmeranzahl pro Seminar beträgt mindestens 6 Personen.

Rabatt für Frühbucher

Für Seminare, die bis zu den jeweiligen Stichtagen im Frühjahr und Herbst gebucht werden, wird folgender Rabatt gewährt:

a) 100,- Euro für Ein-Tagesseminare
b) 200,- Euro für Zwei- und Mehrtagesseminare

Rücktritt

Eine Stornierung der Seminarteilnahme ist schriftlich (per Post, Fax oder E-Mail) vorzunehmen. Bei Stornierung bis spätestens 31 Tage vor Beginn eines gebuchten Seminars, wird die Teilnahmegebühr in voller Höhe zurückerstattet. Bis 21 Tage vor Seminarbeginn wird eine Bearbeitungsgebühr in Höhe von 120 Euro erhoben. Danach werden die Teilnahmegebühren in voller Höhe fällig. Ohne zusätzliche Kosten kann ein/e Ersatzteilnehmer/in genannt werden. Ermäßigte Teilnahmegebühren können Ersatzteilnehmer/innen jedoch nur bei bestehender BVM-Mitgliedschaft in Anspruch nehmen.

Absage durch den BVM

Haben sich bis 10 Tage vor Beginn eines Präsenz-Seminars bzw. 7 Tage vor Beginn eines Online-Seminars weniger als 6 Teilnehmer angemeldet, kann der BVM die Veranstaltung absagen. Dies gilt auch für den Fall, dass durch die kurzfristige Absage der Seminarleitung ein Ersatz ohne Verlegung des Seminars nicht gefunden werden kann. In diesem Fall werden die Teilnahmegebühren in voller Höhe zurückerstattet. Stornogebühren des BVM fallen nicht an.

Stornierungskosten für vorgenommene Reisebuchungen bei Ausfall eines Seminars können vom BVM nicht übernommen werden. Der BVM behält sich vor, Änderungen im Seminarprogramm vorzunehmen und bei Absage der Seminarleitung für Ersatz zu sorgen.

Das aktuelle Seminarprogramm finden Sie stets auf der BVM-Website.

Allgemeine Datenschutzhinweise

Die für die Buchung von BVM-Seminaren elektronisch erfassten Daten werden nach der Veranstaltung nicht weiterverwendet, wenn Sie nicht eingewilligt haben, über das BVM-Seminarangebot oder Verbandsservices informiert zu werden. Weitere Informationen finden sie in der Datenschutzerklärung des BVM

Datenschutzhinweis zur technischen Durchführung von Online-Seminaren

Für die Durchführung von Videokonferenzen setzt der BVM Berufsverband Deutscher Markt- und Sozialforscher e.V. (Verantwortlicher) einen Dienst des Auftragsverarbeiters Zoom Video Communications, Inc. (55 Almaden Blvd, Suite 600, San Jose, Kalifornien (95113), USA - nachfolgend „Zoom“) ein. Die entsprechenden Verträge (Auftragsverarbeitungsvereinbarung und Standard-Datenschutz-Klauseln) wurden abgeschlossen. Zudem wurden die Datenschutzeinstellungen so gesetzt, dass die Meetingdaten grundsätzlich über europäische Server verarbeitet werden. Weitere Informationen zur Verarbeitung Ihrer Daten und Ihren Rechten finden auf der Website von Zoom. Werden Daten außerhalb der Europäischen Union und des europäischen Wirtschaftsraums und in ein Land, welches kein angemessenes Datenschutzniveau bietet übertragen, bestehen gewisse Risiken. Bei einer Übertragung der Daten in die USA (derzeit ein Land ohne angemessenes Datenschutzniveau) besteht die Gefahr, dass Ihre Daten von amerikanischen Behörden zu Kontroll- und Überwachungszwecken verarbeitet werden können, ohne dass Ihnen möglicherweise Rechtsbehelfsmöglichkeiten zustehen.

Urheberrechte/Nutzung der Seminarunterlagen

Jegliche Inhalte des Seminars dürfen nur für eigene und interne Markt- und Sozialforschungszwecke der Teilnehmenden und des Arbeitgebers der Seminarteilnehmer/innen genutzt werden. Sie dürfen nicht für Werbung verwendet und ohne Zustimmung des BVM nicht an Dritte – auch nicht in Form eigener Lehr- und Weiterbildungsveranstaltungen, an denen Dritte teilnehmen können – weitergegeben werden.

Die den Teilnehmenden überlassenen Seminarunterlagen, sei es in papierener oder elektronischer Form, dürfen nur für interne Zwecke des Arbeitgebers des Teilnehmenden (z.B. interne, auf die Mitarbeiter des Arbeitgebers beschränkte Weiterbildungs- und Lehrveranstaltungen) vervielfältigt und verbreitet werden. Ein Zugänglichmachen im Internet oder in und mit Hilfe anderer Medien ist nicht gestattet.

Gerichtsstand ist Berlin.

Stand: August 2020

Veranstaltung im Überblick

Schulungszeiten:13.03.2023: 09:30 Uhr - 18:00 Uhr
Veranstaltungsort: Online
Verfügbarkeit: bereits stattgefunden
Gebühren:690,00 € (für Mitglieder)
890,00 € (für Nicht-Mitglieder)

Referent(en)

Michael Stanko

Michael Stanko studierte in Frankfurt/Main und Hamburg Philosophie und Sozialwissenschaften. Seit 1991 selbständig als geschäftsführender Gesellschafter der Stanko & Partner GmbH mit dem Branchenfokus…

Mehr lesen

Ähnliche Seminare

/ Data Science und Statistik

Nationale und internationale freie Daten im Internet finden und für das Desk-Research nutzen

Daten sind der Rohstoff unserer Zeit. Und dieser steht immer mehr in hochwertiger Form über das Internet zur freien Verfügung. Offene Daten für Marktforschungszwecke zu finden, ist jedoch eine Herausforderung. Dieses Seminar gibt Ihnen einen Überblick über offene Daten und ihre wesentlichen Fundstellen im Internet. Gemeinsam werden Wege erkundet,…

/ Data Science und Statistik

Vom Webscraping bis zum automatisierten Downloaden freier Daten mit R

Die Menge frei zugänglicher Daten im Internet wächst ungebrochen. Die Transparenz- und Open-Data-Bewegung der letzten Jahre führt dabei zu einem Bestand an qualitativ hochwertigen strukturierten Daten von nationalen und internationalen Behörden und Organisationen.

Für die Marktforschung interessant sind auch Webdaten in Form wenig strukturierter…

/ Data Science und Statistik

Effizienz im Reporting: MS-Office-Dokumente (Powerpoint, Word, Excel) automatisiert mit R erstellen

Office-Programme dominieren im Büroalltag. Auch in der Marktforschung führt an ihrer Nutzung kein Weg vorbei. Wer kennt nicht den Aufwand, eine größere PowerPoint-Präsentation fehlerfrei zu überarbeiten, weil die Ausgangsdaten nochmals kurzfristig aktualisiert wurden?
 

David Silverman schrieb schon vor mehr als einem Jahrzehnt in der Harvard…