Seitenanfang

Nationale und internationale freie Daten im Internet finden und für das Desk-Research nutzen / Online / Data Science und Statistik

Daten sind der Rohstoff unserer Zeit. Mit Hilfe von Künstlicher Intelligenz sowie leistungsstarken Open Source Tools wie R lassen sich diese Daten finden, analysieren und im Marktforschungsalltag nutzen.

Obwohl die Menge hochwertiger und freier Daten über das Internet nahezu exponentiell wächst, bleibt es eine Herausforderung, diese für Marktforschungszwecke zu finden und im produktiven Prozess reproduzierbar verwenden zu können.

Dieses Seminar gibt Ihnen einen Überblick über offene Daten und ihre wesentlichen Fundstellen im Internet. Gemeinsam werden Wege erkundet, wie sich freie Daten für die Marktforschung nutzen lassen. Auch wird beispielhaft gezeigt, wie die leistungsstarke freie Software R das Mittel der Wahl ist, wenn es um das effiziente und reproduzierbare Heben der Datenschätze geht.  Im Zusammenspiel mit den aktuellen LLMs (Large Language Models) wie ChatGPT eröffnen sich dabei ganz neue Möglichkeiten.

Hintergrund: Bislang gibt es keine umfassenden Suchmaschinen für freie Daten. Die Übersichtsportale von Institutionen und Organisationen erleichtern das schnelle Auffinden nur begrenzt. Es ist sehr aufwändig, sich einen guten Überblick zu verschaffen und auf dem Laufenden zu bleiben. Allein das EU-Open-Data-Portal führt über 1,2 Millionen freie Datensätze aus 36 europäischen Ländern auf, kategorisiert nach 13 Themenbereichen. Hat man erst einmal offene Daten für die eigene Fragestellung gefunden, überraschen die Vielfalt der Datenformate und die inhaltlichen Strukturen der Dateien. So liegen die Datensätze des EU-Portals in über 40 verschiedenen Formaten vor.

Viele offene Daten lassen sich mit den gängigen Office-Software-Produkten nur schwer verarbeiten. Hier kommen R, aber auch Python und KI-basierte Tools ins Spiel. Die Open Research Data Task Force der University of Warwick (UK) benannte 2017 daher treffend die beiden größten Herausforderungen für die Nutzung von offenen Daten: 1. die Daten zu finden, 2. ohne großen Aufwand zu nutzen. KI kann bei beiden Herausforderungen ein wertvolles Hilfsmittel sein.

Lernziele

Die Teilnehmer/innen werden nach dem Seminar:

  • freie Datenquellen im Internet finden und auf ihre maschinelle Nutzbarkeit für ihre Aufgabenstellungen in der Marktforschung beurteilen können,
  • die wesentlichen Strukturen relevanter Datenformate verstehen,
  • nachvollziehen können, wie sich offene Daten aus verschiedenen Quellen zusammenführen lassen und
  • verstehen, wie durch die Zusammenführung von Daten informatorischer Mehrwert entsteht,
  • die Einsatzmöglichkeiten von ChatGPT im Kontext freier Daten kennenlernen,
  • den Nutzen von allgemeinen, aber auch spezifischen R-Packages bei der Verwendung von webbasierten Daten einschätzen können,
  • die Möglichkeiten von Reporting und Kommunikation der Ergebnisse mit R überblicken,
  • verstehen, wie sich R im Zusammenspiel mit ChatGPT bei der Verwendung offener Daten effizienter nutzen lässt.

Für wen gedacht?

Das Seminar richtet sich an Marktforscher/innen,

  • die sich einen Überblick über den aktuellen Stand von Open-Data verschaffen wollen und freie Daten für ihre Arbeit benötigen,
  • die wissen wollen, wie sich ein effizienter und reproduzierbarer Workflow in der Nutzung offener Daten aufbauen lässt,

Kenntnisse in R und RStudio sind nützlich, aber nicht erforderlich. Ebenso wäre ein eigener ChatGPT-Account hilfreich.

Methoden

Kurze Vorträge des Referenten, selbständiges Arbeiten allein oder auch in Kleingruppen in Breakout-Sessions zum Erkunden von Open-Data-Portalen. Für jede/n Teilnehmer/in gibt es eine persönliche RStudio-Cloud-Arbeitsumgebung.

In dieser Arbeitsumgebung sind u. a. interaktive HTML-Dokumente mit Beschreibungen und Links zu Datenportalen enthalten, außerdem Fachliteratur wie The State of Open Data. Histories and Horizons‘ und R-Templates für die eigene Erprobung.

Programm

Programm

Vormittags: Das expandierende Universum freier Daten im Internet

  • Einführung in das Thema freie Daten/Open Data
  • politische und rechtliche Hintergründe
  • umfassender Überblick über große Data-Provider
  • national - international - global: u.a. nationale Statistikämter, Eurostat, EZB, OECD, WHO, IMF
  • geführte Touren auf ausgewählten Provider-Portalen
  • Unterstützung durch ChatGPT beim Finden, Strukturieren und Präsentieren offener Daten
  • eigenes Erkunden von Open-Data-Quellen mit Blick auf spezifische Aufgabenstellungen

Nachmittags: Open-Data effizient nutzen durch automatisierbare Prozesse mit R, unterstützt von ChatGPT. Anhand von Beispielen werden folgende Aspekte aufgezeigt:

  • der Import von Daten unterschiedlichen Typs
  • die automatisierte Datengewinnung durch Webscraping
  • das Umwandeln von PDF-Tabellen in maschinenlesbare Daten
  • die Aufbereitung und Weiterverarbeitung von Daten, u. a. Neubenennung von Variablen/Umgang mit fehlenden Werten/Typumwandlungen/Aggregationen und Berechnungen/Visualisierungen/Fusion von Daten
  • der Export aufbereiteter Daten in Office-Dokumente oder Datenbanken
  • die Kommunikation von Ergebnissen als interaktive HTML-Dateien
  • jeweils begleitet von eigenen Schritten mit R-Templates

Modalitäten

Seminarmodalitäten

Anmeldung

Bitte melden Sie Ihre Teilnahme möglichst bis 6 Wochen vor Seminarbeginn über das jeweilige Anmeldeformular auf der BVM-Website an. Wenn Sie sich per Brief oder Fax anmelden möchten, wenden Sie sich bitte an die BVM-Geschäftsstelle. Nach der Anmeldung erhalten Sie eine Anmeldebestätigung.

Gebühren

Die Teilnahmegebühren beinhalten digitale Seminarunterlagen, Tagungsgetränke, Snacks und Mittagessen an allen Präsenz-Seminartagen. Die Gebühren der einzelnen Seminare entnehmen Sie bitte den Veranstaltungsbeschreibungen. Die Teilnahmegebühr wird sofort nach Rechnungsstellung ohne Abzüge fällig. Die Kosten für Anreise und Übernachtung tragen die Teilnehmer/innen selbst.

Veranstaltungsorte

Finden Seminare nicht online statt, werden sie entweder im NH Collection oder in der BVM-Geschäftsstelle durchgeführt.
Die entsprechenden Informationen dazu erhalten Sie mit der Anmeldebestätigung.

NH Collection Berlin-Mitte am Checkpoint Charlie
Leipziger Straße 106-111
10117 Berlin
Tel.: +49 30 203760
E-Mail: nhberlinmitte@nh-hotels.com

BVM-Bundesgeschäftsstelle
Friedrichstr. 187
10117 Berlin
Tel.: +49 30 9203128-34
E-Mail: seminar-anmeldung@bvm.org

Zimmerreservierung

Empfehlungen und Informationen zu Abrufkontingenten erhalten Sie mit der Bestätigung, dass das Seminar stattfindet. Das NH Collection Berlin-Mitte am Checkpoint Charlie und das MotelOne am Leipziger Platz sind fußläufig zu den Veranstaltungsorten erreichbar. Die Reservierung und Übernachtungskosten übernehmen die Teilnehmer/innen selbst.

Teilnehmer

Die Teilnehmeranzahl pro Seminar beträgt mindestens 6 Personen.

Rabatt für Frühbucher

Für Seminare, die bis zu den jeweiligen Stichtagen im Frühjahr und Herbst gebucht werden, wird folgender Rabatt gewährt:

a) 100,- Euro für Ein-Tagesseminare
b) 200,- Euro für Zwei- und Mehrtagesseminare

Rücktritt

Eine Stornierung der Seminarteilnahme ist schriftlich (per Post, Fax oder E-Mail) vorzunehmen. Bei Stornierung bis spätestens 31 Tage vor Beginn eines gebuchten Seminars, wird die Teilnahmegebühr in voller Höhe zurückerstattet. Bis 21 Tage vor Seminarbeginn wird eine Bearbeitungsgebühr in Höhe von 120 Euro erhoben. Danach werden die Teilnahmegebühren in voller Höhe fällig. Ohne zusätzliche Kosten kann ein/e Ersatzteilnehmer/in genannt werden. Ermäßigte Teilnahmegebühren können Ersatzteilnehmer/innen jedoch nur bei bestehender BVM-Mitgliedschaft in Anspruch nehmen.

Absage durch den BVM

Haben sich bis 10 Tage vor Beginn eines Präsenz-Seminars bzw. 7 Tage vor Beginn eines Online-Seminars weniger als 6 Teilnehmer angemeldet, kann der BVM die Veranstaltung absagen. Dies gilt auch für den Fall, dass durch die kurzfristige Absage der Seminarleitung ein Ersatz ohne Verlegung des Seminars nicht gefunden werden kann. In diesem Fall werden die Teilnahmegebühren in voller Höhe zurückerstattet. Stornogebühren des BVM fallen nicht an.

Stornierungskosten für vorgenommene Reisebuchungen bei Ausfall eines Seminars können vom BVM nicht übernommen werden. Der BVM behält sich vor, Änderungen im Seminarprogramm vorzunehmen und bei Absage der Seminarleitung für Ersatz zu sorgen.

Das aktuelle Seminarprogramm finden Sie stets auf der BVM-Website.

Allgemeine Datenschutzhinweise

Die für die Buchung von BVM-Seminaren elektronisch erfassten Daten werden nach der Veranstaltung nicht weiterverwendet, wenn Sie nicht eingewilligt haben, über das BVM-Seminarangebot oder Verbandsservices informiert zu werden. Weitere Informationen finden sie in der Datenschutzerklärung des BVM

Datenschutzhinweis zur technischen Durchführung von Online-Seminaren

Für die Durchführung von Videokonferenzen setzt der BVM Berufsverband Deutscher Markt- und Sozialforscher e.V. (Verantwortlicher) einen Dienst des Auftragsverarbeiters Zoom Video Communications, Inc. (55 Almaden Blvd, Suite 600, San Jose, Kalifornien (95113), USA - nachfolgend „Zoom“) ein. Die entsprechenden Verträge (Auftragsverarbeitungsvereinbarung und Standard-Datenschutz-Klauseln) wurden abgeschlossen. Zudem wurden die Datenschutzeinstellungen so gesetzt, dass die Meetingdaten grundsätzlich über europäische Server verarbeitet werden. Weitere Informationen zur Verarbeitung Ihrer Daten und Ihren Rechten finden auf der Website von Zoom. Werden Daten außerhalb der Europäischen Union und des europäischen Wirtschaftsraums und in ein Land, welches kein angemessenes Datenschutzniveau bietet übertragen, bestehen gewisse Risiken. Bei einer Übertragung der Daten in die USA (derzeit ein Land ohne angemessenes Datenschutzniveau) besteht die Gefahr, dass Ihre Daten von amerikanischen Behörden zu Kontroll- und Überwachungszwecken verarbeitet werden können, ohne dass Ihnen möglicherweise Rechtsbehelfsmöglichkeiten zustehen.

Urheberrechte/Nutzung der Seminarunterlagen

Jegliche Inhalte des Seminars dürfen nur für eigene und interne Markt- und Sozialforschungszwecke der Teilnehmenden und des Arbeitgebers der Seminarteilnehmer/innen genutzt werden. Sie dürfen nicht für Werbung verwendet und ohne Zustimmung des BVM nicht an Dritte – auch nicht in Form eigener Lehr- und Weiterbildungsveranstaltungen, an denen Dritte teilnehmen können – weitergegeben werden.

Die den Teilnehmenden überlassenen Seminarunterlagen, sei es in papierener oder elektronischer Form, dürfen nur für interne Zwecke des Arbeitgebers des Teilnehmenden (z.B. interne, auf die Mitarbeiter des Arbeitgebers beschränkte Weiterbildungs- und Lehrveranstaltungen) vervielfältigt und verbreitet werden. Ein Zugänglichmachen im Internet oder in und mit Hilfe anderer Medien ist nicht gestattet.

Gerichtsstand ist Berlin.

Stand: August 2020

Veranstaltung im Überblick

Schulungszeiten:29.11.2024: 09:30 Uhr - 18:00 Uhr
Veranstaltungsort: Online
Verfügbarkeit: freie Plätze verfügbar
Gebühren:790,00 € (für Mitglieder)
990,00 € (für Nicht-Mitglieder)

Referent(en)

Michael Stanko

Michael Stanko studierte in Frankfurt/Main und Hamburg Philosophie und Sozialwissenschaften. Seit 1991 selbständig als geschäftsführender Gesellschafter der Stanko & Partner GmbH mit dem Branchenfokus…

Mehr lesen

Ähnliche Seminare

/ Data Science und Statistik

Künstliche Intelligenz in der Marktforschung

Die zunehmende Verbreitung von Generativer Künstlicher Intelligenz (Gen AI), insbesondere basierend auf Large Language Modellen (LLMs), führt in Unternehmen zu intensiven Diskussionen über sinnvolle Anwendungsbereiche. Die Marktforschung steht vor umwälzenden Herausforderungen durch die entstehenden Möglichkeiten der Nutzung von Künstlicher…

/ / / / Data Science und Statistik

Moderne Analyse- und Dashboard-Anwendungen konzipieren & implementieren

In diesem Seminar erlernen Sie die Techniken und Denkweisen, die hinter erfolgreichen Analyse- und Dashboard-Anwendungen in Marktforschung, Experience Management und Marketing stecken. Sie erlernen, mit welchen Methoden und Techniken Sie Dashboards entwickeln können, die Mehrwert schaffen und Nutzern die Arbeit mit Daten erleichtern.…

/ / Data Science und Statistik

Fortgeschrittene Gewichtungsmodelle für die Marktforschungspraxis

Iterative proportionale Gewichtung (IPF) ist immer noch der Standard in der Marktforschung. Allerdings lassen sich mit IPF komplexere Gewichtungsaufgaben, wie sie zum Beispiel in Dual-Frame oder anderen disproportionalen Stichproben nötig werden, nicht zufriedenstellend lösen. Generalisierte Regressionsmodelle (GREG) können das leisten. In diesem…