Der Begriff „Big Data“ beschreibt große Mengen an Daten, die mit speziellen Lösungen gespeichert, analysiert und ausgewertet werden.[1]
Typische Charakteristika sind die enorme Datenmenge (Volume), große Datenvielfalt (Variety) und schnelle Verfügbarkeit (Velocity) bei der Speicherung und Verarbeitung.[2] Nahezu jede Branche kann aus Big Data einen Vorteil ziehen, so auch die Tourismusbranche.
Big Data bietet dem Tourismus-Business große Chancen
Jeder Mensch hinterlässt Datenspuren und je mehr er unterwegs ist, desto intensiver. Da ist es nicht verwunderlich, dass gerade im Tourismus das Thema Big Data viele Chancen bereithält.[3] Das personalisierte Marketing und eine auf die Zielgruppe abgestimmte Produktentwicklung bieten sowohl für Konsumenten als auch Anbieter große Vorteile.[4] Mit der richtigen Herangehensweise können Tourismusunternehmen viel über die Präferenzen der Kunden herausfinden und für ihre Zwecke anwenden.[5]
Um die Daten nutzen zu können, ist die Analyse und Auswertung dieser notwendig. Hierfür gibt es zahlreiche Methoden, um unstrukturierte und strukturierte Daten aus verschiedensten Quellen zu analysieren und auszuwerten. Ein Softwaresystem für die Verarbeitung der Daten ist Hadoop.
Das Grundprinzip des freien in Java geschriebenen Open-Source-Software-Frameworks Hadoop ist, eine große Anzahl von Rechnern zu Clustern zusammenzuschließen. In solch einem Hadoop-Cluster können riesige Datenmengen gespeichert und mit sehr hoher Geschwindigkeit verarbeitet werden. Bei Hadoop handelt es sich dabei nicht um ein einzelnes Projekt, sondern um eine Vielzahl an Kernkomponenten, die sich als Hadoop Ökosystem bezeichnen lassen. Die drei Hauptkomponenten sind: „Hadoop Distributed File System“ (HDFS), „MapReduce“ und „Yet Another Resource Negotioator“ (YARN).[6]
HDFS ist ein verteiltes Dateisystem. Das heißt, Dateien können wahlweise auf einem oder auf mehreren Punkten im Rechnerverbund gespeichert werden. Ziel dabei ist es, alle Ressourcen für die Datenspeicherung auf den verschiedenen Rechnern optimal auszunutzen.[7]
Das HDFS ist die Voraussetzung für den MapReduce Algorithmus, der den Kern von Hadoop bildet. Er ist für die Zerteilung einer Rechenaufgabe in viele kleine Teile zuständig, die parallel an verschiedenen Stellen bearbeitet werden.[8]
Dieses Verfahren wird von Hadoop YARN ergänzt, was eine weitere Cluster-Verwaltungstechnik darstellt. Ähnlich wie der MapReduce-Algorithmus managt YARN ebenfalls die im Rechenverbund zur Verfügung stehenden Ressourcen.[9]
Durch die Nutzung von Hadoop mit den beschriebenen Verfahren ist die schnelle Verarbeitung und Speicherung sehr großer Datenmengen möglich, um diese beispielsweise – wie bei dem Online-Reisebüro Expedia – für Machine Learning einzusetzen.
Was Hadoop und Machine Learning bei Expedia ermöglichen
Expedia, Inc. ist eines der führenden Online-Reisebüros, das über 200 Reisebuchungswebseiten in etwa 75 Ländern betreibt und rund 500.000 Hotels und 500 Airlines gelistet hat. Eine der Websites von Expedia ist Expedia.com, die im weiteren Verlauf näher betrachtet wird.[10]
Expedia möchte vor allem schnell in der Bereitstellung seiner Angebote sein und nutzt hierfür zur Analyse seiner enormen Datenmengen unter anderem Machine Learning, um dem Kunden in wenigen Sekunden das beste Angebot für seine Reise vorzuschlagen.[11]
Voraussetzung für den Einsatz von Machine Learning bildet bei Expedia laut Edmond Mesrobian, ehemaliger Chief Technology Officer von Expedia, Hadoop. Durch die Verarbeitung der Daten mit Hadoop kann Machine Learning erst richtig genutzt werden.[12]
Bei Machine Learning lernt ein Computer aus vergangenen und neuen Daten, ohne explizit mit neuen Informationen programmiert zu werden. Mit außergewöhnlicher Geschwindigkeit können komplexe Algorithmen wichtige Datenmuster identifizieren, die Menschen niemals hätten entdecken können.[13]
Der Einsatz des maschinellen Lernens bei Expedia ist notwendig, weil sich Flugpläne laufend ändern und Expedias eigene „Best-Tarif-Suche“ (BTS) ständig „lernen“ muss. Die durchschnittliche Expedia Flugsuche braucht drei Sekunden, um Ergebnisse zu liefern. In diesen 3 Sekunden wird man durchschnittlich 16.000 Flugoptionen sehen, geordnet nach Komfort, Preis oder Zeit. Dies ist möglich, weil Komplexe Algorithmen aus vergangenen Buchungsdaten lernen können, um diese Möglichkeiten auf die wenigen ansprechendsten Optionen in wenigen Sekunden zu filtern.[14]
Eine andere Anwendung für Machine Learning bei Expedia ist das Problem der doppelten Auflistung. Da die Daten von verschiedenen Quellen stammen, sind häufig unterschiedliche Schreibweisen die Folge. Durch Machine Learning ist es möglich, diese Daten zu analysieren und zu lernen, dass z.B. „Delta Air Line“ und „Delta Airlines“ dasselbe sind. Unnötiger Zeitaufwand für die Mitarbeiter oder frustrierte Kunden werden somit vermieden.[15]
Das Hauptziel bei der Nutzung von Big Data ist die Fragen der Reisenden zu beantworten und Machine Learning dafür einzusetzen, diese Fragen und Probleme schon im Vorfeld zu erkennen und zu lösen.[16]
Nicht mehr „Content is King“, sondern „Data is King“
Unternehmen wie Expedia müssen sich bewusst sein, von wem und wo ihre Daten stammen und wie sie diese verarbeiten können, um sie dann durch Analysen und Auswertungen für die Verbesserung ihrer Angebote und Services zu nutzen. Wo früher häufig die Devise lautete „Content is King“, gilt für viele Unternehmen heute der Grundsatz „Data is King“.
Quellenverzeichnis
Albera, M. (2017): Machine Learning. What does the industry want next?, http://www.eyefortravel.com/mobile-and-technology/machine-learning-what-does-industry-want-next/; Abruf: 10.12.2017
Carey, S. (2016): How Expedia.com was build on Machine Learning, https://www.pcworld.idg.com.au/article/605155/how-expedia-com-built-machine-learning/; Abruf: 11.12.2017
Dorschel. J. (2015): Praxishandbuch Big Data. Wirtschaft – Recht – Technik, 1. Auflage
Expedia Inc. (Hrsg.) (2017): Expedia, Inc. Overview, http://www.expediainc.com/about/; Abruf: 07.12.2017
Hendrik, H., Perdana, D. H. F. (2014): Trip guidance. A linked data based mobile tourists guide. Advanced Science Letters
Hortonworks (Hrsg.) (2015): Expedia Turns Big Data into Powerful Decision Making and Meaningful Action with Hortonworks, Youtube, https://www.youtube.com/watch?v=zNF1Hsj37Ks, Erstelldatum: 06.01.2015; Abruf: 08.12.2017
Pries, K. H., Dunnigan, R. (2015): Big data analytics. A practical guide for managers. Boca Raton
Ryte GmbH (Hrsg.) (o.J.): Hadoop, https://de.ryte.com/wiki/Hadoop#Funktionsweise; Abruf: 09.12.2017
Schön, C. (2015): Big Data und Hadoop: Apache macht das Unmögliche möglich, https://bigdatablog.de/2015/04/29/big-data-und-hadoop-apache-macht-das-unmoegliche-moeglich/; Abruf: 08.12.2017
Springer Gabler Verlag (Hrsg.) (2017): Stichwort: Big Data, http://wirtschaftslexikon.gabler.de/Archiv/-2046774198/big-data-v5.html; Abruf: 06.12.2017
White, T. (2012): Hadoop. The Definitive Guide, 3. Auflage
Xiang, Z., Fesenmaier, D. R. (2017): Analytics in Smart Tourism Design. Concepts and Methods, 2. Auflage
Querverweise
[1] Vgl. Springer Gabler Verlag (Hrsg.) (2017), http://wirtschaftslexikon.gabler.de/Archiv/-2046774198/big-data-v5.html; Abruf: 06.12.2017
[2] Vgl. Dorschel, J. (2015), S. 6
[3] Vgl. Hendrik, H., Perdana, D. H. F. (2014), S. 75
[4] Vgl. Pries, K.H., Dunnigan, R. (2015), S. 39 f.
[5] Vgl. Xiang, Z., Fesenmaier, D. R. (2017), S. 20
[6] Vgl. Dorschel, J. (Hrsg.) (2015), S. 279
[7] Vgl. Schön, C. (2015), https://bigdatablog.de/2015/04/29/big-data-und-hadoop-apache-macht-das-unmoegliche-moeglich/; Abruf: 08.12.2017
[8] Vgl. Dorschel, J. (Hrsg.) (2015), S. 281
[9] Vgl. Ryte GmbH (Hrsg.) (o.J.), https://de.ryte.com/wiki/Hadoop#Funktionsweise; Abruf: 09.12.2017
[10] Vgl. Expedia Inc. (Hrsg.) (2017), http://www.expediainc.com/about/; Abruf: 07.12.2017
[11] Vgl. Expedia Inc. (Hrsg.) (2017), http://www.expediainc.com/about/; Abruf: 07.12.2017
[12] Hortonworks (Hrsg.) (2015), https://www.youtube.com/watch?v=zNF1Hsj37Ks; Abruf: 08.12.2017
[13] Vgl. Albera, M. (2017), http://www.eyefortravel.com/mobile-and-technology/machine-learning-what-does-industry-want-next; Abruf: 10.12.2017
[14] Vgl. Carey, S. (2016), https://www.pcworld.idg.com.au/article/605155/how-expedia-com-built-machine-learning/; Abruf: 11.12.2017
[15] Vgl. Albera, M. (2017), https://www.ean.com/insights/machine-learning-what-does-the-industry-want-next/; Abruf: 10.12.2017
[16] Vgl. Carey, S. (2016), https://www.pcworld.idg.com.au/article/605155/how-expedia-com-built-machine-learning/; Abruf: 11.12.2017