Document Details

AchievablePlateau

Uploaded by AchievablePlateau

Deutsche Hochschule für angewandte Wissenschaften

Tags

big data analytics data analysis artificial intelligence information technology

Summary

This document explores the potential of big data analytics, focusing on new data sources and the role of cloud computing in improving data processing speeds and efficiency. It investigates how the value of information changes over time and how big data concepts can support proactive decision-making for businesses and organizations.

Full Transcript

Big Data 2. Big Data Analytics Potentiale 2.1 Neue Datenquellen Bei der Ausgabe einer KI-Anwendung handelt es sich um Informationen, die aus Algorithmen extrahiert werden, die auf bereitgestellten Daten basieren. Daher wird die Verwendung unvollständiger oder fehlerhafter Daten immer zu schlec...

Big Data 2. Big Data Analytics Potentiale 2.1 Neue Datenquellen Bei der Ausgabe einer KI-Anwendung handelt es sich um Informationen, die aus Algorithmen extrahiert werden, die auf bereitgestellten Daten basieren. Daher wird die Verwendung unvollständiger oder fehlerhafter Daten immer zu schlechten Ergebnissen führen, egal wie gut der Algorithmus ist.5 Ein wichtiger Faktor bei der Erstellung und Bewertung neuer Algorithmen ist der Zugriff auf Datensätze und aussagekräftige Daten, die bereits klassifiziert wurden. Eine der wichtigsten Entwicklungen, die die Verfügbarkeit von Da- ten vorangetrieben hat, ist das Internet. Dies hat es großen Gemeinschaften ermöglicht, bei der Erstellung von Datensätzen zusammenzuarbeiten, auf die Forscher auf der ganzen Welt zugreifen können. Ein anschauliches Beispiel für eine Internet-Community, die ständig Daten zur Bildklassifizierung erstellt, klassifiziert, kennzeichnet und uploaded, ist die ImageNet-Community. Die Erstellung und Kennzeichnung von Trainings- daten nahm in der Vergangenheit nicht nur viel Zeit in Anspruch, sondern war auch für große Datensätze, die für das Training neuronaler Netze benö- tigt werden, fast unmöglich. Während ein Bilddatensatz für die Gesichtser- kennung 1997 aus etwa 165 Instanzen bestand, besteht ein ImageNet-Da- tensatz für Gesichter bereits aus 1570 vollständig klassifizierten Instanzen. 6 Insgesamt liefert ImageNet allein fast 15 Millionen klassifizierte Bilder, auf die leicht zugegriffen werden kann und die zum Training und zur Bewertung von KI-Algorithmen verwendet werden können.7 Der leichte Zugang zu einer großen Datenmenge, die zum Trainieren und Feinabstimmen von Algorithmen verwendet werden kann, bedeutet, dass Forscher und Praktiker der KI ihre Zeit der Verbesserung und Entwicklung Merksatz neuer Algorithmen widmen und diese dann schnell testen und validieren können. Dies war noch vor zwei Jahrzehnten nicht möglich. 2.2 Infrastruktur und neue Daten Letztlich spielt der Einfluss von neuen Technologien vor allem im Kontext der Basisinfrastruktur durch Cloud Computing und technische Verbesserung von Datenbanken eine maßgebliche Rolle im Kontext von Big Data. Wichtig dabei ist es, darauf zu achten, dass in den letzten Jahrzehnten auf Seite der 5 Vgl. datascience@berkely, 2014 6 Vgl. Georghiades, 1997 7 Besuchen Sie die Community unter: https://www.image-net.org/index.php 5 Big Data Datenbanken ein Vorsprung hinsichtlich Performance erreicht werden konnte. Ein neues Paradigma, das sogenannte In-Memory-Computing, ver- half Datenbanken, die bisher auf klassischen Festplatten organisiert wurden, zu neuer, bisher nie dagewesener Performance. Durch diese infrastruktu- relle und datenbanktechnische Neuerung konnten erst neue Kalkulationen im Sinne von Big Data ermöglicht werden. Festzuhalten ist auch, dass diese Kalkulationen nicht möglich gewesen wären, wenn bestehende Algorithmen nicht auf neue Infrastrukturen angepasst worden wären - und somit die An- fragen und letztlich die Ergebnisse in einer adäquaten Zeit zur Verfügung ge- stellt werden konnten. Dabei ist die Interpretierbarkeit von Daten ein entscheidender Faktor und deren Verfügbarkeit der Ergebnispräsentation spielt eine sehr wichtige Rolle. Im Rahmen der Informationstechnologie wird mit fortschreitender Zeit eine Information immer weniger Wert. Deswegen muss sichergestellt werden, dass neue Berechnungen in sehr kurzer Zeit einem Entscheidungs- träger zur Verfügung gestellt werden können. In der folgenden Abbildung wird aufgezeigt, wie sich der Wert einer Information mit zunehmender Zeit rapide verringert. Gleichwohl ist ein Trend zu erkennen, dass heutzutage auch wichtige Infor- mationen durch den Einsatz von Big-Data-Konzepten immer schneller ver- fügbar sind und somit zur proaktiven Handlungsfähigkeit von Unternehmen beiträgt. rüher intri eines reignisses ert von relevanten Infor a onen eute r ennung und Anal se erarbeitung und Ko uni a on andlungen durchgeführt eit Abbildung 2: Informationswert in Bezug zu Zeit 6 Big Data 2.3 Cloud- und Edgecomputing Edge-Computing ist eine verteilte offene Plattform am Rand eines Netz- werks, nahe an den beteiligten „Dingen“ oder Datenquellen, die die Fähig- keiten von Netzwerken, Speichern und Anwendungen integriert. Durch den Betrieb in unmittelbarer Nähe mobiler Geräte oder Sensoren ergänzt Edge Computing zentralisierte Cloud-Knoten und ermöglicht Analysen und Infor- mationserzeugung nahe am Ursprung und Verbrauch von Daten. Dies er- möglicht die Erfüllung der Schlüsselanforderungen der Industriedigitalisie- rung in Bezug auf agile Konnektivität, Echtzeitdienste, Datenoptimierung, Anwendungsintelligenz, Sicherheit und Schutz der Privatsphäre. Cloud- und Edge-Computing ermöglichen den Zugang zu kosteneffizienten, skalierbaren Computing-Ressourcen sowie zu spezialisierten Diensten. KI profitiert von der Nutzung von Edge-Computing auf folgende Weise: Die Lokalisierung der Datenerfassung und -speicherung ermöglicht die Vorverarbeitung der Daten, sodass statt der Rohdaten nur Ent- scheidungen oder Alarme an die Cloud-Server weitergeleitet wer- den. Eine schnellere und effizientere Entscheidungsfindung kann durch die Platzierung von Algorithmen des maschinellen Lernens auf den Edge-Geräten erreicht werden, wodurch die Häufigkeit des Kontakts mit den Cloud-Servern verringert und die Auswirkungen der Round- Trip-Verzögerung auf die Entscheidungsfindung stetig verringert werden. Daten können in der Nähe ihrer Quelle durch lokales Identitätsma- nagement und anwendungsspezifische Zugriffsrichtlinien und unter Einhaltung lokaler Vorschriften gesichert werden. Die Kommunikation zwischen Edge-Computing-Knoten ermöglicht die Ver- teilung von KI-Fähigkeiten und die gemeinsame Nutzung von Intelligenz zwi- schen den verteilten KI-Knoten. 2.4 Internet der Dinge (IoT) Das IoT konzentriert sich auf das Sammeln von Daten von Geräten, was be- sonders für die Produktion und die Verbraucherinformation relevant ist. Die Entwicklung der IoT in den letzten Jahrzehnten hat zu einer Ausweitung der Rechenkapazitäten auf kleinere und intelligentere Geräte geführt. Basierend auf dieser Entwicklung wird das IoT von ISO/IEC definiert als die 7 Big Data „Infrastruktur von miteinander verbundenen Objekten, Menschen, Syste- men und Informationsressourcen zusammen mit intelligenten Diensten, die es ihnen ermöglichen, Informationen der physischen und virtuellen Welt zu verarbeiten und zu reagieren.“8 Es wird erwartet, dass die Zahl der weltweit installierten angeschlossenen Geräte von über 23 Milliarden im Jahr 2018 auf etwa 75 Milliarden im Jahr 2025 steigen wird.9 Dies veranschaulicht den Einfluss des IoT auf die Daten- erfassung. In Zukunft wird die Datenmenge, die in KI-Anwendungen verwen- det werden kann, weiter zunehmen und damit die Leistung von Algorithmen verbessern. IoT-Anwendungen ermöglichen heute die Erfassung von Leistungs- und um- weltbezogenen Daten mit Hilfe von Sensoren, die an Geräten angebracht sind. Dies ermöglicht die Analyse von Daten entweder lokal oder über Cloud- Merksatz Plattformen. In Zukunft wird das Echtzeitverhalten solcher Systeme für zeitkritische An- wendungen wie das autonome Fahren immer wichtiger werden. 10 Angesichts der großen Datenmengen, die von diesen angeschlossenen Sen- soren erzeugt werden, wird die Rolle des KI-Computing am Rand (oder Edge- Computing) noch wichtiger werden. Wie bereits erwähnt, ist es unpraktisch und manchmal sogar unmöglich, alle erzeugten Daten an eine zentrale Stelle zu übertragen, diese Daten zu analysieren und dann die notwendigen Infor- mationen an das Gerät zurückzuschicken. Daher wird es von entscheidender Bedeutung sein, einfache Analysen oder Entscheidungen vor Ort durchfüh- ren zu können. Dieser Trend wird auch zu einfacheren KI-Algorithmen füh- ren, die lokal auf Geräten laufen, die auf Edge-Computing angewiesen sind. KI am Rand wird das IoT auf das nächste Level an Fähigkeiten bringen. 8 Vgl. ISO/IEC JTC 1, 2014 9 Vgl. Perera et al., 2014 10 Vgl. IEC, IoT, 2016 8

Use Quizgecko on...
Browser
Browser