Huffpost Germany
BLOG

Eine offene Plattform für kontroverse Meinungen und aktuelle Analysen aus dem HuffPost-Gastautorennetzwerk

Adrian Vogler Headshot

Das 650.000-E-Mail-Problem und die Grenzen des Wissensarbeiters

Veröffentlicht: Aktualisiert:
MAN LAPTOP
g-stockstudio via Getty Images
Drucken

2016-11-12-1478940705-1271763-wordleEMailProblem.png

... und wie man sie überwinden kann

In den letzten Tagen war im amerikanischen Wahlkampf sehr viel von den 650.000 E-Mails die Rede, das FBI auf einem Laptop entdeckt hatte und mit der demokratischen Präsidentschaftskandidatin und ihrem E-Mail Skandal aus dem Juli dieses Jahres in Verbindung brachte.

Damals waren es ca. 30.000 E-Mails, um die es ging. War das damals bereits eine stattliche Anzahl, doch der jetzige Fund war mehr als zwanzigmal so groß. Und der republikanische Präsidentschaftskandidat nutzte diese um riesige Zahl an E-Mails, um in dramatischen Worten herauf zu beschwören, was sich in diesem riesigen Berg an E-Mails wohl alles verbergen würde an möglichen Skandalen.

Und da er keine genaueren Informationen hatte, überließ er das, was man da möglicherweise finden könnte, der Vorstellungskraft seiner Zuhörer.

Umso verblüffender war für viele dann die Tatsache, dass das FBI kaum eine Woche später die Nachricht publizierte, dass die 650.000 E-Mails keine neuen Beweise enthalten hätten, um das Verfahren gegen die Präsidentschaftskandidatin wieder zu eröffnen.

Wie konnte das sein, dass man das in so unvorstellbar kurzer Zeit mit solcher Bestimmtheit sagen konnte? Der Berg von 650.000 E-Mails war doch viel zu groß, als dass man ihn in nur sieben Tagen genau hätte prüfen können.

Darüber erhob sich im Lager der Republikaner ein Sturm der Entrüstung. Innerhalb einer Woche könne kein Mensch 650.000 E-Mails lesen, geschweige denn genau prüfen. Das wäre doch unmöglich.

Und das stimmt wohl auch. Wenn man der Argumentation die Annahme zugrunde legt, dass tatsächlich Menschen, Vertreter des FBI, diese 650.000 E-Mails lesen und prüfen müssten. Dann hätte in der zur Verfügung stehenden Zeit eine Analyse der E-Mails nicht erfolgen können. Dazu kann man eine einfache Rechnung aufmachen, um das zu belegen:

Ein Mensch ist in der Lage pro Sekunde 11 Byte bewusst zu verarbeiten. Wenn man nun zugrunde legt, dass eine E-Mail im Durchschnitt den Umfang von einer DIN A4 Seite hat, dann sind das 4800 Byte pro E-Mail. Für die bewusste Analyse einer E-Mail im Umfang einer DIN A4-Seite benötigt ein Mensch also ca. 7 Minuten. 650.000 E-Mails summieren sich zu 3.120.000.000 Byte.

Für die Analyse durch eine Schar von FBI-Mitarbeitern muss man also 4.550.000 Minuten veranschlagen. Ein Tag hat 1.440 Minuten. Für die Prüfung benötigt man demnach 3383 volle Tage a 24 Stunden. Und das FBI will bereits nach sieben Tagen mit dieser Herkules-Aufgabe fertig gewesen sein?

Das würde ja bedeuten, dass ca. 900 FBI-Mitarbeiter eine Woche lang nichts Anderes hätten tun müssen um jeder jeden Tag 12 Stunden am Stück E-Mails zu lesen. Dabei lasse ich einmal außen vor, dass das Lesen der einzelnen E-Mail ja nur die Hälfte der Miete ist. Die einzelnen Mitarbeiter müssten sich ja auch noch zu den gefundenen Inhalten mit den anderen 899 Kollegen abgleichen.

An dieser einfachen Rechnung sieht man bereits, dass das FBI die Aufgabe, die 650.000 E-Mails innerhalb einer Woche tatsächlich seriös zu prüfen nicht leisten konnte. Zumindest wenn man ein Bild zeichnet, in der eine große Schar von FBI-Mitarbeitern an ihren Computern sitzen und die E-Mails der Reihe nach lesen.

Doch wir im Jahr 2016. Es ist die Zeit der Digitalisierung. Und es ist die Zeit von Big Data, Cognitive Computing und künstlicher Intelligenz.

Wer in einer solchen Zeit noch vermutet, dass eine Menge von 650.000 E-Mails sequenziell von Menschen gelesen und verglichen werden muss, hat entweder selbst keine Ahnung, oder aber er vermutet, dass seine Zuhörer von der Materie keine Ahnung haben.

Im Zeitalter von Big Data und digitalen Assistenten ist eine Menge von 650.000 Textdateien, denn E-Mails kann man durchaus auch als Textdateien ansehen, so gut wie nichts. Und mit einer entsprechenden Analysestrategie und unter Einsatz von digitalen Assistenten schrumpft das Problem tatsächlich so zusammen, dass man in einer Woche zu einer serösen Aussage kommen kann.

Und dazu gibt es genügend Tools, mit denen man eine Datenmenge von 650.000 E-Mails in kürzester Zeit durch Prüfung auf Duplikate, Absender/Empfänger und Ausschluss ganzer E-Mail Threads auf eine managebare Größe reduzieren kann.

HuffPost-Tarif

Europa-Flat, Daten-Flat: Einer der günstigsten Handy-Tarife auf dem Markt

Mit der Spar-Aktion der Huffington Post in Zusammenarbeit mit Chip und Tarifhaus bucht ihr einen Smartphone-Tarif, der preislich kaum zu schlagen ist und eine Vielzahl an Vorteilen bietet.
Mehr Infos findet ihr hier.

Das ist kein Hexenwerk und lässt sich selbst auf dem heimischen Rechner nachvollziehen. Man braucht dazu keinen Großrechner. Und die Tools, die wir mittlerweile zur Verfügung haben, um auch größte Datenbestände zu analysieren und für uns Menschen in kürzester Zeit aufzubereiten, sind ungemein leistungsfähig.

Ich will hier ein Beispiel aus einem anderen Bereich bringen, das Sie selbst auch nachvollziehen können, wenn Sie das wollen. Um mir umfangreichste Texte zu erschließen, nutze ich ein Tool, das mir die Texte in Form einer Word Cloud aufbereitet.

Ich kopiere dazu den zu analysierenden Text, selbst wenn es hunderte von Seiten sind, in den Eingabebereich dieses Tools, klicke auf "Create" und erhalte in weniger als einer Minute eine aufbereitete Word Cloud. Dabei sortiert das Tool sämtliche Worte des Texts nach Häufigkeit und bereitet dann auf dieser Grundlage eine entsprechende Grafik auf. Ein Vorgang, für den ich als Mensch Wochen investieren müsste.

Wenn Sie mir nicht glauben, machen Sie selbst den Test. Aber nicht schummeln.

Auch auf HuffPost:

Leserumfrage: Wie fandet ihr uns heute?

2016-07-11-1468249306-1333267-umfrage.jpg

Hier geht es zur Umfrage.

Lesenswert:

Ihr habt auch ein spannendes Thema?
Die Huffington Post ist eine Debattenplattform für alle Perspektiven. Wenn ihr die Diskussion zu politischen oder gesellschaftlichen Themen vorantreiben wollt, schickt eure Idee an unser Blogteam unter blog@huffingtonpost.de.