Zuhause Appscout Wie man Big Data auf die reale Welt anwendet

Wie man Big Data auf die reale Welt anwendet

Video: Smart Data Analytics – Optimierung in Automobilproduktion | Big-Data.AI Summit 2018 (November 2024)

Video: Smart Data Analytics – Optimierung in Automobilproduktion | Big-Data.AI Summit 2018 (November 2024)
Anonim

In dieser Ausgabe von Fast Forward sprach ich mit Hicham Oudghiri, dem CEO und Mitbegründer von Enigma, einem Unternehmen, das sich auf das Sammeln und Verstehen großer Datenmengen spezialisiert hat. Enigma ist ein Unternehmen für operatives Datenmanagement und Geheimdienste für Privatkunden. Am bekanntesten ist es jedoch für Enigma Public, eine Sammlung durchsuchbarer, öffentlich zugänglicher Datensätze, die alles von den Gehältern der Mitarbeiter des White House Office bis hin zu den Inspektionen von Restaurants in New York City umfassen. Wir sprachen über die Leistungsfähigkeit von Big Data, die Grenzen des Verbraucherschutzes und die Zukunft unserer datengetriebenen Welt.

Warum erklären Sie mir nicht ein bisschen, was es heute bedeutet, ein Open-Data-Unternehmen zu sein?

Absolut. Wir begannen damit, eine riesige Menge öffentlicher Daten zu sammeln, wo immer wir sie finden konnten, mit der Mission, wirklich zu versuchen, sehr unterschiedliche Fakten über die Welt miteinander in Verbindung zu bringen. Dabei stellten wir fest, dass genau wie der Zugriff auf die zugrunde liegenden Daten unterbrochen wurde, dieses Muster für die eigenen Daten von Personen und für öffentlich-private Datenmeldesysteme wie in regulatorischen Umgebungen widerhallte. Wirklich, was wir mitgebracht haben, war diese Vorstellung von offenen Daten als ein operatives Modell, wo immer wir hingingen.

Unser heutiger Sweet Spot ist es, dieses riesige Asset-Repository an öffentlichen Daten zu kultivieren und in tatsächlichen Problemumgebungen, die sich häufig hinter der Firewall für Unternehmen befinden, zum Tragen zu bringen. Obwohl wir eine enorme Menge an Daten sammeln und verteilen, haben wir festgestellt, dass der nächste Schritt, der darin besteht, diese Daten tatsächlich zu interpretieren und mit privaten Daten zu verknüpfen, wirklich dazu beiträgt, die Auswirkungen einiger der Probleme, die wir lösen wollten, zu skalieren.

Die Leute hören von offenen Datensätzen, öffentlichen Datensätzen und privaten Datensätzen. Um welche Art von Datensätzen handelt es sich hier?

Wir sprechen über Quelldaten, offizielle Daten, Dinge, die Regierungsbehörden veröffentlichen würden, Dinge, die internationale Agenturen veröffentlichen würden, alles, was unterschiedlich ist, von Unternehmensregistrierungsaufzeichnungen und Immobilienbewertungen bis hin zu H-1B-Visa oder Frachtcontainersendungen. Auf keinen Fall über Dinge wie LinkedIn-Daten sprechen, die in letzter Zeit ein großes Thema waren, um zu klären, ob es sich überhaupt um einen öffentlichen Datensatz handelt oder nicht. Es gab diese Klage in letzter Zeit mit viel Streit.

Es handelt sich jedoch hauptsächlich um offizielle Quelldaten, bei denen es ein Mandat und eine Art formelle rechtliche Genehmigung gab, um diese Daten öffentlich zugänglich zu machen, hauptsächlich, um die Transparenz im Wirtschafts- und Handelssystem zu erhöhen. Aus Sicht der Rechenschaftspflicht ist es für uns sehr wichtig zu wissen, wie unsere Regierung mit den verschiedenen privaten Unternehmen umgeht, oder aus Sicht der Rechenschaftspflicht, wie sich die Verteilung der Visa auf die Unternehmen auswirkt. Diese Daten werden häufig von der Regierung für alternative Zwecke wie Berichterstattung, Planung und Ressourcenzuteilung gesammelt und dann für diesen sekundären und häufig tertiären Nutzen an die Öffentlichkeit zurückgegeben. Das beliebteste Beispiel sind nur Wetterdaten, oder?

Alle Wetterdaten, die wir sammeln, stammen aus offiziellen Quellen oder GPS als Technologie.

Nehmen Sie also all diese öffentlichen Datensätze und können Sie sie dann mit privaten Datensätzen zusammenführen, die Ihnen ein Unternehmen speziell zur Verfügung stellt, und sehen Sie wirklich, wie die beiden kombiniert werden?

Ja, sehr oft. Denken Sie an einen kanonischen Anwendungsfall, bei dem Sie versuchen, herauszufinden, ob ein Unternehmen überhaupt real ist. Wenn es sich um eine kleine Firma handelt, nehmen wir zum Beispiel ein Restaurant oder ein kleines Unternehmen. Sehr oft ist das Profil, das sie haben würden, extrem dünn. Aber wenn Sie sich Dinge wie ihre Alkoholgenehmigungen oder auch Inspektionen des Arbeitsministeriums oder der Krankenakten ansehen, erhalten Sie ein viel genaueres Bild davon, wer sie sind.

Oft hilft dies diesen Unternehmen, zu erkennen, dass sie tatsächlich Zugang zu Krediten haben und versichert sind. Der Wechsel von "Hier ist Ihr 18-seitiger Antrag" und einem sehr ärgerlichen Prozess durch sieben verschiedene Compliance-Sätze zu etwas, das online automatisiert und im Allgemeinen weniger risikoreich erfolgen kann.

Anstatt sie einfach in Google einzugeben, um zu prüfen, ob sie eine Website haben und ob sie echt sind, können Sie all diese anderen Datensätze auch für grundlegende Dinge validieren lassen?

Absolut.

Bevor wir live gingen, sprachen wir über Ozark , also Ihre Lieblingssendung, meine neue Lieblingssendung, und die Idee, diese Datensätze für Compliance- und Finanzberichte zu verwenden und sogar Geldwäscher zu jagen.

Ja. Zuallererst eine der besten Shows da draußen. Ein riesiger Plug-in für Netflix, der zu einem erstklassigen Hollywood-Studio geworden ist.

Sie haben dafür bezahlt. Sie haben sich ihren Weg in diesen Markt gekauft.

Sie haben sicherlich. Aber die Show handelt von diesem Jason Bateman Charakter, der sich als Geldwäscher für dieses Drogenkartell befindet. Der Haken ist, dass er sein Leben rettet, indem er sagt, dass er in die Ozarks gehen und neue Kanäle finden wird, um Geld zu waschen. Er beginnt, sich in diese schläfrigeren Geschäfte einzukaufen, und geht dann eine Reihe von Kosten durch.

Das Problem der Geldwäsche ist insofern ein großes theoretisches Problem, als Sie ehrlich gesagt die Aktivitätsmuster zwischen verschiedenen Händlern oder Verbrauchern von Finanzdienstleistungen und auch die Verbindungen zwischen ihnen untersuchen. Sie werden also einen registrierten Agenten mögen, offensichtlich jemanden wie Jason Bateman, der herumläuft und dies für ein paar Unternehmen tut. Er kauft sich privat bei ihnen ein und beginnt, seinen Namen in einer Vielzahl von verschiedenen Formen zu finden, und Sie werden dieses Aktivitätsmuster bemerken. Dies ist etwas, gegen das Banken ankämpfen müssen, offensichtlich, weil es ein Nachteil für das System ist und sie dafür auf dem Haken sind.

Kriminalität ist genauso digital und dezentral wie Musik. Dies ist ein viel größeres Problem. Es gibt keine große Mob-Familie, in der die Regierung monatelang herumlungern und sie im Capone-Stil bekommen könnte. Dies ist eine umfassende Verfolgungsjagd an vielen Fronten. Wir haben geholfen und daran gearbeitet, öffentliche Daten für dieses Problem zu nutzen, aber auch unsere Technologie, mit der wir all diese öffentlichen Daten aggregiert haben, um dieses Problem zu bewältigen, nur weil die Banken einen großen technologischen Aufschwung haben tun, um ihre eigenen Datensätze in aussagekräftigen, kontextbezogenen Hinweisen für diese Ermittler zusammenzuführen, über die sie verfügen.

Ich glaube, wir sind an einem Punkt angelangt, an dem wir all diese öffentlichen Daten haben, die von Regierungsbehörden erstellt wurden. Wir haben all diese privaten Datensätze. Jedes Unternehmen verfügt über mehrere Datensätze und viele verschiedene Formate, häufig innerhalb desselben Unternehmens. Es gibt jedoch nicht viel Standardisierung, und es ist eine große Herausforderung, sie zusammenarbeiten zu lassen.

Es ist eine große Herausforderung, und wahrscheinlich ist eine der größten Thesen, die wir bei Enigma haben, eine große Kluft. Einer meiner Investoren nannte es so - es gibt eine Welt, in der Daten in Bits instrumentiert werden, und es gibt eine Welt, in der Daten in Atomen instrumentiert werden. Die Technologiefirmen, Google, Facebook, Amazon, alle haben großartige Arbeit geleistet, indem sie die Daten, die sie aus Ihren Aktivitäten beim Surfen im Internet erhalten, aufgenommen und diese neuen Dienste wie Suche und bessere E-Commerce-Erlebnisse erstellt haben. Aber diese Daten existieren alle. Es ist digital native. Es hört dir nur im Web zu. Das Web ist ein Protokoll, und diese Protokolle wurden so konzipiert, dass sie sich gegenseitig sprechen.

Aber wenn Sie diese Daten haben, die in Atomen oder der realen Welt instrumentiert sind, wie jemand, der in eine Bank in den Ozarks geht und nach einem Kleinkredit fragt, sieht das anders aus als jemand, der in eine andere Bankfiliale oder einen Frachtcontainer geht Schiff kommt herein und fragt nach dem Namen des Unternehmens, das den Versand durchführt. Alle diese Daten wurden so konzipiert - oder nicht -, dass sie miteinander sprechen. Daher besteht ein großes Problem beim Zusammenfügen dieser Daten. Ich denke, es wird für diese weniger, rein technisierten Branchen eine längere Zeit dauern, bis sie die Vorteile der Technologie mit Big Data nutzen können. Aber wenn sie es tun, wird sich meiner Meinung nach viel daran ändern, wie wir Tag für Tag auf ziemlich wirkungsvolle Weise leben.

Ich habe auch das Gefühl, dass Unternehmen, wenn es ein finanzielles Motiv gibt, diese Datensätze zusammenzufügen und diese Erkenntnisse zu gewinnen, einen Weg finden, dafür zu bezahlen, und einen Weg finden, dies zu erreichen. Kreditkartenunternehmen sind eines der ersten Unternehmen, das Muster und Betrug erkennen kann. Ich bin der Meinung, dass der öffentliche Sektor ziemlich weit hinterherhinkt, wenn es darum geht, aus diesen Datenmengen Erkenntnisse zu gewinnen. Ist das eine faire Einschätzung?

Der Privatsektor hatte in gewisser Hinsicht immer einen Vorsprung bei der Operationalisierung der Technologie. Der finanzielle Anreiz ist enorm und auch die Arbeitsweise einer kleineren Einheit. Die US-Regierung ist im Grunde genommen eine der größten Organisationen der Welt, und es ist wirklich ein Problem der Menschen, etwas zu tun. Stellen Sie sicher, dass die Anreize aufeinander abgestimmt sind und die Menschen das richtige Maß an Risiko eingehen.

Aber wir haben gesehen, dass die Regierung einige sehr innovative Dinge getan hat. Ich glaube, wir haben mit der Stadt New Orleans zusammengearbeitet, um ihnen zu helfen, prinzipiell vorherzusagen, wo sich die Slum-Vermieter befanden, hauptsächlich, um Rauchmelder in diesen Häusern zu installieren. Post-Katrina, du hattest so viel Pest. Viele Vermieter kamen davon und ließen Menschen mit schlechten Verhältnissen zurück. Ganz ehrlich, Rauchmelder leisten nur einen großartigen Beitrag, um den Tod durch Feuer zu verhindern. Anstatt einen Feuerwehrmann zu einem zufälligen Haus zu schicken, was wäre, wenn Sie Faktoren wie Demografie und das Alter des Gebäudes heranziehen und das letzte Mal eine bestimmte Art von Installation einer Infrastruktur wie Telekommunikationsinfrastruktur?

Sie verwenden all diese Fakten und erhalten eine wesentlich höhere Trefferquote für die Türen, an die Sie klopfen. Wir haben viel von dieser Art von Geldball für lokale Regierungsangelegenheiten gesehen, der sich ziemlich stark auswirkt. Wie Sie sich vorstellen können, wurden in der Geheimdienstgemeinschaft unheimlich viele Daten verwendet. Wir finden, dass es Taschen der Innovation gibt. Auch hier geht es darum, wie Sie es operationalisieren.

Sie haben alle diese Datenpunkte, müssen sie jedoch in geeigneter Weise abfragen und nach Mustern suchen. Man muss fast nach den Zusammenhängen suchen, und das ist eine ganze Reihe von Fragen und Antworten. Es geht darum, eine Beziehung zu den Daten herzustellen, und ich denke, wir fangen gerade erst an, herauszufinden, wie das funktioniert.

Ja. Wir fangen an herauszufinden, wie es aus einer Skillset-Perspektive funktioniert. Und es gibt eine Art Umdenken in Bezug auf statistisches Denken im Vergleich zu nicht statistischem Denken. Es gibt das Sprichwort: "Alle Modelle sind falsch, aber einige sind nützlich" - es geht also wirklich darum, ob Sie ohne die Daten und ohne die Algorithmen die Parameter Ihres statistischen Denkens ein wenig kontextualisieren können. Ich verstehe das vielleicht nicht richtig, wie im Falle eines Feuers, wir verstehe das vielleicht nicht richtig, aber wir erhöhen möglicherweise unsere Chancen, es richtig zu machen, oder wir verringern möglicherweise unsere Risikofläche oder das, wonach wir suchen müssen. Wenn man diese Grundhaltung in das Problem einbringt, ist dies Kompetenz Nummer eins, wenn es darum geht, statistisch denken zu können. Einige Leute sind eingesperrt in: "Nun, der einzige Weg, wie wir sicher sein können, ist, ob wir X, Y und Z haben."

Ich werde Ihnen einen Fall in einem privaten Beispiel geben. In Banken wurde häufig aus Gründen des Betrugs und der Einhaltung von Vorschriften überprüft, ob jemand echt war, bevor eine Kreditkarte ausgestellt wurde. Dabei wurde sichergestellt, dass seine Telefonnummer und seine Adresse mit den Angaben auf dem Antrag übereinstimmten. Nicht alle Unternehmen nutzen derzeit das Festnetz. Nicht alle Unternehmen verwenden ihre Hauptadresse als die, in der sie tatsächlich tätig sind. Es gibt eine veraltete Realität von Leuten, die jetzt bei WeWork arbeiten, und Leuten, die Voice over IP verwenden. Machen Sie sich mit der Identifizierung von Personen durch ihre soziale Präsenz oder durch einige der Datensätze, die wir bei Enigma einbringen und die diese zusätzlichen Beweise liefern, vertraut. Historisches Durchsehen und Ausführen der Statistiken, um festzustellen, ob die Wahrscheinlichkeit, dass sie tatsächlich vorliegen, hoch ist, im Vergleich zu der Garantie, die Sie zuvor mit diesen alternativen Mitteln erhalten würden.

Ich denke, das ist auch ein interessanter Punkt, nämlich die Annahme, dass alle Modelle falsch sind, entweder größtenteils falsch oder in geringerem Maße falsch, aber das ist in Ordnung, weil es Ihnen trotzdem dabei helfen kann, gute Entscheidungen zu treffen. Ist das eine Fähigkeit, die wir gut darin machen, unsere Kinder zu unterrichten, und wo würden sie überhaupt diese Ausbildung erhalten? Ich meine, es wäre nicht unbedingt Mathe. Es wäre nicht in Social Studies. Woher bekommen sie diese Sensibilität?

Statistiken wurden oft untergeordnet, wie der Mathematikunterricht im Allgemeinen, aber Sie sehen es an anderen Orten. Sie sehen, dass es heutzutage sogar in Ihrem ESPN-Feed auftaucht. Die Menschen fühlen sich viel wohler damit, dass Vorhersage ein Teil ihres Lebens ist. Ehrlich gesagt, ich liebe diese Momente mit schwarzen Schwänen, in denen uns all das ins Gesicht fliegt. Nehmen Sie die letzte Wahl. Sie hatten Hilary gewonnen und Sie hatten die weltbesten Datenwissenschaftler an einigen der besten Institutionen, die es falsch nennen.

Gewinnen, aber Gewinnen hatte keine 70-prozentige Gewinnwahrscheinlichkeit, denn das bedeutet immer noch, dass Donald Trump eines von drei Siegen erzielt. Und rate was? Dies war eines dieser drei Male.

Absolut. Und dann gibt es die Bildung, dass wir sehen, dass diese Muster die Menschen komfortabler machen. In den Klassenräumen denke ich, dass eines der größten Probleme, das wir haben, nur das angewandte Lernen ist. Es ist so, als ob ich keine Ahnung hätte, warum sie im Klassenzimmer nicht persönliche Finanzen unterrichten. Ich meine, ich war ein Idiot mit meinem Geld im Alter von 18 Jahren und den Auswirkungen auf die Verschuldung und all das. Ich bin immer noch erstaunt darüber, dass sie das nicht tun. Ich habe das Gefühl, dass wir uns in einer Welt bewegen, in der Bildung mehr und mehr über das Angewandte und weniger über das Theoretische vermittelt wird. Aber dann mache ich mir Sorgen, wenn wir einige Teile des kulturellen Lernens verlieren. Es ist alles ein Kompromiss.

Ich werde diesen Weg noch weiter gehen und über künstliche Intelligenz sprechen.

Künstliche Intelligenz, eine immense Transformationstechnologie. Es scheint mir, dass künstliche Intelligenz eine Rolle spielt, wenn es darum geht, diese Welt des Überflusses an Daten zu verstehen und diese Muster für uns zu finden. Sind Sie optimistisch, dass AI uns dabei hilft, das zu verstehen, oder ist das etwas völlig anderes als der Rest unserer menschlichen Erfahrung?

Nein, ich meine, ich bin optimistisch in dem Sinne, dass ich optimistisch gegenüber der Menschheit im Allgemeinen bin. Ich habe das Gefühl, dass das eine Flip-Gen-Sache ist, die irgendwann bei Leuten passiert. Eines der Dinge, die ich am Versprechen der künstlichen Intelligenz am meisten mag, ist, dass es tatsächlich dazu beiträgt, dass die Technologie verschwindet, denn im Moment liegt der Fokus darauf, dass Technologie und Daten so präsent sind. In Wirklichkeit ist die Arbeit mit Daten jedoch sehr intensiv. Es gibt einen Grund, warum sie Data Mining nennen, wenn Sie nach Inhalten in einem Datensatz suchen. Es ist sehr böse. Die Datensätze sind nicht sauber. In gewisser Hinsicht ist es ein bisschen brutal.

Was ich an AI mag, ist, dass es diese Rückkopplungsschleifen aus beobachteten Erfahrungen erzeugt. Obwohl Sie all diese Daten an all diesen Orten sammeln, wissen Sie nicht unbedingt, wie sie zusammenkommen, und fangen Sie an, die Ergebnisse zu untersuchen. Maschinelles Lernen hilft uns dabei, das statistische Denken ein wenig ergebnisorientierter zu gestalten. Ich denke, es wird uns helfen, einiges von der Gemeinheit dieser Arbeit wegzudenken und ein bisschen ergebnisorientierter damit umzugehen. Jetzt ist es definitiv beängstigend, was die Auswirkungen auf die Automatisierung in einigen Bereichen angeht, in denen ich ehrlich gesagt der Meinung bin, dass die KI in Ruhe gelassen werden sollte, zum Beispiel eine Jury zu ersetzen. Werden wir jemals diese emotionale Intelligenzqualität bekommen? Ich weiß es nicht.

Und Sie müssten wählen und sagen, dass Sie diese emotionale Qualität in der Jury wollen, im Gegensatz zu der reinen Wahrscheinlichkeit, dass diese Person schuldig ist oder nicht?

Ja. Für mich, die zugrunde liegende Menschheit, halte ich es für überaus wichtig. Um ehrlich zu sein, bin ich optimistisch, dass wir das nicht verlieren werden, wenn wir sehen, wie wichtig es ist, Menschen zu überzeugen, statistisch zu denken.

Wir haben ein wenig darüber nachgedacht, ob LinkedIn ein öffentlicher Datensatz ist. Viele Menschen spüren, dass sie in dieser Welt leben, in der alles online verfügbar ist, von ihren Kaufmustern über ihr Alter bis zu ihrer Krankengeschichte. Es macht die Menschen unwohl. Es macht den Leuten Sorgen, dass die Regierung zu viele Informationen hat. Ich persönlich mache mir mehr Sorgen, dass private Unternehmen zu viele Informationen haben und weit weniger reguliert sind.

Ja.

Benötigen wir Gesetze zum Schutz unserer persönlichen Daten? Sollten persönliche Informationen getrennt von Ihren Regierungsunterlagen behandelt werden?

Absolut. Wir haben sehr wenig Schutz vor den Gesetzen, die die Art und Weise regeln, in der wir unsere Daten weitergeben. Denken Sie in bestimmten Berufen darüber nach. In der Ärzteschaft ist es auf Lockdown. Aber aus irgendeinem Grund ist es nicht unbedingt ein Lockdown in anderen Branchen. Der Grund war, dass Sie damals nicht viel mit Ihren persönlichen Daten anfangen konnten. Heute haben sie ein gutes Gespür dafür, wie Sie konvertieren können oder wie wahrscheinlich es ist, dass Sie sich irgendwo aufhalten. In jeder Hinsicht ist das meiner Meinung nach in der Tat meistens von Vorteil für uns.

Gleichzeitig verdienen unsere Daten in der Art und Weise, wie sie gehandhabt werden, diese Art von Heiligkeit. Europa hat sehr strenge Gesetze erlassen. Es gibt ein Gesetz namens GDPR. Es soll im Jahr 2018 in Kraft treten und trägt alles dazu bei, sicherzustellen, dass Unternehmen die Herkunft ihrer personenbezogenen Daten nachverfolgen, wer sie hat, wie der Zugriff auf sie im Unternehmen erfolgt, und dass Maßnahmen in Vergessenheit geraten. Wenn Sie "Meine Daten löschen" sagen, löschen Sie sie tatsächlich oder behalten Sie sie für eine andere Information? Es gibt also immer einen Austausch zwischen Verbrauchern und den Dienstleistungen, für die sie arbeiten. Viele dieser Dienste sind kostenlos und wir lieben sie, oder?

Ich würde einen Teil von mir für den Zugriff auf YouTube verschenken, oder? Ich bin nur sehr glücklich darüber.

Und wahrscheinlich haben Sie.

Und wahrscheinlich habe ich. Aber das bedeutet nicht, dass der Teil, den ich verschenke, nicht in einen Safe gesteckt werden sollte und dass ich weiß, dass sich dieser Kasten unter einem Bunker befindet und all diese guten Dinge.

Auch die Idee des Verfalls von Daten, die in der heutigen digitalen Welt ein relativ neues Konzept ist. Früher herrschte eine gewisse Dunkelheit. Wenn vor 30 Jahren etwas passiert wäre, wäre es schwierig, Aufzeichnungen zu finden und ein Profil von damals zu erhalten. Aber da sind die Kinder heute, die ihr ganzes Leben online waren, und was sie getan und gepostet haben, als sie 13 waren, wird da sein, als sie 63 waren.

Ja.

Wir haben keine legale Infrastruktur, die dies in irgendeiner Weise sinnvoll handhaben kann.

Nein, das tun wir nicht und es ist eine haarige Gegend. Es ist ein haariger Bereich im Arbeitsrecht. Es ist eine haarige Gegend zum Dating, oder?

Wenn Sie sich das Facebook-Profil von jemandem ansehen - ich denke, dass sich die Kultur daran anpassen wird, dass jemandes Online-Präsenz öffentlich ist. Aber es ist fast theatralisch. Es ist, als ob Ihre öffentliche Präsenz nicht das wahre Sie ist. Was war das für ein Jim Carey Film? Wir alle setzen metaphorisch eine Maske auf. Ich denke, Ihre Online-Präsenz wird eher dieser Galerie oder diesem Kunstwerk ähneln, das Sie beschreibt, und dann gibt es das wahre Sie. Aber du machst immer noch einen Body Shot oder so was wie… Das, du willst nie öffentlich sein. Es ist eine echte Frage, ob Menschen, die jung genug sind, die Möglichkeit haben, zu entscheiden, ob es klug ist, das online zu stellen oder nicht. Es ist sicher beängstigend.

Sprechen wir über die Trump-Administration, wenn wir davon sprechen, dumme Dinge online zu stellen. Ich habe an mehreren Fronten gehört… Sie arbeiten offensichtlich mit vielen öffentlichen Datensätzen. Sie müssen häufig die Erlaubnis einholen, um diese Informationen zu erhalten, oder herausfinden, wie Sie sie aufnehmen können. Ist es jetzt einfacher? Wie hat sich der Zugang zu öffentlichen Datensätzen seit Amtsantritt der Trump-Administration verändert?

Ja. Meine erste Einschränkung, wenn ich über dieses Zeug spreche, ist der große Unterschied zwischen der Trump-Administration und der US-Regierung. Die US-Regierung ist bei weitem eine der transparenteren Institutionen, die mir jemals auf der Welt begegnet sind. Wir sind in Bezug auf die Menge an Daten, die wir veröffentlichen, und wie viel wir für diese Art von Dingen aufwenden, im Vergleich zu unseren Kollegen äußerst transparent.

Ich meine, wenn es um Trump geht, war mir klar, dass jeder sehr besorgt sein sollte über die Haltung dieser Regierung in Bezug auf Transparenz und Informationsaustausch. Zuallererst gibt es sehr explizite Dinge wie das Aufschreiben der Besucherliste des Weißen Hauses, eine Praxis, die Obama eingeführt hat, und ich halte sie für eines der zentralsten Buchhaltungssysteme der Regierung. Es gab WPA-Daten, es gab Klimadaten und im Allgemeinen gab es sogar Diskussionen darüber, ob einige Volkszählungsdaten davon betroffen sind. Sie müssen sich daran erinnern, dass dies keine kleinen Anstrengungen sind. Ich denke, dass die US-Volkszählung jedes Mal eine Investition von über 4 Milliarden US-Dollar umfasst, an der mehr als 300.000 Freiwillige beteiligt sind.

Einige dieser Dinge werden sich in vier Jahren auswirken, wenn man nur die Finanzierungszyklen betrachtet. Obwohl diese Regierung sicherlich nicht freundlich ist, denke ich, dass das Transparenz-Rückgrat in diesem Land stark genug ist. Seltsamerweise kommt das sowohl von links als auch von rechts. Stark genug, um sicherzustellen, dass diese Bewegung in Richtung Offenheit der Informationen anhält.

Und auf diesen Datensätzen reitet viel.

Ja. So entscheiden wir, wo Krankenhäuser untergebracht werden sollen. So entscheiden wir, wie Krankenwagen verlegt werden. Auf diese Weise entscheiden wir, dass so viele Basisdienste, wie die Abfallwirtschaft, von solchen Dingen abhängen.

Sagen Sie den Leuten, die sich den öffentlichen Datensatz von Enigma ansehen, den ich schon mehrmals besucht habe… super, super cool. Was sollen die Leute erwarten, wenn sie dorthin gehen? Was können sie daraus machen?

Eine unserer Verpflichtungen ist es, bei dieser Mission, alle Daten zu sammeln, stets ehrlich zu sein und sie so weit wie möglich an die Menschen zurückzugeben. Die Verwendung für nichtkommerzielle und journalistische Zwecke ist völlig kostenlos. Wir möchten sicherstellen, dass jeder Zugriff auf diese Daten hat. Sie müssen sich nicht einmal anmelden oder uns Informationen geben, um darauf zugreifen zu können. Als wir das Unternehmen gründeten, gab es eine große Voraussetzung für den Zugang.

Wie wir im Laufe der Jahre viel mehr gelernt haben, waren Zugriffs- und Schnittstellendesign sowie Suche und Glaubwürdigkeit sehr wichtig. Das andere war die Kuration, und das ist der große Fokus von Enigma Public, das wir diesen Sommer neu aufgelegt haben, war die Vorstellung, dass die Menschen wissen müssen, wie diese Daten verwendet werden. Die Benutzer müssen nicht nur bewährte Methoden für den Umgang mit Daten kennen, sondern auch wissen, welche Datensätze für welche Zwecke geeignet sind. Was ist neu, was ist aufregend? Ich denke, diese Art von Bildung ist etwas, auf das wir sehr gespannt sind und von dem wir hoffen, dass die Leute es in dem Moment bekommen, in dem sie auf der Baustelle landen.

Ein Besuch lohnt sich auf jeden Fall. Ich denke, Unternehmen sehen diese Daten wieder und wissen, dass sie darauf aufbauen können. Ich denke, für Journalisten und Bürger ist viel mehr Bildung erforderlich.

Auf jeden Fall viel mehr Bildung und hoffentlich eine ganze Reihe von Dienstleistungen, die Dinge für Leute wie mich und dich bringen, wenn wir nicht sozusagen aus dem Häuschen sind.

Lassen Sie mich Ihnen die Fragen stellen, die ich allen in der Serie stelle. Welcher technologische Trend beschäftigt Sie am meisten? Gibt es irgendetwas, das dich nachts wach hält?

Der Trend, der mich am meisten beschäftigt oder der meiner Meinung nach am Horizont am meisten beachtet werden sollte, ist dieser Begriff der biologischen Programmierung. In diesem Maße können wir programmatisch viel besser Stränge des biologischen Lebens erzeugen Organismen. Das hat eine enorme Auswirkung für das Gute, aber auch eine enorme Auswirkung für die Fähigkeit, durch dieses Ding kleine, im Grunde genommen Missstände hervorzurufen. Überall dort, wo sich Technologie und Bio treffen, bin ich immer ein bisschen besorgt, wie das gehandhabt wird. Es ist für mich wie die nächste Welle nach dem Atomwaffeneinsatz, dass wir in der Lage sind, Dinge wie programmgesteuerte Sequenzen in einem kleinen Labor zu erstellen und zu verteilen.

Die Herausforderung besteht darin, dass selbst wenn wir hier in den USA Gesetze verabschieden, dies nicht bedeutet, dass jemand in China oder Russland nicht die gleiche Forschung betreiben kann.

Absolut - und sogar aus Sicherheitsgründen, richtig? Wir haben also jetzt wirklich die Mittel, damit jeder sein eigenes Programm zur biologischen Kriegsführung erstellen kann. Das ist für mich das, was mich am meisten beschäftigt. Aber die Kehrseite enthält Dinge wie personalisierte Medizin, die Tatsache, dass Sie meinen Körper wirklich verstehen können, Sie können fast diese biologische Version eines Softwareprogramms erstellen, das entwickelt wurde, um jede Krankheit, die ich habe, zu heilen. Genauso besorgt wie ich bin ich auch darüber aufgeregt.

Ich denke, der Mangel wird sein, dass wir eine Art ethische Struktur brauchen, um diese neuen Technologien einzuführen. Wir haben es mit Atomwaffen und Atomkraft getan, kaum, aber wir haben es dort getan, und ich denke, wir müssen etwas entwickeln ähnlich. Gibt es auf persönlicher Ebene eine Technologie, die Sie jeden Tag nutzen und die Ihr Leben verändert hat und die Sie begeistert?

Das ist irgendwie komisch, aber nur FaceTime. Oder Video-Chat. Ich habe einige Familienmitglieder im Ausland und ich reise viel für die Arbeit. Der Unterschied zwischen einem Telefonanruf und einem Video-Chat, der nur beiläufig am Telefon stattfindet, hat mir wirklich das ganze Versprechen gegeben, dass das Internet alle miteinander verbunden hat. In nur 15 Sekunden. Ich komme ursprünglich aus Marokko, sehe also jemanden auf der ganzen Welt und sage: "Hey, was hast du vor?" Zu sehen, wie das Wetter in ihrer Umgebung aussieht und wie sie sich anziehen und wie sie sich verhalten, hat wirklich verändert, wie ich mich mit den Leuten in meiner Umgebung verbunden fühle und mir das Gefühl gegeben, dass wir alle ein bisschen mehr in diesem großen Dorf leben, und ich wie dieses Gefühl.

Es gibt auch etwas Interessantes, ich habe den Videokonferenz-Boom gesehen. Es würde das nächste sein. Niemand würde mehr telefonieren. Videokonferenzen haben nie wirklich begonnen, aber Video-Chat, persönlicher, grundlegend anders und nicht in einer Arbeitsumgebung, etwas, das beinahe zwangloser ist als ein Telefonanruf. Als ob es eine augenblickliche Sache sein könnte.

Ich habe eine 3-jährige Tochter und sie hat den Dreh raus. Sie unterhält sich per Video, bevor sie anruft. Sie weiß nicht, was ein Anruf ist. Sie stellen eine Freisprecheinrichtung auf und bitten sie, mit jemandem zu chatten, und sie ist überhaupt nicht interessiert. Sie haben sie bei FaceTime vor ihren Großvater gestellt und sie könnte 20 Minuten dort sein.

Es wird für sie genauso seltsam sein wie diese Wählscheiben, mit denen Kinder heute nicht umgehen können. Hicham, wie können Leute dir online folgen, herausfinden, was du tust und mit Enigma Schritt halten?

Gehen Sie zu enigma.com. Schauen Sie sich Enigma Public an, das ist public.enigma.com. Besuche unsere Website. Wir haben ein ziemlich aktives Twitter-Konto, noch kein Instagram für uns.

Sag niemals nie.

Sag niemals nie. Aber-

Mit Infografiken kann man großartige Dinge machen.

Ja, das ist wahr. Wir sind wirklich große Fans von Daten. Wir haben diesen coolen Teil unserer Website, labs.enigma.com, in dem alle unsere Experimente und einige unserer Pro-Bono-Projekte aufgeführt sind, wie das, das ich mit New Orleans erwähnt habe. Deshalb würde ich das auch überprüfen.

Sehr cool. Vielen Dank, dass Sie gekommen sind.

Genial. Vielen Dank, dass Sie mich haben.

Wie man Big Data auf die reale Welt anwendet