Logo von heise online

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.683.110 Produkten

Stefan Krempl 168

Missing Link: Street View verrät Wahlverhalten oder Datenschutz mit KI aushebeln

Missing Link: Künstliche Intelligenz oder Was Google Street View über Wahlvorlieben verrät

Forschern ist es gelungen, mithilfe von Deep Learning aus öffentlich verfügbaren Google-Straßenaufnahmen auf soziale, wirtschaftliche und politische Muster in Stadtvierteln zu schließen. Wie bei ähnlichen KI-Verfahren gibt es Datenschutzbedenken.

Wenn einem beim Durchfahren einer Stadt in den USA mehr viertürige Stufenhecklimousinen als Pickup-Trucks begegnen, ist die Wahrscheinlichkeit mit 88 Prozent recht groß, dass dort bei der nächsten Präsidentschaftswahl ein Kandidat der Demokraten das Rennen macht. Lässt sich das gegenteilige Phänomen beobachten, dürfte sich die Kommune eher für einen Republikaner aussprechen – bei einer Treffsicherheit von 82 Prozent.

Anzeige

Was ein US-Forscherteam jüngst herausgefunden und in einem Beitrag in den Proceedings of the National Academy of Sciences veröffentlicht hat, hört sich zunächst nicht nach höherer Mathematik an. Marktforscher und Politikanalysten könnten durch eigene Recherchen und Umfragen zu ähnlichen Ergebnissen kommen. Überraschender und vermutlich deutlich folgenschwerer ist die Art und Weise, wie die Wissenschaftler unter Einsatz von Methoden Künstlicher Intelligenz (KI) zu den Resultaten gekommen sind.

Die Gruppe, die Timnit Gebru als Doktorandin an der Stanford-Universität geleitet hat, analysierte für das Vorhaben mit maschineller Hilfe rund 50 Millionen öffentlich verfügbare Bilder und Standortdaten von Google Street View. Erstmals schafften es die Wissenschaftler dabei über Deep-Learning-Methoden, aus dem Straßenansichtsdienst weitere Daten abzuleiten, diese zu sortieren, nach Zusammenhängen zu durchschürfen sowie soziale, wirtschaftliche und politische Muster wie Einkommen, Einkaufsvorlieben oder Interessen für einzelne Parteien in Stadtvierteln der gesamten USA auszumachen.

Der Ansatz könne helfen, schreiben die Forscher, klassische Formen der Demoskopie und die Volkszählung zu ergänzen und zu unterfüttern. Automatische Systeme dürften ihnen zufolge imstande sein, demografische Informationen künftig effizienter als "arbeitsintensive Ansätze" in hoher "Auflösung" und "fast in Echtzeit" zu messen.

Für den Informatiker Erez Lieberman Aiden, der ein genomisches Forschungszentrum an der Baylor School of Medicine leitet und das von Stanford aus orchestrierte Team beraten hat, geht das Projekt weit darüber hinaus: "Auf einmal können wir Bilder genauso analysieren wie bislang Text", erklärte er der New York Times. Computer dürften nun auch in diesem Bereich ihre Fähigkeiten ausspielen, "ohne eine Hand auf den Rücken gebunden zu haben".

Ähnlich wie bei Menschen gibt es bei der KI über die Untersuchung von Text, Sprache und Beobachtungen unterschiedliche Wege, um sich die Außenwelt zu erschließen. Die ersten beiden Kategorien waren bei rechnergestützten Verständnisversuchen bisher trotz aller semantischer Mehrdeutigkeiten prinzipiell einfacher zu handhaben, da sie zunächst auf begrenzten Zeichenabfolgen wie dem Alphabet aufbauen. Aber auch die Bilderkennung hat in den vergangenen Jahren Fortschritte gemacht, auch weil Konzerne viel Geld in dieses Gebiet gesteckt und etwa Methoden zur Gesichtserkennung verbessert haben.

Gebru et.al.
(Bild: Gebru et.al.)

Das auf Google Street View aufsetzende Projekt weist in diese Richtung. Wichtigster Hinweis ist dabei das liebste Kind der US-Amerikaner und ein Symbol der westlichen Kultur: das Auto. Ein solches findet sich den Forscher zufolge in 90 Prozent der US-Haushalte und die Wahl des motorisierten Fahrzeugs werde beeinflusst durch zahlreiche demografische Faktoren einschließlich der Bedürfnisse, der persönlichen Vorlieben und der ökonomischen Gesamtsituation der Halter.

Anzeige

Um diese Variablen für den Computer zu erschließen, entwickelten die Wissenschaftler ein Erkennungssystem, das vor allem auf dem Deep-Learning-Modell der "Convolutional Neural Networks" (CNN) aufbaut. Darunter versteht man ein künstliches neuronales Netz, das konzeptionell biologische Prozesse für das maschinelle Lernen nachzuahmen versucht, und laut den Autoren den bislang für die Objektklassifizierung erfolgreichsten einschlägigen Algorithmus nutzt. Mit dem System sei es möglich gewesen, nicht nur insgesamt 22 Millionen Autos in den komplexen Straßenszenen aus Street View auszumachen, sondern auch eine weite Reihe ihrer Charakteristiken festzustellen. Dazu gehörten etwa der Fabrikant, das Modell und das Baujahr.

Die CNN-Variante ist laut den Insidern mittlerweile fähig, Autos jeweils binnen 0,2 Sekunden in eine von 2657 Kategorien einzuordnen. Die Treffsicherheit, ein normales zwei- oder viertüriges Fahrzeug zu erkennen, liege bei 95 Prozent anhand der Testdaten. Vans und Minibusse könne das System mit einer Trefferquote von 83 beziehungsweise 91 Prozent unterscheiden, Geländefahrzeuge sowie SUVs zu 86 und Pritschenwagen zu 82 Prozent. Die Klassifizierung der 50 Millionen Aufnahmen dauerte so zwei Wochen. Ein menschlicher Experte hätte dafür über 15 Jahre gebraucht, da ein einzelner entsprechender Vorgang bei ihm rund zehn Sekunden dauert.

Vorher war es nötig, den CNN-Algorithmus entsprechend zu trainieren. Das habe die eigentliche Herkulesaufgabe dargestellt, erzählte die derzeit bei Microsoft Research tätige Gebru der New York Times. Viele KI-Projekte scheiterten genau an diesen Grundlagen in der physikalischen Welt. Maschinenlernen funktioniert in der Regel so, dass eine große Datenmenge in spezielle Kategorien eingeteilt wird, wobei einzelnen Werten unterschiedliche Zusatzinformationen angefügt werden. Eine von Hand gepflegte Datenbank musste auch in diesem Fall her, um der KI-Software zunächst zu helfen, die Bilder und die darauf ersichtlichen Objekte zu identifizieren und zu unterscheiden.

Die Forscher heuerten dafür mehrere hundert Leute an, die aus einem Testset von einer Million Aufnahmen die darin sichtbaren Autos herauspickten und klassifizierten. Darunter waren Liebhaber, die der Maschine etwa beibrachten, die subtilen Unterschiede an den Rückleuchten eines Honda Accord der Baujahre 2007 und 2008 wahrzunehmen.

Nachdem das System eingearbeitet war, konnte es unter anderem das durchschnittliche verfügbare Haushaltsgeld, die hauptsächliche ethnische Herkunft, die Ausbildung und die Wahlmuster auf der Ebene einzelner Viertel mit recht hoher Wahrscheinlichkeit bestimmen. Unter den weiteren Korrelationen war, dass Burlington in Vermont die Stadt mit den Autos mit dem wenigsten Benzinverbrauch war; Casper in Wyoming im Mittleren Westen hatte dagegen fahrzeugtechnisch die schlechteste Kohlendioxidbilanz pro Kopf. Generell schätzte der Algorithmus die Oststaaten und den Westen der USA als ökologisch "grüner" ein als die Regionen im Binnenland.

Chicago ist laut der Analyse die Stadt mit den höchsten Unterschieden bei den Einkünften mit großen Clustern teurer und billiger Autos in einzelnen Vierteln. Jacksonville in Florida ist in dieser Hinsicht die homogenste Gemeinde mit einem recht hohen Ausgabeniveau. New York hat das System als die Stadt mit den teuersten Autos identifiziert, in El Paso hat es die meisten Hummer entdeckt, in San Francisco den höchsten Anteil ausländischer Modelle.

Als die zwei Marken, die am stärksten auf asiatisch geprägte Viertel hinweisen, haben die Forscher mithilfe der Maschine Hondas und Toyotas ausgemacht. Autos von Chrysler, Buick und Oldsmobile verwiesen auf Gegenden mit vielen Afroamerikanern. Wo vor allem Pickups, Volkswagen und Aston Martins parkten, galt dies als Anzeichen für einen überwiegend von Weißen bewohnten Kiez.

Selbst das Alter von Kindern in einer Gegend konnten die Wissenschaftler nach eigenen Angaben mit einer noch "moderat akkuraten" relativen Häufigkeit von knapp über 50 Prozent einschätzen. Nicht ableiten ließ sich mit der Methode aber etwa der Anteil von Landwirten, die in einer bestimmten Region wohnen. Traktoren fanden sich auf den Straßenansichten offenbar selten. Generell sind viele der Verknüpfungen ähnlich wie bei anderen KI-Projekten mit Vorsicht zu genießen, schon allein da die Fehlerwahrscheinlichkeiten dabei meist noch hoch sind.

Gebru und ihre Kollegen sind sich ihrem Artikel nach bewusst, dass ihr Verfahren nicht nur Marktforschern und Politikern das Leben erleichtern könne, sondern auch "wichtige ethische Bedenken" hervorrufen werde. Es sei klar, dass öffentliche Daten nicht verwendet werden sollten, um die "angemessenen Erwartungen an die Privatheit individueller Bürger" zu unterlaufen. Der Datenschutz werde daher bei der Weiterentwicklung des Ansatzes etwa für Voraussagen bis zur Ebene einzelner Individuen eine wichtige Stellschraube bilden. Material dafür dürfte es genug geben, sobald mehr hochautomatisierte Autos mit ihren Kameras und Sensoren durch die Straßen fahren. Hierzulande hatte Street View schon vor dem Start des Dienstes 2010 Datenschützer auf den Plan gerufen.

168 Kommentare

Themen:

Anzeige
  1. ICAART 2017: Roboter handeln nicht ethisch, schärfen aber den Blick auf ethische Fragen

    Roboter, Softbank Robotics

    Auf der diesjährigen ICAART-Konferenz verhandelten Wissenschaftler das große Thema "Ethik und KI". Dabei führten sie überraschende Experimente ins Feld und fragten unter anderem, ob Roboter ethische Rahmen stecken oder Drohnen an sich böse sein können.

  2. KI gegen Bot-Erkennung: reCAPTCHA erneut umgangen

    Googles Spracherkennung ließ sich zur Umgehung von ReCaptcha nutzen

    Das Wettrennen zwischen Captchas und KI hat Ende Februar ein amüsantes Zusatzkapitel bekommen: Ein Hacker nutzte für ein einen Proof of Concept Googles Spracherkennung, um Googles reCAPTCHA v2 auszutricksen.

  3. Entspannter baden: Intelligente Drohne warnt vor Haien

    Intelligente Drohne erkennt Gefahr durch Haie

    Um das Schwimmen und Surfen entlang Australiens Küsten sicherer zu machen, hat ein australisches Unternehmen eine Drohne mit Künstlicher Intelligenz ausgestattet. Sie soll Haie in Echtzeit erkennen und Angriffsopfern zur Hilfe eilen.

  4. Googles Guetzli-Encoder schrumpft JPEG-Bilder um ein Drittel

    Googles Guetzli-Encoder schrumpft JPEG-Bilder

    Der JPEG-Encoder Guetzli erzeugt kleinere Bilddateien als herkömmliche Encoder. Trotz der geringeren Dateigröße weisen die Bilder weniger sichtbare Artefakte auf.

  1. Wie man KI austrickst

    Wie man KI austrickst

    Systeme für künstliche Intelligenz werden immer leistungsfähiger, aber wirklich intelligent sind sie noch nicht. Wie Forscher jetzt gezeigt haben, lassen sie sich relativ leicht in die Irre führen.

  2. Statistik der Woche: Künstliche Intelligenz - Fluch oder Segen?

    Statistik der Woche: Künstliche Intelligenz - Fluch oder Segen?

    Den Einzug von KI-Systemen in unseren Alltag sehen Teilnehmer einer Umfrage als zweischneidiges Schwert. Welche Chancen und Gefahren angenommen werden, verdeutlicht unsere Infografik.

  3. Mode als Tarnung für die Massenüberwachung des öffentlichen Raums?

    Überwachungskameras mit Gesichtserkennung, mit denen Menschen identifiziert und verfolgt werden können, breiten sich nicht nur aus Sicherheitsgründen aus.

  1. Vorstellung: Mercedes G-Klasse

    Mercedes G-Klasse

    Erstmals seit knapp 40 Jahren stellt Mercedes eine von Grund auf neu konzipierte G-Klasse vor. Die Optik lässt einen glauben, es hätte sich kaum etwas verändert. Schon im Jahre 2014 kündigten wir die Wende der G-Klasse an. Kam es so, wie wir damals glaubten?

  2. Meltdown und Spectre: Neustart-Probleme auch mit Skylake- und Kaby-Lake-CPUs, neue Intel-Benchmarks

    Meltdown und Spectre: Neustart-Probleme auch mit Skylake- und Kaby-Lake-CPUs, neue Intel-Benchmarks

    Intel muss in einer neuen Sicherheitsmitteilung einräumen, dass es nach dem Einspielen der Firmware-Updates auch auf Core-i-6000/7000-Systemen zu plötzlichen Neustarts kommen kann.

  3. TeamViewer IoT soll das Internet der Dinge überwachen

    Digital gesteuertes Zuhause

    Smarte Geräte daheim, im öffentlichen Raum und in der Industrie sollen leichter überwacht und aus der Ferne gewartet werden. Dafür bietet TeamViewer eine neue IoT-Software an.

  4. Fritzbox-Updates: Kommendes FritzOS 7 könnte zwei Router per Mesh-WLAN koppeln

    Fritzbox-Updates: FritzOS 7 könnte zwei Fritzboxen per Mesh-WLAN koppeln

    Der Routerhersteller AVM erwägt, die Mesh-Funktionen im erwarteten FritzOS 7 weiter auszubauen, um entfernte Geräte via Mesh anzukoppeln. Das erklärte die Firma im Rahmen einer Stellungnahme zu einem missverständlichen Facebook-Posting.

Anzeige