Logo von Developer

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.508.171 Produkten

Rainald Menge-Sonnentag 47

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Die Tensor Flow Object Detection API nutzt der Suchmaschinenanbieter bereits intern in der Bildersuche, für Street View und in einem Tool für die Nest-Cam-Geräten. Nun hat Google das System als Open-Source-Projekt freigegeben.

Das Erkennen von Objekten auf Bildern ist eine Anwendung von künstlicher Intelligenz, die gleichermaßen praxistauglich ist und sich gut zur Demonstration eignet. Google hat nun mit der TensorFlow Object Detection API ein System veröffentlicht, das das Unternehmen laut dem Research-Blog bereits seit geraumer Zeit intern einsetzt. So ist es unter anderem als Bestandteil des Tools für die Nest-Cam-Geräte verfügbar, das beispielsweise einen Hinweis geben kann, wenn eine Person in den Kamerabereich tritt. Außerdem nutzt der Suchmaschinenanbieter es zum Erkennen von Straßennamen in Street View und zum Finden von Stilanregungen in der Google-Android-App.

Anzeige

Das Open-Source-Framework baut auf das von Google vorangetriebene ML-Framework (Machine Learning) TensorFlow auf und enthält bereits einige Erkennungsmodelle, darunter einen Single Shot MultiBox Detector (SSD), Region-based Convolutional Neural Networks (R-CNN) und Region-based Fully Convolutional Networks (R-FCN) sowie jeweils darauf aufsetzende Erweiterungen. Ein Jupyter Notebook ist ebenfalls Bestandteil des Open-Source-Projekts. Die MobileNets-Variante des SSD ist besonders schlank und damit auf den mobilen Einsatz optimiert. Google hatte mit einer Version des Faster R-CNN 2016 Microsofts COCO (Common Objects in Context) Detection Challenge gewonnen.

Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt.
Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt. (Bild: Google)

Bereits im September vorigen Jahres hatte Google mit "Show and Tell" ein System zum Erstellen von Bildunterschriften herausgegeben, das Objekte erkennt, beschreibt und ebenfalls als TensorFlow-Modell implementiert ist. Facebook hatte im Sommer 2016 mit DeepMask und SharpMask Open-Source-Bibliotheken veröffentlicht, die Objekte innerhalb von Bildern erkennen und auf der TensorFlow-Alternative Torch aufsetzen. Zudem bietet Microsoft mit den Cognitive Services ebenso Bildanalysefunktionen wie IBM mit der Watson API. (rme)

47 Kommentare

Themen:

Anzeige
  1. Machine Learning: Google bringt TensorFlow Lite für Android und iOS

    Machine Learning: Google bringt TensorFlow Lite für Android und iOS

    Die schlanke Variante des Open-Source-Frameworks bringt Machine Learning auf mobile Endgeräte und Embedded Devices. Zum Start gibt es Anbindungen für iOS und Android.

  2. Googles Guetzli-Encoder schrumpft JPEG-Bilder um ein Drittel

    Googles Guetzli-Encoder schrumpft JPEG-Bilder

    Der JPEG-Encoder Guetzli erzeugt kleinere Bilddateien als herkömmliche Encoder. Trotz der geringeren Dateigröße weisen die Bilder weniger sichtbare Artefakte auf.

  3. Google stellt Training-Werkzeuge für TensorFlow unter Open-Source-Lizenz

    Google stellt Training-Werkzeuge für TensorFlow unter Open-Source-Lizenz

    Tensor2Tensor soll das Erstellen von Deep-Learning-Modellen mit Googles Bibliothek TensorFlow vereinfachen.

  4. Machine Learning: TensorFlow 1.0 freigegeben

    Machine Learning: TensorFlow 1.0 freigegeben

    Schneller, flexibler und bereit für den Produktiveinsatz – die erste Hauptversion der quelloffenen Machine-Learning-Bibliothek, die etwa in Google Translate und DeepMind zum Einsatz kommt, ist nun offiziell verfügbar.

  1. Die Neuerungen von Linux 4.9

    Linux-Kernel 4.9

    Das XFS-Dateisystem kann jetzt doppelt gespeicherte Daten zusammenführen und große Dateien in Sekundenbruchteilen kopieren. Linux 4.9 verbessert zudem die Sicherheit. Neue Möglichkeiten zur Performance-Analyse erleichtern System- und Programmoptimierung.

  2. Windows-Festplatte aufräumen - so geht's

    Die Festplatte deines PCs ist voll? Kein Problem! Wir zeigen dir, wie du große Dateien findest, Datenballast loswirst und Platz schaffen kannst.

  3. Welche Browser unterstützen HTML5?

    Es gibt dutzende Web-Browser, die für unterschiedliche Zwecke gedacht sind. Aber welche unterstützen HTML5-Webseiten?

  1. iPhone, iPad, Mac & Co im Ausland billiger kaufen

    iPhones, iPads und Macs kosten außerhalb Deutschlands oft viel weniger. Beim Import gibt es allerdings einiges zu beachten – dies gilt auch für Zubehör und Ersatzteile. Wir verraten, wie Sie Schwierigkeiten vermeiden und wo Sie tatsächlich sparen können.

  2. Gehacktes GPS, Fachkräftemangel, Social Engineering: Herausforderungen der Cyber Defence

    Gehacktes GPS, Fachkräftemangel, Social Engineering: Herausforderungen der Cyber Defence

    Was ein James-Bond-Film vor 20 Jahren fiktional vorführte, scheint heute durchaus machbar. Auf der Cyber Defence Conference in Bonn wurde deutlich, welche Sicherheitsherausforderungen im Cyberspace lauern.

  3. 24 Geschenke im Adventskalender von heise Download

    24 Geschenke im Adventskalender von heise Download

    Musik-Tools, Spiele und mehr: heise Download verschenkt bis zum 24.12. viele Gratis-Vollversionen für Windows und Mac. Den Anfang macht ein Video-Konverter, außerdem wird ein Smartphone verlost.

  4. Die Neuerungen von Linux 4.15

    Linux-Kernel 4.15

    Das im Januar erwartete Linux 4.15 beseitigt ein Performance-Problem schneller Netzwerkverbindungen. Ebenfalls neu: Support für eine von Apple entwickelte Thunderbolt-Vernetzungstechnik.

Anzeige