Logo von Developer

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.508.171 Produkten

Rainald Menge-Sonnentag 47

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Die Tensor Flow Object Detection API nutzt der Suchmaschinenanbieter bereits intern in der Bildersuche, für Street View und in einem Tool für die Nest-Cam-Geräten. Nun hat Google das System als Open-Source-Projekt freigegeben.

Das Erkennen von Objekten auf Bildern ist eine Anwendung von künstlicher Intelligenz, die gleichermaßen praxistauglich ist und sich gut zur Demonstration eignet. Google hat nun mit der TensorFlow Object Detection API ein System veröffentlicht, das das Unternehmen laut dem Research-Blog bereits seit geraumer Zeit intern einsetzt. So ist es unter anderem als Bestandteil des Tools für die Nest-Cam-Geräte verfügbar, das beispielsweise einen Hinweis geben kann, wenn eine Person in den Kamerabereich tritt. Außerdem nutzt der Suchmaschinenanbieter es zum Erkennen von Straßennamen in Street View und zum Finden von Stilanregungen in der Google-Android-App.

Anzeige

Das Open-Source-Framework baut auf das von Google vorangetriebene ML-Framework (Machine Learning) TensorFlow auf und enthält bereits einige Erkennungsmodelle, darunter einen Single Shot MultiBox Detector (SSD), Region-based Convolutional Neural Networks (R-CNN) und Region-based Fully Convolutional Networks (R-FCN) sowie jeweils darauf aufsetzende Erweiterungen. Ein Jupyter Notebook ist ebenfalls Bestandteil des Open-Source-Projekts. Die MobileNets-Variante des SSD ist besonders schlank und damit auf den mobilen Einsatz optimiert. Google hatte mit einer Version des Faster R-CNN 2016 Microsofts COCO (Common Objects in Context) Detection Challenge gewonnen.

Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt. Bild: Google

Bereits im September vorigen Jahres hatte Google mit "Show and Tell" ein System zum Erstellen von Bildunterschriften herausgegeben, das Objekte erkennt, beschreibt und ebenfalls als TensorFlow-Modell implementiert ist. Facebook hatte im Sommer 2016 mit DeepMask und SharpMask Open-Source-Bibliotheken veröffentlicht, die Objekte innerhalb von Bildern erkennen und auf der TensorFlow-Alternative Torch aufsetzen. Zudem bietet Microsoft mit den Cognitive Services ebenso Bildanalysefunktionen wie IBM mit der Watson API. (rme)

47 Kommentare

Anzeige
  1. Googles Guetzli-Encoder schrumpft JPEG-Bilder um ein Drittel

    Googles Guetzli-Encoder schrumpft JPEG-Bilder

    Der JPEG-Encoder Guetzli erzeugt kleinere Bilddateien als herkömmliche Encoder. Trotz der geringeren Dateigröße weisen die Bilder weniger sichtbare Artefakte auf.

  2. Machine Learning: TensorFlow 1.0 freigegeben

    Machine Learning: TensorFlow 1.0 freigegeben

    Schneller, flexibler und bereit für den Produktiveinsatz – die erste Hauptversion der quelloffenen Machine-Learning-Bibliothek, die etwa in Google Translate und DeepMind zum Einsatz kommt, ist nun offiziell verfügbar.

  3. Google stellt Training-Werkzeuge für TensorFlow unter Open-Source-Lizenz

    Google stellt Training-Werkzeuge für TensorFlow unter Open-Source-Lizenz

    Tensor2Tensor soll das Erstellen von Deep-Learning-Modellen mit Googles Bibliothek TensorFlow vereinfachen.

  4. Maschinelles Lernen: TensorFlow erscheint für Windows

    TensorFlow kommt nach Windows

    Googles Framework für maschinelles Lernen bekommt mit Version 0.12 RC0 nativen Windows-Support. Außerdem gibt es eine experimentelle API zum Erstellen und Ausführen von Graphen mit Go.

  1. Die Neuerungen von Linux 4.9

    Linux-Kernel 4.9

    Das XFS-Dateisystem kann jetzt doppelt gespeicherte Daten zusammenführen und große Dateien in Sekundenbruchteilen kopieren. Linux 4.9 verbessert zudem die Sicherheit. Neue Möglichkeiten zur Performance-Analyse erleichtern System- und Programmoptimierung.

  2. Die Neuerungen von Linux 4.8

    Kernel-Log-Logo

    Der neue Kernel bringt eine Schnellverarbeitungsweg für Netzwerkpakete und Grundlagen für neue Dateisystemfunktionen bei XFS. Zahlreiche neuen und verbesserte Treiber bringen Unterstützung für Grafikchips von ARM, Intel und Nvidia. Ferner gab es einen ganzen Schwung von Änderungen, um die Sicherheit zu verbessern.

  3. Wie man KI austrickst

    Wie man KI austrickst

    Systeme für künstliche Intelligenz werden immer leistungsfähiger, aber wirklich intelligent sind sie noch nicht. Wie Forscher jetzt gezeigt haben, lassen sie sich relativ leicht in die Irre führen.

  1. Parallels Desktop 13: Windows in der Mac-Touch-Bar

    Parallels Desktop 13: Windows in der Mac-Touch-Bar

    Parallels hat eine neue große Mac-Version seiner Virtualisierungslösung vorgestellt. Die bringt mehr Produktivität und eine volle Unterstützung für die OLED-Funktionstastenleiste des aktuellen MacBook Pro.

  2. Ideologische Grabenkämpfe in Griechenland

    "Nazismus und Kommunismus können niemals zwei Seiten einer Gleichung sein" - Streit über den Europäischen Tag zur Erinnerung an die Opfer des Kommunismus und des Nazismus

  3. Test: Sondors Fold Pedelec

    Pedelec Sondors Fold

    Das Sondors Fold macht Monsterspaß! Ein übergeschnapptes BMX-Rad, ein Pedelec mit Heckmotor und 20-Zoll-Fatbikereifen. Für rund 1000 Euro muss man dafür Abstriche hinnehmen – erstaunlich ist aber, wie gut das Fold trotzdem ist

  4. Google: Algorithmus entfernt Wasserzeichen in Fotos automatisch

    Google: Algorithmus entfernt Wasserzeichen in Fotos automatisch

    In einem aktuellen Forschungspapier demonstriert Google, wie einfach Wasserzeichen in digitalen Fotos automatisch entfernt werden können. Gleichzeitig zeigt der Konzern Möglichkeiten auf, wie Fotografen und Bildagenturen dies verhindern können.

Anzeige