Logo von Developer

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.702.461 Produkten

Rainald Menge-Sonnentag 47

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Die Tensor Flow Object Detection API nutzt der Suchmaschinenanbieter bereits intern in der Bildersuche, für Street View und in einem Tool für die Nest-Cam-Geräten. Nun hat Google das System als Open-Source-Projekt freigegeben.

Das Erkennen von Objekten auf Bildern ist eine Anwendung von künstlicher Intelligenz, die gleichermaßen praxistauglich ist und sich gut zur Demonstration eignet. Google hat nun mit der TensorFlow Object Detection API ein System veröffentlicht, das das Unternehmen laut dem Research-Blog bereits seit geraumer Zeit intern einsetzt. So ist es unter anderem als Bestandteil des Tools für die Nest-Cam-Geräte verfügbar, das beispielsweise einen Hinweis geben kann, wenn eine Person in den Kamerabereich tritt. Außerdem nutzt der Suchmaschinenanbieter es zum Erkennen von Straßennamen in Street View und zum Finden von Stilanregungen in der Google-Android-App.

Anzeige

Das Open-Source-Framework baut auf das von Google vorangetriebene ML-Framework (Machine Learning) TensorFlow auf und enthält bereits einige Erkennungsmodelle, darunter einen Single Shot MultiBox Detector (SSD), Region-based Convolutional Neural Networks (R-CNN) und Region-based Fully Convolutional Networks (R-FCN) sowie jeweils darauf aufsetzende Erweiterungen. Ein Jupyter Notebook ist ebenfalls Bestandteil des Open-Source-Projekts. Die MobileNets-Variante des SSD ist besonders schlank und damit auf den mobilen Einsatz optimiert. Google hatte mit einer Version des Faster R-CNN 2016 Microsofts COCO (Common Objects in Context) Detection Challenge gewonnen.

Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt.
Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt. (Bild: Google)

Bereits im September vorigen Jahres hatte Google mit "Show and Tell" ein System zum Erstellen von Bildunterschriften herausgegeben, das Objekte erkennt, beschreibt und ebenfalls als TensorFlow-Modell implementiert ist. Facebook hatte im Sommer 2016 mit DeepMask und SharpMask Open-Source-Bibliotheken veröffentlicht, die Objekte innerhalb von Bildern erkennen und auf der TensorFlow-Alternative Torch aufsetzen. Zudem bietet Microsoft mit den Cognitive Services ebenso Bildanalysefunktionen wie IBM mit der Watson API. (rme)

47 Kommentare

Themen:

Anzeige
  1. Machine Learning: Facebook veröffentlicht ein (weiteres) Tool zur Objekterkennung

    Machine Learning: Facebook veröffentlicht ein weiteres Tool zur Bildanalyse

    Das Open-Source-Projekt Detectron soll besonders der Forschung im Bereich der Objekterkennung dienen. Die in Python verfasste Software baut auf Caffe2 und ergänzt das Portfolio der APIs und Open-Source-Projekte für die Bildanalyse.

  2. Machine Learning: Google bringt TensorFlow Lite für Android und iOS

    Machine Learning: Google bringt TensorFlow Lite für Android und iOS

    Die schlanke Variante des Open-Source-Frameworks bringt Machine Learning auf mobile Endgeräte und Embedded Devices. Zum Start gibt es Anbindungen für iOS und Android.

  3. Machine Learning: Googles NIMA kann die Qualität von Bildern bewerten

    Auge, Künstliche Intelligenz, KI

    Googles neuronales Netz NIMA kann Bilder nach Qualität und Ästhetik bewerten und schneidet dabei in ersten Testergebnissen ähnlich wie menschliche Bewerter ab. Ideen zum Einsatz zur automatischen Bildbewertung und -erkennung stehen bereits im Raum.

  4. Googles Guetzli-Encoder schrumpft JPEG-Bilder um ein Drittel

    Googles Guetzli-Encoder schrumpft JPEG-Bilder

    Der JPEG-Encoder Guetzli erzeugt kleinere Bilddateien als herkömmliche Encoder. Trotz der geringeren Dateigröße weisen die Bilder weniger sichtbare Artefakte auf.

  1. Die Neuerungen von Linux 4.9

    Linux-Kernel 4.9

    Das XFS-Dateisystem kann jetzt doppelt gespeicherte Daten zusammenführen und große Dateien in Sekundenbruchteilen kopieren. Linux 4.9 verbessert zudem die Sicherheit. Neue Möglichkeiten zur Performance-Analyse erleichtern System- und Programmoptimierung.

  2. Ist Open Source Software wirklich sicherer?

    Open Source-Software gilt als sicherer als proprietäre Software - doch stimmt das wirklich? Wir machen den Praxis-Check.

  3. Windows: Festplatte aufräumen - so geht's

    Die Festplatte Ihres PCs ist voll? Kein Problem! Wir zeigen Ihnen, wie Sie große Dateien finden, Datenballast loswerden und Platz schaffen können.

  1. Unterwegs im BMW i3S

    BMW i3s

    Eine neue Schlupfregelung und eine harmonischere Fahrwerksabstimmung machen den batterieelektrischen BMW i3s zum Agilitätswunder mit ganzheitlichem Ansatz dank Recycling-Materialien und einer mit Strom aus Wasserkraft hergestellten CFK-Karosserie. Aber der Preis ...

  2. Sternenexplosion: Amateur-Astronom beobachtet erstmals Beginn einer Supernova

    Astronomie: Amateur-Astronom beobachtet erstmals Beginn einer Supernova

    Der Argentinier Victor Buso widmet sich in seiner Freizeit der Astronomie: Nun ist es ihm offenbar als erstem Menschen überhaupt gelungen, die Anfänge einer Supernova abzulichten. Forscher erhoffen sich wichtige neue Erkenntnisse.

  3. Google spricht Empfehlungen für Business-Handys aus – ohne Samsung

    Google spricht Empfehlungen für Business-Handys aus – ohne Samsung

    Google will es Unternehmen leichter machen, ein passendes Smartphone zu finden. 21 Geräte entsprechen den strengen Business-Kriterien des Android-Entwicklers, ein Samsung-Handy gehört nicht dazu.

  4. Das Navi weiß den Weg: 40 Jahre GPS-Satelliten

    Darstellung eines Satelliten im Orbit

    Der erste Satellit des Global Positioning System flog 1978 ins All. Doch die Technik hat eine lange und anfangs militärische Geschichte - die zivile Nutzung kam erst auf Umwegen zustande.

Anzeige