Logo von Developer

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.508.171 Produkten

Rainald Menge-Sonnentag 47

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Maschinelles Lernen: Google veröffentlicht eine API zur Objekterkennung

Die Tensor Flow Object Detection API nutzt der Suchmaschinenanbieter bereits intern in der Bildersuche, für Street View und in einem Tool für die Nest-Cam-Geräten. Nun hat Google das System als Open-Source-Projekt freigegeben.

Das Erkennen von Objekten auf Bildern ist eine Anwendung von künstlicher Intelligenz, die gleichermaßen praxistauglich ist und sich gut zur Demonstration eignet. Google hat nun mit der TensorFlow Object Detection API ein System veröffentlicht, das das Unternehmen laut dem Research-Blog bereits seit geraumer Zeit intern einsetzt. So ist es unter anderem als Bestandteil des Tools für die Nest-Cam-Geräte verfügbar, das beispielsweise einen Hinweis geben kann, wenn eine Person in den Kamerabereich tritt. Außerdem nutzt der Suchmaschinenanbieter es zum Erkennen von Straßennamen in Street View und zum Finden von Stilanregungen in der Google-Android-App.

Anzeige

Das Open-Source-Framework baut auf das von Google vorangetriebene ML-Framework (Machine Learning) TensorFlow auf und enthält bereits einige Erkennungsmodelle, darunter einen Single Shot MultiBox Detector (SSD), Region-based Convolutional Neural Networks (R-CNN) und Region-based Fully Convolutional Networks (R-FCN) sowie jeweils darauf aufsetzende Erweiterungen. Ein Jupyter Notebook ist ebenfalls Bestandteil des Open-Source-Projekts. Die MobileNets-Variante des SSD ist besonders schlank und damit auf den mobilen Einsatz optimiert. Google hatte mit einer Version des Faster R-CNN 2016 Microsofts COCO (Common Objects in Context) Detection Challenge gewonnen.

Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt.
Das System gibt neben dem erkannten Objekt an, wie hoch es die Wahrscheinlichkeit einschätzt, dass es richtig liegt. (Bild: Google )

Bereits im September vorigen Jahres hatte Google mit "Show and Tell" ein System zum Erstellen von Bildunterschriften herausgegeben, das Objekte erkennt, beschreibt und ebenfalls als TensorFlow-Modell implementiert ist. Facebook hatte im Sommer 2016 mit DeepMask und SharpMask Open-Source-Bibliotheken veröffentlicht, die Objekte innerhalb von Bildern erkennen und auf der TensorFlow-Alternative Torch aufsetzen. Zudem bietet Microsoft mit den Cognitive Services ebenso Bildanalysefunktionen wie IBM mit der Watson API. (rme)

47 Kommentare

Themen:

Anzeige
  1. Machine Learning: TensorFlow 1.0 freigegeben

    Machine Learning: TensorFlow 1.0 freigegeben

    Schneller, flexibler und bereit für den Produktiveinsatz – die erste Hauptversion der quelloffenen Machine-Learning-Bibliothek, die etwa in Google Translate und DeepMind zum Einsatz kommt, ist nun offiziell verfügbar.

  2. Maschinelles Lernen: TensorFlow erscheint für Windows

    TensorFlow kommt nach Windows

    Googles Framework für maschinelles Lernen bekommt mit Version 0.12 RC0 nativen Windows-Support. Außerdem gibt es eine experimentelle API zum Erstellen und Ausführen von Graphen mit Go.

  3. Google veröffentlicht eine Bildergalerie zum Trainieren neuronaler Netze

    Google bringt offene Bildersammlung zum Trainieren neuronaler Netze

    OpenImages ist eine Sammlung von 9 Millionen URLs zu Bildern, die unter der Creative-Commons-Lizenz stehen und mit Anmerkungen versehen sind. Mit ihnen können Entwickler künstlicher neuronaler Netze ihre Systeme trainieren.

  4. Microsofts Computational Network Toolkit wird zum Cognitive Toolkit

    Microsofts Computational Network Toolkit wird zum Cognitive Toolkit

    Nach dem Umzug nach GitHub zu Beginn des Jahres steht nun eine erste Beta für Version 2.0 des auf Deep-Learning-Aufgaben gemünzten Toolkits unter neuem Namen zur Verfügung,

  1. Die Neuerungen von Linux 4.9

    Linux-Kernel 4.9

    Das XFS-Dateisystem kann jetzt doppelt gespeicherte Daten zusammenführen und große Dateien in Sekundenbruchteilen kopieren. Linux 4.9 verbessert zudem die Sicherheit. Neue Möglichkeiten zur Performance-Analyse erleichtern System- und Programmoptimierung.

  2. Die Neuerungen von Linux 4.8

    Kernel-Log-Logo

    Der neue Kernel bringt eine Schnellverarbeitungsweg für Netzwerkpakete und Grundlagen für neue Dateisystemfunktionen bei XFS. Zahlreiche neuen und verbesserte Treiber bringen Unterstützung für Grafikchips von ARM, Intel und Nvidia. Ferner gab es einen ganzen Schwung von Änderungen, um die Sicherheit zu verbessern.

  3. Wie man KI austrickst

    Wie man KI austrickst

    Systeme für künstliche Intelligenz werden immer leistungsfähiger, aber wirklich intelligent sind sie noch nicht. Wie Forscher jetzt gezeigt haben, lassen sie sich relativ leicht in die Irre führen.

  1. Im Test: Lexus RX450h F-Sport

    Lexus, alternative Antriebe, Hybridantrieb

    Der Reiz des Lexus RX450h F-Sport liegt klar in der Abgrenzung von den Diesel-betriebenen SUVs durch den Hybridantrieb. Der ist das Alleinstellungsmerkmal des großen Lexus. Eine Ausfahrt soll klären, wo sich er von der der Konkurrenz abgrenzt

  2. US Supreme Court wird über US-Zugriff auf EU-Daten entscheiden

    Neun Personen in schwarzen Talaren

    Die US-Regierung will Microsoft zwingen, in der EU gespeicherte Daten in die USA zu holen und preiszugeben. Bislang vergeblich. Nun widmet sich das US-Höchstgericht dem Fall.

Anzeige