Im ersten Teil dieses Blogartikels haben wir bereits gesehen, wie wir automatisierte Bildanalysen im Einsatz gegen Covid-19 nutzen können. Das maschinelle Identifizieren von Objekten auf Bildern galt lange Zeit als unlösbares Problem in der Mathematik und Informatik. Zu unterschiedlich können Blickwinkel, Lichterverhältnisse oder Abstände zu einem Objekt sein, so dass kein klassischer Algorithmus im Stande war dieses Problem nur ansatzweise zu lösen. Erst mit dem Voranschreiten der KI-Forschung (Künstliche Intelligenz-Forschung) gelangen im letzten Jahrzehnt große Fortschritte im Bereich des maschinellen Sehens. Doch wie kam es zu diesem plötzlichen Fortschritt?
Die mathematischen Grundlagen zu Künstlicher Intelligenz zur Bilderkennung wurden bereits in den 1960er Jahren gelegt. Inspiriert durch die Funktionsweise des menschlichen Gehirns wurden sogenannte künstliche Neuronale Netze entwickelt, die den Informationsfluss im Hirn simulieren.
Die erhofften Durchbrüche in der KI-Forschung blieben jedoch vorerst aus und die hohen Erwartungen an die neue Technik konnten nicht erfüllt werden. Die Hauptgründe lagen vor allem in der damals zu geringen Rechenleistung und den zu kleinen Datensätzen.
Erst in den 2010er Jahren konnten maßgebliche Erfolge im Bereich der automatisierten Bilderkennung gefeiert werden. Mit dem Siegeszug des Internets, Social Media und Smartphones hatte man nun Zugang zu einer unüberschaubaren Menge an Bildern, welche nun genutzt werden konnten, um die KI zu trainieren. In dieser Trainingsphase werden der KI eine riesige Anzahl an Bildern präsentiert (oft im siebenstelligen Bereich und darüber), woraus sie dann Muster ableiten kann und aus diesen lernt. Diese Phase kann selbst auf heutigen Hochleistungsrechnern mehrere Wochen dauern.
Ist die KI aber erst einmal trainiert, können Vorhersagen, auch auf unbekannten Daten, in Sekundenbruchteilen gemacht werden. So gibt es KIs, die Gesichter mit einer Trefferquote von 99.97% erkennen oder aber aus mehr als 20.000 Objekten Gegenstände mit einer Trefferwahrscheinlichkeit von über 90% richtig identifizieren.
Trotz dieser Genauigkeit besteht erstmal keine Gefahr einer Übernahme durch die KI. Im Gegensatz zu Menschen „verstehen“ die Algorithmen nicht wirklich, was sie sehen. So können Änderungen von nur wenigen Pixeln, die für das menschliche Auge nicht einmal wahrnehmbar sind, zu völlig falschen Ergebnissen führen.
Music: Time Out by Atch
SoundCloud: soundcloud.com/atch-music
Creative Commons — Attribution 3.0 Unported — CC BY 3.0
Free Download / Stream: bit.ly/l-time-out
Music promoted by Audio Library youtu.be/NPnLxESfv50
Fazit
Mit einer solchen Präzision ergeben sich völlig neue Möglichkeiten wie bisher ungenutztes Bildmaterial unter geringem Ressourcenaufwand nutzbar gemacht werden kann. Die Anwendungsfälle reichen dabei von der Personenzählung bei Großveranstaltungen über die Qualitätsmessung in der Produktion bis hin zur Bewegungsanalyse im Supermarkt oder auch im Sport.
Microsoft liefert mit Azure Cognitive Services eine Plattform, mit der sich genau solche Use Cases lösen lassen. Gesichtserkennung, Bild- und Videoanalyse oder die individualisierten Objekterkennungen, die eigens auf die Bedürfnisse des Kunden zugeschnitten sind – all das ermöglicht Azure Cognitive Services.
Interessiert?
Wollen Sie mehr über Bilderkennungssysteme und die Nutzung von Microsoft Azure Cognitive Services wissen? Gern stehen wir Ihnen jederzeit für ein persönliches Beratungsgespräch zur Verfügung. Schreiben Sie uns einfach eine E-Mail oder rufen Sie uns an. Unsere Experten freuen sich, mit Ihnen über Ihre Ideen zu diskutieren.