Seit fast einem Jahr befindet sich die Welt im Ausnahmezustand. Das Auftreten von SaRS-CoV-2 greift massiv in unser Leben ein. Maskenpflicht, Ausgangsperren und Lockdowns gehören inzwischen zu unserem Alltag. Trotzdem bleiben die Neuinfektionen auf einem hohen Niveau und es kommen Zweifel an den getroffenen Maßnahmen auf. Doch worin liegen die Ursachen? Halten sich Personen an die Maskenpflicht und werden Abstandsregeln überhaupt befolgt?
Diese Frage flächendeckend zu beantworten schien bisher kaum möglich zu sein. Dafür gibt es zu viele Orte, an denen sich große Menschenansammlungen bilden können. Auch das Auswerten von Videomaterial von Überwachungskameras scheint durch ihre schiere Fülle als Ding der Unmöglichkeit. Wie sollen tausende Stunden an Videomaterial sinnvoll ausgewertet werden?
Glücklicherweise ist genau dies mit den neusten Techniken aus dem Bereich der KI möglich. Heute können wir in Sekundenbruchteilen Bild- und Videomaterial auf ihren Inhalt prüfen. Wie wir diese Techniken der automatisierten Bildererkennung nutzen können, zeigen wir in diesem Blogbeitrag am Beispiel unserer App zur Prüfung von Social Distancing.
Music: Time Out by Atch
SoundCloud: soundcloud.com
Creative Commons — Attribution 3.0 Unported — CC BY 3.0
Free Download / Stream: bit.ly
Music promoted by Audio Library youtu.be
Bilderkennung - so genau wie das menschliche Auge?
Um die Personen auf einem Bild bzw. Video zu identifizieren, greift unsere App auf die Azure Cognitive Services von Microsoft zu. Diese bieten neben der automatisierten Sprach- und Texterkennung auch eine Reihe von Services zur automatisierten Bildererkennung an. Von vorgefertigten Produkten wie einer Gesichtserkennung, über eine individualisierbare Objekterkennung, die schon mit einer geringen Anzahl an Bildern neue Objekte erkennen kann, bis hin zur eigens trainierten KI für den individuellen Use Case deckt der Service eine große Bandbreite an Produkten ab.
Mit dem Service „Maschinelles Sehen“ lassen sich beispielsweise eine Vielzahl von vordefinierten Objekten erkennen (Fußnote: Das Wort Objekt ist hierbei in einem sehr breiten Sinne zu verstehen. Es fallen darunter auch Lebewesen wie Pflanzen, Tiere oder auch Menschen.) Während dieser Service für eine geringe Anzahl an Objekten sehr zuverlässige Ergebnisse liefert, tut sich dieser bei einer hohen Anzahl an Objekten eher schwer. So werden auf belebten Plätzen nur eine geringe Anzahl der Leute erkannt.
Da das Einhalten von Social Distancing aber gerade auf überfüllten Plätzen schwierig ist, haben wir in unserer App die Individualisierungsmöglichkeit von Azure genutzt und spezielle neuronale Netze verwendet, die auch auf belebten Bildern gut funktionieren. Dabei hat jedes identifizierte Objekt eine Wahrscheinlichkeit zwischen 0 und 100%, dass es sich tatsächlich um eine Person handelt. Unsere Image Recognition App bietet die Möglichkeit, einen Schwellenwert für genau diese Wahrscheinlichkeit einzustellen. Hier gilt es den optimalen Wert auszutarieren und einen Trade-Off zwischen falsch-positiven Identifizierungen (z.B. Statuen die als Person erkannt werden) und falsch-negativen (Personen, die von der KI „übersehen“ werden). Die besten Ergebnisse lieferte dabei ein Schwellenwert zwischen 30% und 40%. Nachdem die Personen identifiziert worden sind, können dann die Abstände zwischen ihnen berechnet werden, um zu prüfen, wie viele Leute sich an das Social Distancing halten.
Von Corona bis Produktion - Anwendungsgebiete in der Praxis
Die Anwendungsgebiete einer automatisierten Bild- oder Videoanalyse sind vielfältig. So ist es beispielsweise denkbar, dass zusätzlich zum Social Distancing die Einhaltung der Maskenpflicht geprüft wird. Die denkbaren Use Cases reichen allerdings noch weit über die aktuelle Pandemie hinaus. Weitere Einsatzmöglichkeiten sind beispielsweise:
- Monitoring zur Einhaltung von Regeln (Abstände und Gefahrenzonen) bezüglich der Arbeitssicherheit bei Gleisarbeiten oder auf Baustellen
- Lokalisierung von speziellen Personen in Gebäuden (Ärzte im Krankenhaus für schnelle Notfallverfügbarkeit)
- Analyse von Bewegungsmustern in Supermärkten und Malls zu Optimierung der Produktplatzierung
- Musteranalysen von Spielzügen bei Sportarten wie beispielsweise Fußball oder Handball
- Erkennung von „einsamen“ Koffern und verdächtigem Verhalten von Personen auf Bahnhöfen und Flughäfen
- Personenzählung bei großen Veranstaltungen
- Qualitätsmessungen in der Produktion anhand von Bilddaten.
Im Prinzip überall dort, wo eine hohe Zahl an Bild- oder Videomaterial anfällt und wertvolle Informationen aus deren Analyse gezogen werden können, ist der Einsatz einer KI sinnvoll.
Fazit
Durch die rasanten Fortschritte bei der automatisierten Bildanalyse in den letzten Jahren ist es heute möglich, Bilder und Videos in Sekundenbruchteilen auf ihren Inhalt zu analysieren. Hierdurch ergeben sich vielfältige Möglichkeiten, wertvolle Informationen aus bisher ungenutzten Daten zu ziehen.
Interessiert?
Wollen Sie mehr über Bilderkennungssysteme und die Nutzung von Microsoft Azure Cognitive Services wissen? Gern stehen wir Ihnen jederzeit für ein persönliches Beratungsgespräch zur Verfügung. Schreiben Sie uns einfach eine E-Mail oder rufen Sie uns an. Unsere Experten freuen sich, mit Ihnen über Ihre Ideen zu diskutieren.
Sie möchten wissen, wie eine Bilderkennung überhaupt funktioniert und wie der aktuelle Forschungsstand ist? Dann lesen Sie gerne den zweiten Teil dieses Blogartikels.