Intel bringt Computern das “Lippen lesen” bei

(Auszug aus der Pressemitteilung)

Intel Developer Forum, Berlin, 28. April 2003 – Forscher der Intel

Anzeige
Corporation haben im Rahmen einer Open-Source Lizenz eine neue Software
veröffentlicht. Sie ermöglicht Entwicklern den Bau von Computern, die wie
Menschen sehen und “Lippen lesen” können. Auf diese Weise können PCs
gesprochene Befehle besser verstehen.

Aktuelle leistungsfähige Spracherkennungs-Algorithmen arbeiten
zufriedenstellend, wenn kein Hintergrundlärm auftritt oder ein sehr gut
eingestelltes Headset verwendet wird. Ihre Genauigkeit lässt jedoch sehr
schnell nach, wenn die Applikationen mit durchaus üblichen
geräuschintensiven Umgebungen zurechtkommen müssen, wie dies etwa auf
öffentlichen Plätzen der Fall ist. In Kombination mit
Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek
ermöglicht der Einsatz von Audio Visual Speech Recognition (AVSR) Software,
dass die Computer das Gesicht eines Sprechers erkennen und ihren
Mundbewegungen folgen. Die Synchronisation von Videodaten mit
Sprachidentifizierung macht deutlich genauere Spracherkennung möglich und
verbessert damit eine große Vielzahl von Sprachanwendungen in
geräuschintensiven Umgebungen. Die AVSR Software ist Teil der Intel OpenCV
Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500
Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende
Applikationen entwickeln können.

“Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf
natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die
Erkennung durch den Menschen basiert nur selten auf einer einzigen
Informationsart. Wir treffen Entscheidungen durch die Kombination von
Informationen aus einer Vielzahl von Quellen”, sagte Justin Rattner, Intel
Senior Fellow der Enterprise Platform Group und Director des Intel
Microprocessor Research Labs. “Die Ergänzung von Intels OpenCV Bibliothek
durch Audio/Video Spracherkennungscode wird die Forschung und Entwicklung in
bildgestützter Spracherkennung ganz sicher vorantreiben.”

Beschleunigte Forschung für neue Einsatzbereiche
Schnellere Mikroprozessoren, sinkende Kamerapreise und eine um den Faktor 10
höhere Bandbreite bei der Videoaufzeichnung durch Technologien wie USB2.0
versetzen auch konventionelle PCs in die Lage, bilderkennende Algorithmen in
Echtzeit ausführen zu können. OpenCV wurde für eine
Innovationsbeschleunigung in diesem Bereich entwickelt, indem sie Quellcode
für einen weiten Bereich aus bilderkennenden und bildverarbeitenden
Funktionen bereitstellt. Seit ihrer Veröffentlichung im Jahr 2000
verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich
mehr als 5.000 Mitglieder für die User Group registriert.

Entwickler verwenden OpenCV Code in Applikationen, die von Spielzeugen bis
hin zur industriellen Fertigung reichen. Die Software beinhaltet C
Source-Code für alle Funktionalitäten der Bibliothek sowie eine
Redistributions-Lizenz ohne anfallende Lizenzgebühren. Informationen über
AVSR finden Sie unter www.intel.com/research/mrl/research/avcsr.htm.

Die OpenCV Website ist unter
www.intel.com/research/mrl/research/opencv/ zu finden.
Einzelpersonen, die der User Group beitreten möchten, können sich unter
groups.yahoo.com registrieren und die Gruppe durch eine e-Mail an OpenCV
unter subscribe@yahoogroups.com abonnieren.

Intel hat ein einzigartiges dezentrales Forschungsmodell entwickelt mit mehr
als 70 Laboratorien auf der ganzen Welt. Der größte Teil des AVSR
Softwareteams befindet sich im Intel China Research Center in Beijing,
China. Das im Jahr 1998 eingerichtete Zentrum beschäftigt derzeit mehr als
40 Wissenschaftler und Techniker für die Computerforschung, die auf
Forschungsgebieten wie Computer Vision, Media, Bayesian Networks, Compiler
und Tools aktiv sind.

Intel