05.05.2023

TU Ilmenau entwickelt bio-inspiriertes Mikrofon zur Spracherkennung

Wissenschaftlerin am GerätTU Ilmenau/ari
Das Mikrofon könnte helfen, die Spracherkennung zur Steuerung einer Vielzahl von digitalen Anwendungen zu verbessern

Die Technische Universität Ilmenau hat gemeinsam mit Forschungspartnern ein Mikrofon entwickelt, das von der Biologie inspiriert ist und Schall ähnlich wie das menschliche Ohr aufnimmt. Das Mikrofon könnte helfen, die Spracherkennung zur Steuerung einer Vielzahl von digitalen Anwendungen zu verbessern. Das neue Verfahren könnte in Zukunft akustische Gesamtsysteme aus Mikrofon und Spracherkennung sogar effizienter machen, sodass sie weniger Energie verbrauchen. Die Ergebnisse der Forschungsarbeiten des Fachgebiets Mikro- und nanoelektronische Systeme der TU Ilmenau und seiner Forschungspartner wurden soeben im renommierten internationalen Fachmagazin Nature Electronics veröffentlicht.

Technologien zur Spracherkennung wie Alexa oder Siri haben in den letzten Jahren rasante Fortschritte gemacht. Sie können inzwischen Sprachbefehle zum Beispiel zur Steuerung von Handys, zur Bedienung eines Weckers oder auch unterschiedlichster Smart-Home-Anwendungen sehr gut verstehen. Laute Umgebungen mit vielen verschiedenen Geräuschen wie Bahnhöfe, Restaurants oder Straßen sind jedoch für derzeitige Technologien mit konventionellen Mikrofonen noch sehr problematisch. Das menschliche Gehör ist dagegen in der Lage, die Stimmen einzelner Personen in lauten Umgebungen mit einer Vielzahl an Hintergrundgeräuschen herauszuhören und das Gesagte zu verstehen.

Die Vorzüge des menschlichen Ohrs hat sich nun ein Forscherteam der TU Ilmenau, der Christian-Albrechts-Universität Kiel, des Karlsruher Instituts für Technologie, des University College Cork und des Ilmenauer Fraunhofer-Instituts für Digitale Medientechnologie zunutze gemacht. Dabei bilden die Wissenschaftlerinnen und Wissenschaftler die Funktion des Innenohrs nach, denn das unterstützt beim Menschen das Hörverstehen insbesondere in lauten Umgebungen. Das von ihnen entwickelte bio-inspirierte Mikrofon nutzt drei Eigenschaften des menschlichen Gehörs:

 
  1. Geräusche, etwa ein gesprochenes Wort oder eine Melodie, bestehen aus verschiedenen Tönen. Sie können von Spracherkennungssystemen erkannt werden, indem die Geräusche in die enthaltenen Töne zerlegt werden. Beim Menschen erfolgt diese Zerlegung nicht erst im Gehirn, sondern bereits im Innenohr. Das besteht aus einer Vielzahl kleiner Haarzellen, die jeweils auf unterschiedliche Töne reagieren. Damit wird verhindert, dass sich die verschiedenen Töne beim Hören beeinflussen und leise Töne durch laute Töne verdeckt werden. Im Unterschied zu herkömmlichen Mikrofonen zerlegt das bio-inspirierte Mikrofon Geräusche schon vor der Umwandlung in ein elektrisches Signal.
  2. Um leise Töne zu verstehen, müssen sie deutlich verstärkt werden. Laute Töne hingegen müssen, damit sie unverzerrt wahrgenommen werden, gedämpft werden. Diese Fähigkeit des Gehörs erlaubt es dem Menschen, Töne zu hören, deren Schalldruck sich um einen Faktor von einer Million ändern. Im Innenohr ist diese, wie Fachleute sie nennen: nichtlineare oder kompressive Verstärkung bereits in den Sensor integriert. So ist es möglich, deutlich größere Lautstärkebereiche zu hören.
  3. In leisen Umgebungen gelingt es dem Menschen relativ leicht, für ihn wichtige Schallsignale wie die Stimme einer einzelnen Person herauszuhören. In lauten Umgebungen ist dies jedoch schwierig und die für den Hörer wichtigen Schallsignale müssen für ein gutes Hörverständnis stärker verstärkt werden als die Umgebungsgeräusche. Um in verschiedenen Umgebungen möglichst gleich gut zu hören, werden daher die Sensoren des Innenohres, die Haarzellen, permanent an die sich verändernden Erfordernisse angepasst. Dies wird dadurch erreicht, dass die relativen Verstärkungsfaktoren für einzelne Töne situationsabhängig verändert werden.
Nachaufnahme Haarzellen des menschlichen Innenohrs nachempfundene Biegebalken aus SiliziumTU Ilmenau/ari
Technologisches Herzstück des Mikrofons sind den Haarzellen des menschlichen Innenohrs nachempfundene Biegebalken aus Silizium

Technologisches Herzstück des bio-inspirierten Mikrofons sind den Haarzellen nachempfundene Biegebalken aus Silizium mit einer Länge von einem Drittel Millimeter bis etwas über einen Millimeter. Dieser Längenunterschied bewirkt, dass jeder Biegebalken nur auf einen einzelnen Ton des Schallsignals reagiert (Punkt 1). Eine elektronische Steuerung ermöglicht es, die Eigenschaften jedes Biegebalkens, wie zum Beispiel die Verstärkung, separat zu steuern (Punkt 2) und so an verschiedene, zum Beispiel unterschiedlich laute Umgebungen anzupassen (Punkt 3).

Dank der für jede Tonhöhe separat steuerbaren und automatischen Anpassung an das Schallsignal werden die relevanten Signale hervorgehoben. Dadurch, so die Idee der Forscherinnen und Forscher, ist für die Sprachanalyse weniger Rechenleistung und somit für das Gesamtsystem aus Spracherkennung und Mikrofon weniger elektrische Energie nötig. Vor allem Anwendungen mit begrenzten Energiekapazitäten, etwa Hörgeräte, wären so in der Lage, deutlich komplexere Sprach- und Schallanalysen durchzuführen. Zudem ermöglicht die Herstellung des bio-inspirierten Mikrofons auf Basis von Siliziumtechnologie nicht nur eine mikrometergenaue Fertigung, sondern auch eine kostengünstige Massenproduktion.

Gemeinsam mit den Wissenschaftlerinnen und Wissenschaftlern der Partnereinrichtungen will die TU Ilmenau nun Prototypen des Bio-inspirierten Mikrofons entwickeln. Mögliche Einsatzgebiete sind neben Sprachassistenzsystemen und Hörgeräten auch Technologien zur Überwachung von Maschinen in der Produktion.

Realisiert wurde der Demonstrator des neuen bio-inspirierten Mikrofons im „ForLab Ilmenau für neuromorphe Elektronik“, das durch das Bundesforschungsministerium unterstützt wird. Das ForLab ist am Zentrum für Mikro- und Nanotechnologien (ZMN) der TU Ilmenau angesidelt.

Die in Nature Electronics veröffentlichten Forschungsergebnisse entstanden im Rahmen von zwei großen Forschungsprojekten der TU Ilmenau: „SFB 1461 – Neuroelektronik: Biologisch inspirierte Informationsverarbeitung“, das von der Deutschen Forschungsgemeinschaft gefördert wird, und „MemWerk“, gefördert von der Carl-Zeiss-Stiftung, in dem die TU Ilmenau intelligente Werkstoffe für biologisch inspirierte Elektronik erforscht.

 
Veröffentlichung in Nature Electronics:

Website:             https://www.nature.com/articles/s41928-023-00957-5

DOI-Nummer:     10.1038/s41928-023-00957-5

 

Kontakt

Dr. Claudia Lenk

Fachgebiet Mikro- und nanoelektronische Systeme
+49 3677 69-1589
mnes@tu-ilmenau.de

 

Als PDF herunterladen