Künstliche Intelligenz berechnet Aussehen von Personen anhand ihrer Stimme (KI-Voiceanalyse)

Künstliche Intelligenz wird immer intelligenter. An einem bestimmten Punkt scheint es, dass es keine Grenzen mehr gibt, was es tun kann. Es ist nach wie vor immer nützlicher und gleichzeitig immer ehrfurchtgebietender.

Der jüngste Fortschritt in der Technologie der künstlichen Intelligenz ist, dass sie erraten kann, wie Sie mit Genauigkeit aussehen. Es ist nicht perfekt, aber die Ergebnisse sind immer noch atemberaubend mit dem Wissen, dass es nur auf Ihrer Stimme basiert.

Speech2Face KI errät, wie Sie aussehen, basierend auf Ihrer Stimme.

Forscher am Massachusetts Institute of Technology schufen Speech2Face, eine künstliche Intelligenz, die eine kurze Probe der Stimme einer Person analysiert und diese verwendet, um zu rekonstruieren, wie die Person aussehen könnte.

Auch hier erzeugt es kein Spiegelbild, ist aber immer noch sehr nah dran, was Speech2Face etwas gruselig macht und gleichzeitig atemberaubend ist, wobei festgestellt wird, dass es nur eine sehr kleine Auswahl einer Stimme verwendet.

In der vergangenen Woche wurde ein Papier veröffentlicht, in dem das MIT-Team seine Arbeit beschreibt, ein generatives gegnerisches Netzwerk zu trainieren, um kurze Clips von Stimmen zu analysieren, um "mehrere biometrische Merkmale des Sprechers zu erfassen". Daraus ergeben sich "Abgleichsgenauigkeiten, die viel besser sind als der Zufall", so die Forscher.

Ein tiefes neuronales Netzwerk wurde entwickelt und trainiert, um diese Arbeit auszuführen, indem Millionen von Videos von Personen verwendet wurden, die auf YouTube oder im Internet im Allgemeinen sprechen. Es wurden physische Identifikatoren von Menschen basierend auf Alter, Geschlecht und ethnischer Zugehörigkeit erfasst.Auf der Speech2Face GitHub-Seite sind die Forscher vorsichtig, da sie erkennen, dass diese Technologie Fragen der Privatsphäre und der Diskriminierung aufwirft.

"Obwohl es sich hierbei um eine rein akademische Untersuchung handelt, halten wir es für wichtig, in dem Papier eine Reihe von ethischen Überlegungen aufgrund der potenziellen Empfindlichkeit von Gesichtsinformationen explizit zu diskutieren", schrieben die Forscher.

Sie fügten hinzu, dass "jede weitere Untersuchung oder praktische Anwendung dieser Technologie sorgfältig getestet wird, um sicherzustellen, dass die Trainingsdaten repräsentativ für die beabsichtigte Nutzergruppe sind".

Die Forscher fügen auch die Anmerkung hinzu, dass ihr Ziel nicht darin besteht, ein Bild einer Person basierend auf Genauigkeit zu rekonstruieren - ihr Ziel ist es, identifizierbare körperliche Merkmale wiederherzustellen, die mit der Sprachprobe korrelieren.

Wie geht es weiter?

So erstaunlich diese Technologie auch ist, man muss sich fragen, wohin sie mit dieser Arbeit führt. Wie die Warnungen der Forscher muss bei der Verwendung dieser Technologie Sensibilität bewahrt werden, da es definitiv den Anschein hat, dass sie die Privatsphäre beeinträchtigen kann.

Wenn Sie sprechen und nicht visuell in einer Aufnahme erscheinen, liegt es am Wissen, dass Sie nicht gesehen werden. Mit der Technologie, die entwickelt wird, bringt sie Moral und Legalität zur Sprache. Viele Menschen würden sich damit nicht wohlfühlen.

Aber Technologien wie Speech2Face können nicht gestoppt werden. Die Technologie entwickelt sich weiter, manchmal auf unbequeme Weise. Ist es dir unangenehm, dass jemand herausfinden kann, wie du aussiehst, nur aufgrund deiner Stimme? Lasst uns wissen, was ihr in den Kommentaren denkt.