Neuesten Nachrichten

Machen Sie einen Ausflug

Alle Deep-Dive-Geheimnisse in Destiny 2

Mar 09, 2023

Der Tartarus-Schlüssel: Wie man Charles findet und rettet

Mar 11, 2023

Entdecken Sie Glücks- und Pechtiere: Die vollständige Liste

Mar 13, 2023

Ob es Ihnen gefällt oder nicht, Kultur abbrechen ist freie Meinungsäußerung

Mar 15, 2023

Physiologisch

Dec 07, 2023

Hochschulpresse

Bild: Die vorgeschlagene Modellstrukturmehr sehen

Bildnachweis: Higher Education Press Limited Company

Biometrische Spracherkennungssysteme sind häufig verschiedenen Spoofing-Angriffen ausgesetzt, wobei Sprachsynthese- und Sprachkonvertierungsangriffe am häufigsten vorkommen. Diese Spoofing-Angriffe können dazu führen, dass das biometrische Spracherkennungssystem diese Spoofing-Angriffe fälschlicherweise akzeptiert, was die Sicherheit dieses Systems gefährden kann. Forscher haben viele Anstrengungen unternommen, um dieses Problem anzugehen. Allerdings berücksichtigen bestehende Methoden zur Sprachfälschung nur die physikalischen Merkmale der Sprache, was zu einer schlechten Erkennungsleistung führt.

Um das Problem zu lösen, veröffentlichte ein Forschungsteam unter der Leitung von Junxiao XUE seine neue Forschung am 15. April 2023 in Frontiers of Computer Science, gemeinsam herausgegeben von Higher Education Press und Springer Nature.

Das Team schlägt eine Methode zur Erkennung von Sprachfälschung vor, die auf der Fusion physiologisch-physikalischer Merkmale basiert. Die Methode umfasst einen Merkmalsextraktor, ein dicht verbundenes Faltungs-Neuronales Netzwerk mit Squeeze- und Excitation-Blöcken (SE-DenseNet) und eine Feature-Fusion-Strategie. Im Vergleich zu bestehenden Methoden verbesserten sich die Werte der Tandem-Entscheidungskostenfunktion und der gleichen Fehlerrate um 5 % bzw. 7 %.

Insbesondere werden zunächst physiologische Merkmale im Audio aus einem vorab trainierten Faltungsnetzwerk extrahiert. Anschließend wird SE-DenseNet zum Extrahieren der physikalischen Merkmale verwendet. Ein solch dicht verbundenes Modell weist eine hohe parametrische Effizienz auf und Squeeze- und Anregungsblöcke erhöhen die Effizienz der Merkmalsübertragung. Abschließend werden die beiden Merkmale in das Klassifizierungsnetzwerk zur Sprachspoofing-Erkennung integriert.

Sie verglichen das vorgeschlagene Modell mit einigen der besten Einzelsysteme. Die Experimente zeigen, dass ihr vorgeschlagenes Modell sowohl bei EER als auch bei t-DCF eine bessere Leistung erbringt. Um die Wirksamkeit der Gesichtsmerkmale zu validieren, bewerteten sie auch die Leistung einiger Basismodelle, die Gesichtsmerkmale einführten. Es wurde festgestellt, dass verschiedene Basismethoden in Kombination mit den Gesichtsmerkmalen unterschiedliche Grade der Leistungsverbesserung zeigten, was beweist, dass die Gesichtsmerkmale für die Basismodelle praktikabel sind.

Zukünftige Arbeiten können versuchen, genauere Gesichtsmerkmale zu extrahieren und effektivere Strategien zur Merkmalsfusion zu untersuchen, um Spoofing-Angriffe zu erkennen.

###

Forschungsartikel

Junxiao XUE, Hao ZHOU. Physiologisch-physikalische Merkmalsfusion zur automatischen Sprachspoofing-Erkennung. Vorderseite. Berechnen. Sci., 2023, 17(2): 172318, https://doi.org/10.1007/s11704-022-2121-6

Über Frontiers of Computer Science (FCS)

FCS wurde 2007 ins Leben gerufen. Es erscheint alle zwei Monate sowohl online als auch in gedruckter Form bei HEP und Springer. Als Chefredakteur fungiert Prof. Zhi-Hua Zhou von der Universität Nanjing. Ziel ist es, ein Forum für die Veröffentlichung von peer-reviewten Arbeiten zu bieten, um die schnelle Kommunikation und den Austausch zwischen Informatikern zu fördern. FCS deckt alle wichtigen Bereiche der Informatik ab, darunter: Architektur, Software, künstliche Intelligenz, theoretische Informatik, Netzwerke und Kommunikation, Informationssysteme, Multimedia und Grafik, Informationssicherheit, Interdisziplinarität usw. Die Leser könnten an den speziellen Rubriken interessiert sein. Perspektive“ und „Exzellentes Nachwuchsforum“.

FCS wird nach SCI(E), EI, DBLP, Scopus usw. indiziert. Der neueste IF ist 2,669. FCS bittet um die folgenden Artikeltypen: Rezension, Forschungsartikel, Brief.

Grenzen der Informatik

10.1007/s11704-022-2121-6

Experimentelle Studie

Unzutreffend

Physiologisch-physikalische Merkmalsfusion zur automatischen Sprachspoofing-Erkennung

15.04.2023

Haftungsausschluss: AAAS und EurekAlert! sind nicht verantwortlich für die Richtigkeit der auf EurekAlert veröffentlichten Pressemitteilungen! durch beitragende Institutionen oder für die Nutzung jeglicher Informationen über das EurekAlert-System.

Bild: Die vorgeschlagene Modellstruktur. Forschungsartikel über Frontiers of Computer Science (FCS). Haftungsausschluss:

Vorherige: Körperübungen können Männer jeden Alters machen Nächste: Ein „Monster“ erschaffen: Hinter Evan Peters‘ körperlicher Verwandlung in Jeffrey Dahmer

Anfrage absenden

Schicken