Machen Sie einen Ausflug
Mar 07, 2023Alle Deep-Dive-Geheimnisse in Destiny 2
Mar 09, 2023Der Tartarus-Schlüssel: Wie man Charles findet und rettet
Mar 11, 2023Entdecken Sie Glücks- und Pechtiere: Die vollständige Liste
Mar 13, 2023Ob es Ihnen gefällt oder nicht, Kultur abbrechen ist freie Meinungsäußerung
Mar 15, 2023Physiologisch
Hochschulpresse
Bild: Die vorgeschlagene Modellstrukturmehr sehen
Bildnachweis: Higher Education Press Limited Company
Biometrische Spracherkennungssysteme sind häufig verschiedenen Spoofing-Angriffen ausgesetzt, wobei Sprachsynthese- und Sprachkonvertierungsangriffe am häufigsten vorkommen. Diese Spoofing-Angriffe können dazu führen, dass das biometrische Spracherkennungssystem diese Spoofing-Angriffe fälschlicherweise akzeptiert, was die Sicherheit dieses Systems gefährden kann. Forscher haben viele Anstrengungen unternommen, um dieses Problem anzugehen. Allerdings berücksichtigen bestehende Methoden zur Sprachfälschung nur die physikalischen Merkmale der Sprache, was zu einer schlechten Erkennungsleistung führt.
Um das Problem zu lösen, veröffentlichte ein Forschungsteam unter der Leitung von Junxiao XUE seine neue Forschung am 15. April 2023 in Frontiers of Computer Science, gemeinsam herausgegeben von Higher Education Press und Springer Nature.
Das Team schlägt eine Methode zur Erkennung von Sprachfälschung vor, die auf der Fusion physiologisch-physikalischer Merkmale basiert. Die Methode umfasst einen Merkmalsextraktor, ein dicht verbundenes Faltungs-Neuronales Netzwerk mit Squeeze- und Excitation-Blöcken (SE-DenseNet) und eine Feature-Fusion-Strategie. Im Vergleich zu bestehenden Methoden verbesserten sich die Werte der Tandem-Entscheidungskostenfunktion und der gleichen Fehlerrate um 5 % bzw. 7 %.
Insbesondere werden zunächst physiologische Merkmale im Audio aus einem vorab trainierten Faltungsnetzwerk extrahiert. Anschließend wird SE-DenseNet zum Extrahieren der physikalischen Merkmale verwendet. Ein solch dicht verbundenes Modell weist eine hohe parametrische Effizienz auf und Squeeze- und Anregungsblöcke erhöhen die Effizienz der Merkmalsübertragung. Abschließend werden die beiden Merkmale in das Klassifizierungsnetzwerk zur Sprachspoofing-Erkennung integriert.
Sie verglichen das vorgeschlagene Modell mit einigen der besten Einzelsysteme. Die Experimente zeigen, dass ihr vorgeschlagenes Modell sowohl bei EER als auch bei t-DCF eine bessere Leistung erbringt. Um die Wirksamkeit der Gesichtsmerkmale zu validieren, bewerteten sie auch die Leistung einiger Basismodelle, die Gesichtsmerkmale einführten. Es wurde festgestellt, dass verschiedene Basismethoden in Kombination mit den Gesichtsmerkmalen unterschiedliche Grade der Leistungsverbesserung zeigten, was beweist, dass die Gesichtsmerkmale für die Basismodelle praktikabel sind.
Zukünftige Arbeiten können versuchen, genauere Gesichtsmerkmale zu extrahieren und effektivere Strategien zur Merkmalsfusion zu untersuchen, um Spoofing-Angriffe zu erkennen.
###
Forschungsartikel
Junxiao XUE, Hao ZHOU. Physiologisch-physikalische Merkmalsfusion zur automatischen Sprachspoofing-Erkennung. Vorderseite. Berechnen. Sci., 2023, 17(2): 172318, https://doi.org/10.1007/s11704-022-2121-6
Über Frontiers of Computer Science (FCS)
FCS wurde 2007 ins Leben gerufen. Es erscheint alle zwei Monate sowohl online als auch in gedruckter Form bei HEP und Springer. Als Chefredakteur fungiert Prof. Zhi-Hua Zhou von der Universität Nanjing. Ziel ist es, ein Forum für die Veröffentlichung von peer-reviewten Arbeiten zu bieten, um die schnelle Kommunikation und den Austausch zwischen Informatikern zu fördern. FCS deckt alle wichtigen Bereiche der Informatik ab, darunter: Architektur, Software, künstliche Intelligenz, theoretische Informatik, Netzwerke und Kommunikation, Informationssysteme, Multimedia und Grafik, Informationssicherheit, Interdisziplinarität usw. Die Leser könnten an den speziellen Rubriken interessiert sein. Perspektive“ und „Exzellentes Nachwuchsforum“.
FCS wird nach SCI(E), EI, DBLP, Scopus usw. indiziert. Der neueste IF ist 2,669. FCS bittet um die folgenden Artikeltypen: Rezension, Forschungsartikel, Brief.
Grenzen der Informatik
10.1007/s11704-022-2121-6
Experimentelle Studie
Unzutreffend
Physiologisch-physikalische Merkmalsfusion zur automatischen Sprachspoofing-Erkennung
15.04.2023
Haftungsausschluss: AAAS und EurekAlert! sind nicht verantwortlich für die Richtigkeit der auf EurekAlert veröffentlichten Pressemitteilungen! durch beitragende Institutionen oder für die Nutzung jeglicher Informationen über das EurekAlert-System.
Bild: Die vorgeschlagene Modellstruktur. Forschungsartikel über Frontiers of Computer Science (FCS). Haftungsausschluss: