quiero crear una aplicación web con el nodo js y reaccionar js.
habrá 2 páginas en esa aplicación web, una será la que grabe la voz y la almacene en la base de datos y en la segunda página, cualquier usuario puede venir y decir cualquier cosa después de que la aplicación web coincida con esa voz y con la base de datos y regresará con el nombre de usuario .
Ya hice una parte del registro guardada en la carpeta, pero no sé qué base de datos debo usar para almacenar datos que pueden coincidir con los datos durante la segunda página cuando el usuario necesita su nombre cuando habla algo.
gracias de antemano soy nuevo en el nodo y reacciono por favor ayuda con esto :D
puede usar https://firebase.google.com/ firebase de google como su base de datos en tiempo real o para almacenar archivos de audio
pero para hacer coincidir dos voces, no funcionará, por lo que debe usar alguna biblioteca como https://www.npmjs.com/package/wav-file-info
que comparará la entrada de voz con el audio que está en la base de datos
El problema que está tratando de resolver es parte del reconocimiento automático de voz (ASR). Es obvio que no puede comparar dos archivos de audio en este dominio problemático. Más bien, debe calcular algún tipo de característica/huella digital de una voz y hacer coincidir esas características. Uno de los algoritmos de extracción de características comunes es el coeficiente cepstral de frecuencia Mel (MFCC) ( haga clic aquí ). Para python, conozco una biblioteca llamada python_speech_features . Esta biblioteca puede extraer características de MFCC. Con el fin de hacer coincidir las funciones, puede usar un algoritmo de aprendizaje automático.