Programa de reconocimiento de voz fuera de línea de la tecnología Fandou Desarrollo de MCU

2020-08-16 15:20:57

Programa de reconocimiento de voz fuera de línea de la tecnología Fandou Desarrollo de MCU


Puede proporcionar soluciones, también se puede proporcionar PCBA


Introducción al reconocimiento de voz


La tecnología de reconocimiento automático de voz ASR (Automatic Speech Recognition) se basa en la tecnología de reconocimiento de lista de palabras clave. En cada proceso de reconocimiento, el contenido de voz hablado por el usuario se convierte en características de voz a través del espectro de frecuencias, y los elementos de la lista de palabras clave se emparejan uno por uno, y se utiliza la mejor coincidencia como resultado del reconocimiento. Por ejemplo, en una aplicación de teléfono móvil, el contenido de esta lista de palabras clave es el nombre de la persona en la agenda / el comando de menú del teléfono / el nombre de la canción en la tarjeta T, etc. No importa cuál sea el contenido de esta lista, el usuario solo necesita configurar el registro correspondiente. El contenido del elemento correspondiente a reconocer se puede pasar al motor de reconocimiento en forma de caracteres.


El motor de reconocimiento no se preocupa por el contenido de las palabras clave en la lista de palabras clave, que puede ser cualquier cadena de caracteres chinos, como comandos, nombres de personas, nombres de canciones, instrucciones de funcionamiento, etc.


El número máximo de palabras admitidas por cada palabra clave está limitado a 30 palabras desde una perspectiva de algoritmo. Pero a partir de la situación real, cuando los usuarios dicen más de 8 palabras de una vez, es casi seguro que tendrán errores tipográficos / palabras faltantes / múltiples palabras / hipo / pausas, etc., lo que afectará seriamente el reconocimiento y provocará el reconocimiento. error. Por tanto, en general, si se quiere obtener un efecto de reconocimiento ideal, se recomienda que el número de palabras de cada palabra clave no sea demasiado largo para evitar afectar el efecto.


 


El significado más importante de la tecnología ASR es proporcionar una interfaz de usuario basada en voz que está libre de botones y ratones, lo que hace que la operación del producto por parte del usuario sea más natural, más rápida y más conveniente que el control manual, y se puede usar para electrodomésticos inteligentes, ropa inteligente y juguetes inteligentes activados por voz. Y muchos otros campos.


En la actualidad, el precio de las soluciones de reconocimiento de voz en línea es relativamente alto, el período de acceso al producto es largo y el tiempo de respuesta se ve afectado por la red. Esta solución proporciona reconocimiento de voz fuera de línea de voz humana no específica basada en una gran cantidad de bases de datos de voz. Esta solución tiene ventajas de costos, acceso simple, ciclo corto, velocidad de respuesta de identificación rápida (dentro de 0.5 segundos) y no es necesario conectarse a la red. La solución general es madura, estable y confiable, lo que permite que los productos tradicionales actualicen rápidamente la función de voz inteligente.


 


La tecnología de reconocimiento de voz sin conexión es una tecnología basada en el reconocimiento de listas de palabras clave. Solo necesita configurar una lista de palabras clave para ser reconocidas, y las palabras clave pronunciadas por el usuario pueden ser reconocidas a través del sistema de reconocimiento de voz, sin ningún entrenamiento de grabación para el usuario.


Fácil sin conexión a Internet


Realice el control por voz


 


Áreas de aplicación del mercado:


Luces de voz inteligentes, juguetes inteligentes, electrodomésticos (ventiladores eléctricos, campanas extractoras, aires acondicionados), masajeadores de ojos, masajeadores de cuello, altavoces inteligentes


 


Ventajas de esta solución de producto:


La tasa de reconocimiento es superior al 95%, reconocimiento preciso dentro de 3 M


Admite 32 idiomas, admite varios idiomas menores


No es necesario conectarse a Internet, identificación fuera de línea, respuesta rápida


Admite la transmisión de comentarios de voz, aumenta el entretenimiento interactivo


Rendimiento de alto costo, arquitectura SOC, códec integrado


Chip de grado industrial de alta estabilidad


Diseño de instrucciones flexible, sin necesidad de grabación por parte del cliente


Tiempo de desarrollo corto y soporte técnico implementado


 


parámetro técnico:


El rango de voltaje de trabajo es opcional 3.3 ~ 5.5V


Pin de entrada MIC dedicado El nivel mejorado es de 26 dB, la ganancia total máxima es de 65 dB


Salida de audio diferencial PWM, conduce directamente altavoces de 1 W / 8 Ω


2 salidas de señal PWM, se puede utilizar para atenuación de LED


Proporcionar interfaz I2C / UART y protocolo de comunicación personalizado, que se puede utilizar para módulos externos y comunicación con MCU externa


 


 


método de cooperación:


Proporcionar un plan de diseño completo para el reconocimiento de voz, los clientes pueden diseñar funciones de acuerdo con sus propias necesidades, nuestra empresa es responsable del desarrollo de la parte de control de voz y del acoplamiento con el control principal del cliente.


Autorización de chip: los clientes desarrollan aplicaciones ellos mismos, producen PCB y compran los componentes correspondientes para la producción.Nuestra empresa proporciona chips, rutas de referencia relacionadas y comandos de reconocimiento de voz.


 


Lista de casos exitosos:


Luz de voz inteligente


Electrodomésticos inteligentes


Masajeador de salud


Control inteligente


 


Módulo de reducción de ruido de voz:


Suprima eficazmente el ruido ambiental y mejore la eficiencia del reconocimiento en entornos ruidosos.


Adecuado para productos con movimiento mecánico, como ventiladores, calefactores, campanas extractoras, robots de barrido, etc.