Sviluppo di un microcomputer a chip singolo per la tecnologia Fandou Schema di riconoscimento vocale offline

2020-06-05 12:50:23

Sviluppo di un microcomputer a chip singolo per la tecnologia Fandou Schema di riconoscimento vocale offline


Può fornire soluzioni, può anche fornire PCBA


Introduzione al riconoscimento vocale


La tecnologia di riconoscimento vocale automatico ASR (Automatic Speech Recognition) si basa sulla tecnologia di riconoscimento dell'elenco di parole chiave. In ogni processo di riconoscimento, il contenuto del parlato parlato dall'utente viene convertito in funzioni vocali attraverso lo spettro e le voci in questo elenco di parole chiave vengono abbinate una per una e il risultato di riconoscimento viene utilizzato il migliore corrispondente. Ad esempio, in un'applicazione per telefoni cellulari, il contenuto di questo elenco di parole chiave è il nome della persona nella rubrica / il comando di menu del telefono cellulare / il nome del brano nella scheda T, ecc. Indipendentemente dal contenuto di questo elenco, solo l'utente deve impostare il registro pertinente, È possibile passare il contenuto dell'elemento corrispondente per essere riconosciuto al motore di riconoscimento sotto forma di caratteri.


Il motore di riconoscimento non si preoccupa del contenuto delle parole chiave nell'elenco delle parole chiave, che può essere qualsiasi stringa di caratteri cinese come comandi, nomi delle persone, nomi dei brani, istruzioni operative e così via.


Il numero massimo di parole che ogni parola chiave può supportare è limitato a 30 parole dal punto di vista dell'algoritmo. Tuttavia, dalla situazione attuale, quando gli utenti dicono più di 8 parole alla volta, quasi sicuramente diranno errori di battitura / parole mancanti / parole multiple / singhiozzo / pause, che influenzeranno seriamente il riconoscimento e causeranno il riconoscimento errore. Pertanto, in generale, se si desidera ottenere l'effetto di riconoscimento ideale, si raccomanda che il numero di parole in ciascuna parola chiave non sia troppo lungo per evitare di influenzare l'effetto


 


Il significato più importante della tecnologia ASR è fornire un'interfaccia utente basata sulla voce che sia priva di pulsanti e mouse, rendendo il funzionamento del prodotto dell'utente più naturale, più veloce e più conveniente del controllo manuale e può essere utilizzato in elettrodomestici intelligenti, abbigliamento intelligente, giocattoli intelligenti ad attivazione vocale E molti altri campi.


Al momento, le soluzioni di riconoscimento vocale online sono costose, i cicli di accesso ai prodotti complessi sono lunghi e i tempi di risposta sono influenzati dalla rete. Questa soluzione fornisce un riconoscimento vocale offline non specifico basato su un gran numero di database vocali. Questa soluzione presenta vantaggi in termini di costi: il periodo di accesso semplice è breve, la velocità di risposta al riconoscimento è elevata (entro 0,5 secondi) e non è necessario collegarsi alla rete. La soluzione complessiva è matura, stabile e affidabile, consentendo ai prodotti tradizionali di aggiornare rapidamente le funzioni vocali intelligenti.


 


La tecnologia di riconoscimento vocale offline si basa sulla tecnologia di riconoscimento dell'elenco di parole chiave. Devi solo impostare un elenco di parole chiave da riconoscere e le parole chiave pronunciate dall'utente possono essere riconosciute attraverso il sistema di riconoscimento vocale, senza richiedere all'utente di svolgere alcun corso di registrazione.


Nessuna connessione Internet richiesta


Controllo vocale


 


Aree di applicazione del mercato:


Luci vocali intelligenti, giocattoli intelligenti, elettrodomestici (ventilatori elettrici, cappe aspiranti, condizionatori d'aria), massaggiatori per gli occhi, massaggiatori per il collo, altoparlanti intelligenti


 


Vantaggi di questa soluzione di prodotto:


Tasso di riconoscimento superiore al 95%, riconoscimento accurato entro 3M


Supporta 32 lingue, supporta più lingue piccole


Nessuna connessione di rete, riconoscimento offline, risposta rapida


Supporta la trasmissione di feedback vocali, aumenta l'intrattenimento interattivo


Conveniente, architettura SOC, codec integrato


Chip industriale di alta stabilità


Progettazione flessibile delle istruzioni, nessuna registrazione da parte del cliente richiesta


Brevi tempi di sviluppo e supporto tecnico in atto


 


Parametri tecnici:


Intervallo di tensione di funzionamento selezionabile 3,3 ~ 5,5 V.


Pin di ingresso MIC dedicato Il livello di miglioramento è di 26 dB e il guadagno totale massimo è di 65 dB


Uscita audio PWM differenziale, pilotando direttamente l'altoparlante da 1W / 8Ω


2 uscite di segnale PWM, possono essere utilizzate per l'oscuramento del LED


Fornire interfaccia I2C / UART e protocollo di comunicazione personalizzato, può essere utilizzato per moduli esterni e comunicazione MCU esterna


 


 


metodo di cooperazione:


Fornire una progettazione completa del riconoscimento vocale, i clienti possono progettare le funzioni in base alle proprie esigenze, la nostra azienda è responsabile dello sviluppo della parte di controllo vocale e del collegamento con il controllo principale del cliente


Autorizzazione chip: i clienti sviluppano applicazioni stesse, producono PCB e acquistano componenti corrispondenti per la produzione La nostra azienda fornisce chip, percorsi di riferimento correlati e produzione di comandi di riconoscimento vocale.


 


Elenco dei casi riusciti:


Luce vocale intelligente


Piccoli elettrodomestici intelligenti


Massaggiatore per la salute


Controllo centrale intelligente


 


Modulo di riduzione del rumore vocale:


Sopprime efficacemente il rumore ambientale e migliora l'efficienza del riconoscimento in ambienti rumorosi.


Adatto a prodotti con movimenti meccanici, come ventilatori, stufe, cappe aspiranti, robot spazzanti, ecc.