Sviluppo di un microcomputer a chip singolo per la tecnologia Fandou Schema di riconoscimento vocale offline

2020-06-05 12:50:23

Può fornire soluzioni, può anche fornire PCBA

Introduzione al riconoscimento vocale

La tecnologia di riconoscimento vocale automatico ASR (Automatic Speech Recognition) si basa sulla tecnologia di riconoscimento dell'elenco di parole chiave. In ogni processo di riconoscimento, il contenuto del parlato parlato dall'utente viene convertito in funzioni vocali attraverso lo spettro e le voci in questo elenco di parole chiave vengono abbinate una per una e il risultato di riconoscimento viene utilizzato il migliore corrispondente. Ad esempio, in un'applicazione per telefoni cellulari, il contenuto di questo elenco di parole chiave è il nome della persona nella rubrica / il comando di menu del telefono cellulare / il nome del brano nella scheda T, ecc. Indipendentemente dal contenuto di questo elenco, solo l'utente deve impostare il registro pertinente, È possibile passare il contenuto dell'elemento corrispondente per essere riconosciuto al motore di riconoscimento sotto forma di caratteri.

Il motore di riconoscimento non si preoccupa del contenuto delle parole chiave nell'elenco delle parole chiave, che può essere qualsiasi stringa di caratteri cinese come comandi, nomi delle persone, nomi dei brani, istruzioni operative e così via.

Il numero massimo di parole che ogni parola chiave può supportare è limitato a 30 parole dal punto di vista dell'algoritmo. Tuttavia, dalla situazione attuale, quando gli utenti dicono più di 8 parole alla volta, quasi sicuramente diranno errori di battitura / parole mancanti / parole multiple / singhiozzo / pause, che influenzeranno seriamente il riconoscimento e causeranno il riconoscimento errore. Pertanto, in generale, se si desidera ottenere l'effetto di riconoscimento ideale, si raccomanda che il numero di parole in ciascuna parola chiave non sia troppo lungo per evitare di influenzare l'effetto

Il significato più importante della tecnologia ASR è fornire un'interfaccia utente basata sulla voce che sia priva di pulsanti e mouse, rendendo il funzionamento del prodotto dell'utente più naturale, più veloce e più conveniente del controllo manuale e può essere utilizzato in elettrodomestici intelligenti, abbigliamento intelligente, giocattoli intelligenti ad attivazione vocale E molti altri campi.

Al momento, le soluzioni di riconoscimento vocale online sono costose, i cicli di accesso ai prodotti complessi sono lunghi e i tempi di risposta sono influenzati dalla rete. Questa soluzione fornisce un riconoscimento vocale offline non specifico basato su un gran numero di database vocali. Questa soluzione presenta vantaggi in termini di costi: il periodo di accesso semplice è breve, la velocità di risposta al riconoscimento è elevata (entro 0,5 secondi) e non è necessario collegarsi alla rete. La soluzione complessiva è matura, stabile e affidabile, consentendo ai prodotti tradizionali di aggiornare rapidamente le funzioni vocali intelligenti.

La tecnologia di riconoscimento vocale offline si basa sulla tecnologia di riconoscimento dell'elenco di parole chiave. Devi solo impostare un elenco di parole chiave da riconoscere e le parole chiave pronunciate dall'utente possono essere riconosciute attraverso il sistema di riconoscimento vocale, senza richiedere all'utente di svolgere alcun corso di registrazione.

Nessuna connessione Internet richiesta

Controllo vocale

Aree di applicazione del mercato:

Luci vocali intelligenti, giocattoli intelligenti, elettrodomestici (ventilatori elettrici, cappe aspiranti, condizionatori d'aria), massaggiatori per gli occhi, massaggiatori per il collo, altoparlanti intelligenti

Vantaggi di questa soluzione di prodotto:

Tasso di riconoscimento superiore al 95%, riconoscimento accurato entro 3M

Supporta 32 lingue, supporta più lingue piccole

Nessuna connessione di rete, riconoscimento offline, risposta rapida

Supporta la trasmissione di feedback vocali, aumenta l'intrattenimento interattivo

Conveniente, architettura SOC, codec integrato

Chip industriale di alta stabilità

Progettazione flessibile delle istruzioni, nessuna registrazione da parte del cliente richiesta

Brevi tempi di sviluppo e supporto tecnico in atto

Parametri tecnici:

Intervallo di tensione di funzionamento selezionabile 3,3 ~ 5,5 V.

Pin di ingresso MIC dedicato Il livello di miglioramento è di 26 dB e il guadagno totale massimo è di 65 dB

Uscita audio PWM differenziale, pilotando direttamente l'altoparlante da 1W / 8Ω

2 uscite di segnale PWM, possono essere utilizzate per l'oscuramento del LED

Fornire interfaccia I2C / UART e protocollo di comunicazione personalizzato, può essere utilizzato per moduli esterni e comunicazione MCU esterna

metodo di cooperazione:

Fornire una progettazione completa del riconoscimento vocale, i clienti possono progettare le funzioni in base alle proprie esigenze, la nostra azienda è responsabile dello sviluppo della parte di controllo vocale e del collegamento con il controllo principale del cliente

Autorizzazione chip: i clienti sviluppano applicazioni stesse, producono PCB e acquistano componenti corrispondenti per la produzione La nostra azienda fornisce chip, percorsi di riferimento correlati e produzione di comandi di riconoscimento vocale.

Elenco dei casi riusciti:

Luce vocale intelligente

Piccoli elettrodomestici intelligenti

Massaggiatore per la salute

Controllo centrale intelligente

Modulo di riduzione del rumore vocale:

Sopprime efficacemente il rumore ambientale e migliora l'efficienza del riconoscimento in ambienti rumorosi.

Adatto a prodotti con movimenti meccanici, come ventilatori, stufe, cappe aspiranti, robot spazzanti, ecc.

标签: Sviluppo SCM Soluzione di riconoscimento vocale offline

Sviluppo di un microcomputer a chip singolo per la tecnologia Fandou Schema di riconoscimento vocale offline

notizia

为您推荐