Author: Matteo Benedetto (Enne2)
Website: enne2.net
ParlaType è un'applicazione Python che utilizza il riconoscimento vocale offline (Vosk) per trascrivere il parlato e digitarlo automaticamente come se fosse una tastiera fisica.
Nota Importante: Questo progetto è specificamente concepito e ottimizzato per la lingua italiana. La mappatura dei tasti e il modello vocale incluso sono configurati per gestire correttamente i caratteri accentati e la fonetica italiana.
- Riconoscimento Vocale Offline: Utilizza Vosk, quindi non richiede connessione internet e garantisce la privacy.
- Ottimizzato per l'Italiano: Include il modello
vosk-model-it-0.22e gestisce nativamente caratteri comeà,è,é,ì,ò,ù. - Tastiera Virtuale: Simula la pressione dei tasti tramite
evdeveuinput, permettendo di dettare testo in qualsiasi applicazione. - Interfaccia Grafica: GUI minimale basata su GTK 3 con indicatore nella system tray (se supportato).
Il codice sorgente di ParlaType è rilasciato sotto licenza MIT.
Il modello vocale incluso (vosk-model-it-0.22) è sviluppato da Alpha Cephei ed è rilasciato sotto licenza Apache 2.0. È quindi possibile ridistribuirlo liberamente insieme a questa applicazione.
Per maggiori informazioni sui modelli Vosk, visitare la pagina ufficiale dei modelli.
Il progetto è sviluppato per Linux.
Prima di installare le dipendenze Python, è necessario installare alcune librerie di sistema. Su sistemi basati su Debian/Ubuntu:
sudo apt-get update
sudo apt-get install python3-dev python3-pip portaudio19-dev libgirepository1.0-dev libcairo2-dev pkg-config libgirepository1.0-devL'applicazione necessita di accedere a /dev/uinput per creare la tastiera virtuale. Puoi eseguire lo script come root (sconsigliato per l'uso quotidiano) o aggiungere il tuo utente al gruppo input (o creare una regola udev specifica).
Per aggiungere l'utente al gruppo input (potrebbe richiedere il riavvio o il logout):
sudo usermod -aG input $USERInoltre, assicurati che i permessi su /dev/uinput siano corretti.
-
Clona il repository o scarica i file.
-
Crea un virtual environment (opzionale ma consigliato):
python3 -m venv .venv source .venv/bin/activate -
Installa le dipendenze Python:
pip install -r requirements.txt
-
Modello Vosk: Il progetto si aspetta di trovare il modello nella cartella
models/vosk-model-it-0.22. Assicurati che la struttura delle cartelle sia:keyTalk/ ├── main.py ├── models/ │ └── vosk-model-it-0.22/ │ ├── model.conf │ └── ...Se non hai il modello, scaricalo dal sito ufficiale di Vosk ed estrailo nella cartella
models.
Per integrare ParlaType nel menu delle applicazioni del tuo sistema desktop (GNOME, KDE, ecc.), puoi utilizzare lo script di installazione fornito:
./install.shQuesto script:
- Creerà il virtual environment e installerà le dipendenze (se non presenti).
- Genererà un file
.desktopcon i percorsi corretti. - Installerà l'icona e il collegamento nel menu applicazioni.
Attiva il virtual environment (se creato) ed esegui lo script:
source .venv/bin/activate
python main.pyNota: Se non hai configurato i permessi per il tuo utente, potresti dover usare sudo:
sudo .venv/bin/python main.pyUna volta avviato:
- L'applicazione inizierà ad ascoltare dal microfono predefinito.
- Posiziona il cursore dove vuoi scrivere (es. un editor di testo).
- Parla: il testo riconosciuto verrà digitato automaticamente.
main.py: Codice principale dell'applicazione (GUI, Thread di trascrizione, Gestione tastiera).requirements.txt: Elenco delle dipendenze Python.models/: Cartella contenente i modelli Vosk.
- Errore
Permission deniedsu/dev/uinput: Esegui consudoo configura correttamente i permessi del gruppoinput. - Errore PyAudio: Assicurati di aver installato
portaudio19-dev. - Caratteri sbagliati: La mappatura è configurata per un layout di tastiera italiano. Se usi un layout diverso, potresti dover modificare
CHAR_MAPinmain.py.