ParlaType - Speech-to-Text Virtual Keyboard

Author: Matteo Benedetto (Enne2)
Website: enne2.net

ParlaType è un'applicazione Python che utilizza il riconoscimento vocale offline (Vosk) per trascrivere il parlato e digitarlo automaticamente come se fosse una tastiera fisica.

Nota Importante: Questo progetto è specificamente concepito e ottimizzato per la lingua italiana. La mappatura dei tasti e il modello vocale incluso sono configurati per gestire correttamente i caratteri accentati e la fonetica italiana.

Caratteristiche

Riconoscimento Vocale Offline: Utilizza Vosk, quindi non richiede connessione internet e garantisce la privacy.
Ottimizzato per l'Italiano: Include il modello vosk-model-it-0.22 e gestisce nativamente caratteri come à, è, é, ì, ò, ù.
Tastiera Virtuale: Simula la pressione dei tasti tramite evdev e uinput, permettendo di dettare testo in qualsiasi applicazione.
Interfaccia Grafica: GUI minimale basata su GTK 3 con indicatore nella system tray (se supportato).

Licenza e Modelli

Il codice sorgente di ParlaType è rilasciato sotto licenza MIT.

Il modello vocale incluso (vosk-model-it-0.22) è sviluppato da Alpha Cephei ed è rilasciato sotto licenza Apache 2.0. È quindi possibile ridistribuirlo liberamente insieme a questa applicazione. Per maggiori informazioni sui modelli Vosk, visitare la pagina ufficiale dei modelli.

Prerequisiti

Il progetto è sviluppato per Linux.

Dipendenze di Sistema

Prima di installare le dipendenze Python, è necessario installare alcune librerie di sistema. Su sistemi basati su Debian/Ubuntu:

sudo apt-get update
sudo apt-get install python3-dev python3-pip portaudio19-dev libgirepository1.0-dev libcairo2-dev pkg-config libgirepository1.0-dev

Permessi

L'applicazione necessita di accedere a /dev/uinput per creare la tastiera virtuale. Puoi eseguire lo script come root (sconsigliato per l'uso quotidiano) o aggiungere il tuo utente al gruppo input (o creare una regola udev specifica).

Per aggiungere l'utente al gruppo input (potrebbe richiedere il riavvio o il logout):

sudo usermod -aG input $USER

Inoltre, assicurati che i permessi su /dev/uinput siano corretti.

Installazione

Clona il repository o scarica i file.
Crea un virtual environment (opzionale ma consigliato):
```
python3 -m venv .venv
source .venv/bin/activate
```
Installa le dipendenze Python:
```
pip install -r requirements.txt
```
Modello Vosk: Il progetto si aspetta di trovare il modello nella cartella models/vosk-model-it-0.22. Assicurati che la struttura delle cartelle sia:
```
keyTalk/
├── main.py
├── models/
│   └── vosk-model-it-0.22/
│       ├── model.conf
│       └── ...
```
Se non hai il modello, scaricalo dal sito ufficiale di Vosk ed estrailo nella cartella models.

Installazione Desktop (Opzionale)

Per integrare ParlaType nel menu delle applicazioni del tuo sistema desktop (GNOME, KDE, ecc.), puoi utilizzare lo script di installazione fornito:

./install.sh

Questo script:

Creerà il virtual environment e installerà le dipendenze (se non presenti).
Genererà un file .desktop con i percorsi corretti.
Installerà l'icona e il collegamento nel menu applicazioni.

Utilizzo

Da Terminale

Attiva il virtual environment (se creato) ed esegui lo script:

source .venv/bin/activate
python main.py

Nota: Se non hai configurato i permessi per il tuo utente, potresti dover usare sudo:

sudo .venv/bin/python main.py

Una volta avviato:

L'applicazione inizierà ad ascoltare dal microfono predefinito.
Posiziona il cursore dove vuoi scrivere (es. un editor di testo).
Parla: il testo riconosciuto verrà digitato automaticamente.

Struttura del Progetto

main.py: Codice principale dell'applicazione (GUI, Thread di trascrizione, Gestione tastiera).
requirements.txt: Elenco delle dipendenze Python.
models/: Cartella contenente i modelli Vosk.

Risoluzione Problemi

Errore Permission denied su /dev/uinput: Esegui con sudo o configura correttamente i permessi del gruppo input.
Errore PyAudio: Assicurati di aver installato portaudio19-dev.
Caratteri sbagliati: La mappatura è configurata per un layout di tastiera italiano. Se usi un layout diverso, potresti dover modificare CHAR_MAP in main.py.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.github		.github
.gitignore		.gitignore
README.md		README.md
install.sh		install.sh
keytalk.desktop		keytalk.desktop
main.py		main.py
main.spec		main.spec
parlatype-setup		parlatype-setup
parlatype.desktop		parlatype.desktop
parlatype.spec		parlatype.spec
parlatype.svg		parlatype.svg
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ParlaType - Speech-to-Text Virtual Keyboard

Caratteristiche

Licenza e Modelli

Prerequisiti

Dipendenze di Sistema

Permessi

Installazione

Installazione Desktop (Opzionale)

Utilizzo

Da Terminale

Struttura del Progetto

Risoluzione Problemi

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ParlaType - Speech-to-Text Virtual Keyboard

Caratteristiche

Licenza e Modelli

Prerequisiti

Dipendenze di Sistema

Permessi

Installazione

Installazione Desktop (Opzionale)

Utilizzo

Da Terminale

Struttura del Progetto

Risoluzione Problemi

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages