概要
WSL2上のClaude Codeに音声で指示を出せる仕組みを構築する。別ウィンドウで作業中でもバックグラウンドで音声認識が動作し、自動的にClaude Codeに入力される。
背景
- Tip 2ではMac向けの音声入力ツール(superwhisper、MacWhisper、Super Voice Assistant)を紹介している
- Windows/WSL2環境向けの方法がない
- 並列作業しながら音声でClaude Codeを操作したい
技術調査結果
WSLgのマイク入力
WSL2ではWSLgを通じてWindowsのマイクにアクセス可能:
# オーディオソースの確認
pactl list sources short
# RDPSource が表示される
# 録音テスト
timeout 4 parecord --device=RDPSource --file-format=wav --rate=44100 --channels=1 /tmp/test.wav
# 再生確認
paplay /tmp/test.wav
必要なWindows設定
設定 → プライバシーとセキュリティ → マイク:
- 「マイクへのアクセス」→ オン
- 「デスクトップアプリがマイクにアクセスできるようにする」→ オン
実装案
アーキテクチャ
[バックグラウンドデーモン(WSL2)]
↓ RDPSourceからマイク常時監視(または音声検出時)
↓ whisper.cppで文字起こし
↓ tmux send-keys で Claude Code セッションに入力
[別ウィンドウで作業中でもOK]
必要なコンポーネント
- 音声認識: whisper.cpp(ローカル)またはWhisper API(クラウド)
- 入力制御: tmux send-keys でClaude Codeセッションに送信
- トリガー方式:
- 常時リッスン(音声検出で自動開始)
- または ホットキー(押している間だけ録音)
参考: Windows向け既存ツール
タスク
関連
- Tip 2: Talk to Claude Code with your voice
- Tip 45: Execute PowerShell commands from WSL2
- Tip 46: Use Claude in Chrome from WSL2
概要
WSL2上のClaude Codeに音声で指示を出せる仕組みを構築する。別ウィンドウで作業中でもバックグラウンドで音声認識が動作し、自動的にClaude Codeに入力される。
背景
技術調査結果
WSLgのマイク入力
WSL2ではWSLgを通じてWindowsのマイクにアクセス可能:
必要なWindows設定
設定 → プライバシーとセキュリティ → マイク:
実装案
アーキテクチャ
必要なコンポーネント
参考: Windows向け既存ツール
タスク
関連