(日本語 / English)




🚀 まず最初に(重要)
💡 この拡張機能を使うには、次の 2 つが必要です:
- 🔑 OpenAI の API キー(Whisper 対応・有料)
- 🎧 音声録音ツール「sox」 のインストール
- Windows:
公式ダウンロード
- macOS:
brew install sox
- Linux:
sudo apt install sox
※ sox --version
が動作すれば OK です。
🇯🇵 日本語版説明
🧩 概要
VS Code で音声入力ができる拡張機能です。
OpenAI の Whisper API を利用して、100 以上の言語に対応した音声文字起こしを行います。
UI の言語は9 言語対応(日本語、英語、フランス語、スペイン語、中国語、韓国語、ドイツ語、イタリア語、ロシア語)で、VS Code の表示言語設定に自動的に連動します。
✨ 主な機能
- 🎤 マイクから音声を録音し、自動でテキスト化(多言語自動判別)
- 🧠 Whisper API を使用(日本語・英語・中国語など 100 言語対応)
- 📋 結果を現在フォーカス位置にペースト(エディタ、Copilot チャット、ターミナルなど)
- 📊 ステータスバーで録音状態をリアルタイム表示
- 📝 アウトプットパネルでシステムログを確認可能
- ⏱ 録音時間の上限をユーザー設定で変更可能(デフォルト 3 分)
- 🔒 API キーは SecretStorage に暗号化保存
- 🌐 UI 言語 9 言語対応(VS Code 言語設定に自動連動)
⚠️ 注意事項
- Whisper API は従量課金制です。
- 目安:1 分あたり約 0.006 ドル(約 1 円未満)
- 無料枠はありません。クレジットがない場合は動作しません。
- 長時間録音しすぎると料金が増えるため、**上限時間(既定 3 分)**が設けられています。
⚙️ 録音時間を変更する
- VS Code の設定(
Ctrl + ,
)を開く
- 「Whisper Voice Input」で検索
- 「録音の最大時間(秒)」を変更(10〜600 秒まで設定可)
🌍 対応言語
Whisper は100 以上の言語を自動認識できます。
言語を指定する必要はありません。話した言語を自動判別します。
⌨️ キーボードショートカット設定(推奨)
頻繁に使用する場合は、キーボードショートカットを設定することをお勧めします:
- コマンドパレット(
Ctrl + Shift + P
)で 「基本設定: キーボードショートカットを開く」 を選択
- 検索欄で 「whisperVoiceInput.toggle」 を検索
- 「+」ボタンをクリックして、お好みのキー(例:
Ctrl + Alt + V
)を設定
これで、設定したキーを押すだけで録音を開始/停止できます!
🪜 使い方
- 拡張をインストール
- コマンドパレット(
Ctrl + Shift + P
)で 「Whisper: API キーを登録」 を選択し、API キーを入力
- 再度コマンドパレットで 「Whisper: 音声入力の開始 / 停止」 を選択
- ステータスバーで録音状態を確認(🔴 録音中 → ⏳ 処理中 → ✅ 完了)
- 録音が終わると、現在フォーカス位置に自動でテキストが貼り付けられます 🎉
📊 ステータス確認
- ステータスバー: 右下に録音状態をリアルタイム表示
- アウトプットパネル: 詳細ログを確認(
Ctrl+Shift+U
→ 「Whisper Voice Input」選択)
� トラブルシューティング
録音できない場合
- SOX がインストールされているか確認:
sox --version
コマンドが動作するか確認
- マイクの権限: VS Code にマイクアクセス権限が与えられているか確認
- API キー: OpenAI API キーが正しく設定されているか確認
音声が認識されない場合
- 録音環境: 周囲の騒音を減らし、マイクに近づいて話す
- 録音時間: 短すぎる録音(1-2 秒)は認識されない場合があります
- 言語: 話している言語が Whisper API でサポートされているか確認
ログの確認方法
- アウトプットパネル(
Ctrl+Shift+U
)→「Whisper Voice Input」でエラー詳細を確認
ライセンス
MIT License
Copyright (c) 2025 aleaf
🇺🇸 English Description
🧩 Overview
A VS Code extension for voice input powered by OpenAI's Whisper API.
Supports over 100 languages for speech recognition, with automatic detection.
The extension UI supports 9 languages (Japanese, English, French, Spanish, Chinese, Korean, German, Italian, Russian) and automatically follows your VS Code display language setting.
✨ Features
- 🎤 Record and transcribe your voice (auto language detection)
- 🧠 Supports 100+ languages via Whisper API
- 📋 Automatically pastes transcribed text to current focus (editor, Copilot chat, terminal, etc.)
- 📊 Real-time recording status display in status bar
- 📝 System logs available in Output panel
- ⏱ Adjustable recording limit (default: 3 minutes, configurable 10--600 sec)
- 🔒 API key securely stored using VS Code SecretStorage
- 🌐 UI supports 9 languages (auto-detects from VS Code locale)
⚠️ Important Notice
- Whisper API is pay-as-you-go (paid).
- Example: $0.006 per minute (~¥1/min)
- There is no free tier --- requests will fail if your account has no credits.
- A recording time limit (default 3 minutes) is applied to prevent accidental long sessions.
⚙️ Adjust Recording Limit
- Open VS Code settings (
Ctrl + ,
)
- Search for "Whisper Voice Input"
- Change the Max Record Seconds setting (range: 10--600 seconds)
🌍 Supported Languages
Whisper automatically recognizes and transcribes speech in 100+ languages, including Japanese, English, Chinese, Korean, Spanish, French, and more --- no manual language selection required.
⌨️ Keyboard Shortcut Setup (Recommended)
For frequent use, we recommend setting up a keyboard shortcut:
- Open Command Palette (
Ctrl + Shift + P
) → "Preferences: Open Keyboard Shortcuts"
- Search for "whisperVoiceInput.toggle"
- Click the "+" button and assign your preferred key (e.g.,
Ctrl + Alt + V
)
Now you can start/stop recording with just your assigned key combination!
🪜 How to Use
- Install the extension
- Open the Command Palette (
Ctrl + Shift + P
) → "Whisper: Set API Key", then enter your OpenAI API key
- Again, select "Whisper: Start / Stop Voice Input"
- Status bar shows recording state (🔴Recording → ⏳Processing → ✅Done)
- Speak --- the transcribed text will appear at your current focus position 🎉
📊 Status Monitoring
- Status Bar: Real-time recording status display in bottom bar
- Output Panel: Detailed logs available (
Ctrl+Shift+U
→ Select "Whisper Voice Input")
� Troubleshooting
Can't Record Audio
- Check SOX installation: Verify
sox --version
command works
- Microphone permissions: Ensure VS Code has microphone access permissions
- API Key: Verify OpenAI API key is correctly configured
Speech Not Recognized
- Recording environment: Reduce background noise, speak closer to microphone
- Recording duration: Very short recordings (1-2 seconds) may not be recognized
- Language: Ensure your spoken language is supported by Whisper API
Check Logs
- Output Panel (
Ctrl+Shift+U
) → Select "Whisper Voice Input" for detailed error information
License
MIT License
Copyright (c) 2025 aleaf
🧾 Marketplace Short Description / Keywords
日本語:
🎙️ OpenAI Whisper API による音声入力拡張。100 言語対応/UI9 言語対応/ステータスバー表示/Copilot チャット対応/従量課金制(1 分あたり約 1 円)。
English:
🎙️ Voice input for VS Code using OpenAI Whisper API. Supports 100+ languages for speech, 9 UI languages, status bar display, Copilot chat compatible, pay-as-you-go pricing.
"description": "🎙️ Voice input for VS Code using OpenAI Whisper API (9 UI languages, 100+ speech languages, Copilot compatible)",
"keywords": ["whisper", "voice input", "speech to text", "multilingual", "openai", "microphone", "copilot", "ai", "transcription"],
"categories": ["AI", "Other", "Productivity"]