Skip to content
| Marketplace
Sign in
Visual Studio Code>AI>Voice to Text + Copilot ChatNew to Visual Studio Code? Get it now.
Voice to Text + Copilot Chat

Voice to Text + Copilot Chat

aleaf

|
4 installs
| (0) | Free
Whisperを利用して音声を文字に変換し、Copilot Chatでもそのまま使えます。(Convert your voice into text directly in VS Code — powered by Whisper, works with Copilot Chat.)
Installation
Launch VS Code Quick Open (Ctrl+P), paste the following command, and press enter.
Copied to clipboard
More Info

🎙 Whisper Voice Input

(日本語 / English)

Version
VSCode
License
Platform


🚀 まず最初に(重要)

💡 この拡張機能を使うには、次の 2 つが必要です:

  1. 🔑 OpenAI の API キー(Whisper 対応・有料)
    • Whisper は**従量課金制(1 分あたり約 0.006 ドル ≒ 1 円未満)**です。
    • クレジット残高がない場合は動作しません。
    • 💰 クレジット追加ページ
    • 🔑 API キー発行ページ
  2. 🎧 音声録音ツール「sox」 のインストール
    • Windows: 公式ダウンロード
    • macOS: brew install sox
    • Linux: sudo apt install sox ※ sox --version が動作すれば OK です。

🇯🇵 日本語版説明

🧩 概要

VS Code で音声入力ができる拡張機能です。 OpenAI の Whisper API を利用して、100 以上の言語に対応した音声文字起こしを行います。 UI の言語は9 言語対応(日本語、英語、フランス語、スペイン語、中国語、韓国語、ドイツ語、イタリア語、ロシア語)で、VS Code の表示言語設定に自動的に連動します。


✨ 主な機能

  • 🎤 マイクから音声を録音し、自動でテキスト化(多言語自動判別)
  • 🧠 Whisper API を使用(日本語・英語・中国語など 100 言語対応)
  • 📋 結果を現在フォーカス位置にペースト(エディタ、Copilot チャット、ターミナルなど)
  • 📊 ステータスバーで録音状態をリアルタイム表示
  • 📝 アウトプットパネルでシステムログを確認可能
  • ⏱ 録音時間の上限をユーザー設定で変更可能(デフォルト 3 分)
  • 🔒 API キーは SecretStorage に暗号化保存
  • 🌐 UI 言語 9 言語対応(VS Code 言語設定に自動連動)

⚠️ 注意事項

  • Whisper API は従量課金制です。
    • 目安:1 分あたり約 0.006 ドル(約 1 円未満)
  • 無料枠はありません。クレジットがない場合は動作しません。
  • 長時間録音しすぎると料金が増えるため、**上限時間(既定 3 分)**が設けられています。

⚙️ 録音時間を変更する

  1. VS Code の設定(Ctrl + ,)を開く
  2. 「Whisper Voice Input」で検索
  3. 「録音の最大時間(秒)」を変更(10〜600 秒まで設定可)

🌍 対応言語

Whisper は100 以上の言語を自動認識できます。 言語を指定する必要はありません。話した言語を自動判別します。


⌨️ キーボードショートカット設定(推奨)

頻繁に使用する場合は、キーボードショートカットを設定することをお勧めします:

  1. コマンドパレット(Ctrl + Shift + P)で 「基本設定: キーボードショートカットを開く」 を選択
  2. 検索欄で 「whisperVoiceInput.toggle」 を検索
  3. 「+」ボタンをクリックして、お好みのキー(例:Ctrl + Alt + V)を設定

これで、設定したキーを押すだけで録音を開始/停止できます!


🪜 使い方

  1. 拡張をインストール
  2. コマンドパレット(Ctrl + Shift + P)で 「Whisper: API キーを登録」 を選択し、API キーを入力
  3. 再度コマンドパレットで 「Whisper: 音声入力の開始 / 停止」 を選択
  4. ステータスバーで録音状態を確認(🔴 録音中 → ⏳ 処理中 → ✅ 完了)
  5. 録音が終わると、現在フォーカス位置に自動でテキストが貼り付けられます 🎉

📊 ステータス確認

  • ステータスバー: 右下に録音状態をリアルタイム表示
  • アウトプットパネル: 詳細ログを確認(Ctrl+Shift+U → 「Whisper Voice Input」選択)

� トラブルシューティング

録音できない場合

  1. SOX がインストールされているか確認: sox --version コマンドが動作するか確認
  2. マイクの権限: VS Code にマイクアクセス権限が与えられているか確認
  3. API キー: OpenAI API キーが正しく設定されているか確認

音声が認識されない場合

  • 録音環境: 周囲の騒音を減らし、マイクに近づいて話す
  • 録音時間: 短すぎる録音(1-2 秒)は認識されない場合があります
  • 言語: 話している言語が Whisper API でサポートされているか確認

ログの確認方法

  • アウトプットパネル(Ctrl+Shift+U)→「Whisper Voice Input」でエラー詳細を確認

ライセンス

MIT License Copyright (c) 2025 aleaf


🇺🇸 English Description

🧩 Overview

A VS Code extension for voice input powered by OpenAI's Whisper API. Supports over 100 languages for speech recognition, with automatic detection. The extension UI supports 9 languages (Japanese, English, French, Spanish, Chinese, Korean, German, Italian, Russian) and automatically follows your VS Code display language setting.


✨ Features

  • 🎤 Record and transcribe your voice (auto language detection)
  • 🧠 Supports 100+ languages via Whisper API
  • 📋 Automatically pastes transcribed text to current focus (editor, Copilot chat, terminal, etc.)
  • 📊 Real-time recording status display in status bar
  • 📝 System logs available in Output panel
  • ⏱ Adjustable recording limit (default: 3 minutes, configurable 10--600 sec)
  • 🔒 API key securely stored using VS Code SecretStorage
  • 🌐 UI supports 9 languages (auto-detects from VS Code locale)

⚠️ Important Notice

  • Whisper API is pay-as-you-go (paid).
    • Example: $0.006 per minute (~¥1/min)
  • There is no free tier --- requests will fail if your account has no credits.
  • A recording time limit (default 3 minutes) is applied to prevent accidental long sessions.

⚙️ Adjust Recording Limit

  1. Open VS Code settings (Ctrl + ,)
  2. Search for "Whisper Voice Input"
  3. Change the Max Record Seconds setting (range: 10--600 seconds)

🌍 Supported Languages

Whisper automatically recognizes and transcribes speech in 100+ languages, including Japanese, English, Chinese, Korean, Spanish, French, and more --- no manual language selection required.


⌨️ Keyboard Shortcut Setup (Recommended)

For frequent use, we recommend setting up a keyboard shortcut:

  1. Open Command Palette (Ctrl + Shift + P) → "Preferences: Open Keyboard Shortcuts"
  2. Search for "whisperVoiceInput.toggle"
  3. Click the "+" button and assign your preferred key (e.g., Ctrl + Alt + V)

Now you can start/stop recording with just your assigned key combination!


🪜 How to Use

  1. Install the extension
  2. Open the Command Palette (Ctrl + Shift + P) → "Whisper: Set API Key", then enter your OpenAI API key
  3. Again, select "Whisper: Start / Stop Voice Input"
  4. Status bar shows recording state (🔴Recording → ⏳Processing → ✅Done)
  5. Speak --- the transcribed text will appear at your current focus position 🎉

📊 Status Monitoring

  • Status Bar: Real-time recording status display in bottom bar
  • Output Panel: Detailed logs available (Ctrl+Shift+U → Select "Whisper Voice Input")

� Troubleshooting

Can't Record Audio

  1. Check SOX installation: Verify sox --version command works
  2. Microphone permissions: Ensure VS Code has microphone access permissions
  3. API Key: Verify OpenAI API key is correctly configured

Speech Not Recognized

  • Recording environment: Reduce background noise, speak closer to microphone
  • Recording duration: Very short recordings (1-2 seconds) may not be recognized
  • Language: Ensure your spoken language is supported by Whisper API

Check Logs

  • Output Panel (Ctrl+Shift+U) → Select "Whisper Voice Input" for detailed error information

License

MIT License Copyright (c) 2025 aleaf


🧾 Marketplace Short Description / Keywords

日本語:

🎙️ OpenAI Whisper API による音声入力拡張。100 言語対応/UI9 言語対応/ステータスバー表示/Copilot チャット対応/従量課金制(1 分あたり約 1 円)。

English:

🎙️ Voice input for VS Code using OpenAI Whisper API. Supports 100+ languages for speech, 9 UI languages, status bar display, Copilot chat compatible, pay-as-you-go pricing.

"description": "🎙️ Voice input for VS Code using OpenAI Whisper API (9 UI languages, 100+ speech languages, Copilot compatible)",
"keywords": ["whisper", "voice input", "speech to text", "multilingual", "openai", "microphone", "copilot", "ai", "transcription"],
"categories": ["AI", "Other", "Productivity"]
  • Contact us
  • Jobs
  • Privacy
  • Manage cookies
  • Terms of use
  • Trademarks
© 2025 Microsoft