语音转文字 VSCode 扩展
这是一款帮助开发者实现语音转文字+AI优化提示词的 VSCode 扩展工具,可用于 Cursor、Windsurf、Trae 等基于 VS Code 开发的 AI 编程 IDE。
功能
- 在编辑器界面中间显示麦克风按钮
- 将用户语音实时转换为文字
- 转换后的文字显示在右侧聊天窗口中
- 支持多家语音转文字服务提供商:百度、讯飞等
- 快捷键:
Ctrl+1
- 密码显示/隐藏切换功能,保护API密钥安全
- AI提示词优化功能,将语音识别结果通过DeepSeek优化为更专业的提示词
- 语音识别结果一键发送到聊天窗口
系统支持
目前支持的系统:
- linux ubuntu 20/22/24 fedora等
LTS长期支持承诺
本扩展提供长期技术支持(LTS):
- 保证至少1年的功能更新和bug修复
- 定期兼容新版本VSCode
- 持续优化语音识别体验
- 快速响应用户反馈问题
- 最终会开源:目前还在不断优化,希望更多的电脑型号可以使用
使用说明
- 安装扩展后,按下
Ctrl+1 启动语音转文字功能
- 在设置中选择语音识别服务提供商(百度、讯飞等)
- 填入相应的 API 密钥信息:
- 点击麦克风按钮开始录音,再次点击停止录音
- 语音将被转换成文字并显示在编辑器中当前光标位置
配置示例
打开 VSCode 设置,搜索"语音转文字",配置以下选项:
- 语音识别服务提供商:选择 "百度短语音识别极速版" 或 "讯飞语音识别"
- 百度语音 AppID:您的百度语音 AppID
- 百度语音 API Key:您的百度语音 API Key
- 百度语音 Secret Key:您的百度语音 Secret Key
获取 API 密钥
直接在浏览器搜服务商全名即可,找不到密钥位置,可以打电话问他们客服
AI提示词优化
开启此功能后,语音识别结果将通过DeepSeek V3 API进行优化,生成更专业的提示词,适合对话场景:
- 在设置中勾选"启用AI提示词优化"
- 填入DeepSeek API密钥
- 开始语音识别,结果将自动优化
隐私说明
所有数据处理均在用户本地进行,不涉及服务器存储,保障用户隐私安全。
已知问题
- 语音识别准确率受环境噪音影响
- 每次录音最长支持60秒
- 在 Windows 系统下,请确保麦克风权限已开启且设备正常工作。
关于作者
作者: lonser
联系微信lonser888
个人网址www.haiou.xyz
| |