语音转录工具

将音频文件转换为带时间戳的文字,支持多说话人分离和精确时间轴对齐

检查服务状态...

上传音频文件

点击选择或拖拽文件到这里

支持 MP3, WAV, M4A, MP4 等格式

转录设置

更大的模型准确度更高,但处理速度较慢

提供上下文信息可以提高特定词汇的识别准确率

自动识别不同说话人并分别标记

已知说话人数量时可指定以提高准确率,否则使用自动检测

上传音频文件开始转录

使用说明

📝 功能特点

  • • 支持多种音频/视频格式
  • • 自动检测语言或手动指定
  • • 多说话人分离识别
  • • 精确的时间戳对齐
  • • 可指定说话人数量或自动检测

⚡ 使用建议

  • • 清晰的人声录音效果最佳
  • • 提供提示词可提高专业术语识别
  • • 已知说话人数量时可指定以提高准确率
  • • 长音频处理可能需要较长时间
  • • 建议使用 WAV 格式获得最佳效果