语音转录工具

将音频文件转换为带时间戳的文字，支持多说话人分离和精确时间轴对齐

检查服务状态...

上传音频文件

点击选择或拖拽文件到这里

支持 MP3, WAV, M4A, MP4 等格式

转录设置

模型选择

更大的模型准确度更高，但处理速度较慢

语言

提示词 (可选)

提供上下文信息可以提高特定词汇的识别准确率

启用说话人分离

自动识别不同说话人并分别标记

说话人数量

已知说话人数量时可指定以提高准确率，否则使用自动检测

上传音频文件开始转录

使用说明

📝 功能特点

• 支持多种音频/视频格式
• 自动检测语言或手动指定
• 多说话人分离识别
• 精确的时间戳对齐
• 可指定说话人数量或自动检测

⚡ 使用建议

• 清晰的人声录音效果最佳
• 提供提示词可提高专业术语识别
• 已知说话人数量时可指定以提高准确率
• 长音频处理可能需要较长时间
• 建议使用 WAV 格式获得最佳效果