将音频文件转换为带时间戳的文字,支持多说话人分离和精确时间轴对齐
点击选择或拖拽文件到这里
支持 MP3, WAV, M4A, MP4 等格式
更大的模型准确度更高,但处理速度较慢
提供上下文信息可以提高特定词汇的识别准确率
自动识别不同说话人并分别标记
已知说话人数量时可指定以提高准确率,否则使用自动检测
上传音频文件开始转录