使用说明书
逐字稿角色规则
逐字稿角色规则
支持的角色标签(任一即可)
- 中文全称:
咨询师:/来访者: - 中文缩写:
咨:/访: - 英文:
THERAPIST:/COUNSELOR:/CLIENT:/PATIENT: - 单字母:
T:/D:/P:/C:
注意:标签后的字符必须为冒号(中文或英文均可),建议统一使用中文全角冒号或英文半角冒号以提升识别稳定性。
行结构
[可选时间戳] + 角色标签 + 冒号 + 内容
示例:
[00:00:05] 咨:我们先从你这周的感受开始说起,可以吗?
[00:00:12] 访:这周我有两次突然的紧张……分段与连续性
- 同一说话者尽量保持连续段落;若中途被对方打断,再开启新一行
- 建议每句话或每个较完整的语义片段一行,便于高亮与检索
文件与编码
- 首选
.txt(UTF-8),可用.docx - 大文件会自动分段处理,首次分析可能需要更长时间
解析一致性
- 解析器位于
backend/domain/transcripts/parser.py,已支持“咨/访/T/D/P/C”等;你也可以使用英文标签 - 若识别不理想,请检查是否缺少冒号、标签拼写有误或被额外空格/图文混排干扰
相关
- 逐字稿格式要求:/help/specs/transcript-format
- 逐字稿分析与“问一问”:/help/manual/transcript/ask