使用说明书

逐字稿角色规则

逐字稿角色规则

支持的角色标签(任一即可)

  • 中文全称:咨询师: / 来访者:
  • 中文缩写:咨: / 访:
  • 英文:THERAPIST: / COUNSELOR: / CLIENT: / PATIENT:
  • 单字母:T: / D: / P: / C:

注意:标签后的字符必须为冒号(中文或英文均可),建议统一使用中文全角冒号或英文半角冒号以提升识别稳定性。

行结构

[可选时间戳] + 角色标签 + 冒号 + 内容

示例:

[00:00:05] 咨:我们先从你这周的感受开始说起,可以吗?
[00:00:12] 访:这周我有两次突然的紧张……

分段与连续性

  • 同一说话者尽量保持连续段落;若中途被对方打断,再开启新一行
  • 建议每句话或每个较完整的语义片段一行,便于高亮与检索

文件与编码

  • 首选 .txt(UTF-8),可用 .docx
  • 大文件会自动分段处理,首次分析可能需要更长时间

解析一致性

  • 解析器位于 backend/domain/transcripts/parser.py,已支持“咨/访/T/D/P/C”等;你也可以使用英文标签
  • 若识别不理想,请检查是否缺少冒号、标签拼写有误或被额外空格/图文混排干扰

相关

  • 逐字稿格式要求:/help/specs/transcript-format
  • 逐字稿分析与“问一问”:/help/manual/transcript/ask