规范

逐字稿格式要求

逐字稿格式要求

文件

  • 首选 .txt(UTF-8),可用 .docx

角色标签(任一均可)

  • 中文全称:咨询师: / 来访者:
  • 中文缩写:咨: / 访:
  • 英文:THERAPIST:/COUNSELOR:/CLIENT:/PATIENT:
  • 单字母:T:/D:/P:/C:

必须满足的两条格式要求(重要)

1) 角色标签后必须紧跟冒号:)。

  • 冒号用于明确分隔“角色标签”和“内容”。省略冒号会导致角色与内容黏连,系统容易误判说话人。

2) 角色切换必须换行(一行只写一个说话人)。

  • 当从“咨询师”切换到“来访者”(或反之)时,必须另起一行。
  • 不要把多个角色的内容写在同一行,否则容易造成识别混乱。

结构

  • [可选时间戳] + 角色标签 + 冒号 + 内容
  • 同一说话者尽量保持连续段落

示例

[00:00:05] 咨:我们先从你这周的感受开始说起,可以吗?
[00:00:12] 访:这周我有两次突然的紧张……

常见错误(请避免)

  • 缺少冒号(错误):咨 我们先从你这周的感受开始说起
  • 不换行(错误):咨:…… 访:……(同一行出现两个角色)