使用说明书

逐字稿角色规则

逐字稿角色规则

支持的角色标签（任一即可）

中文全称：咨询师： / 来访者：
中文缩写：咨： / 访：
英文：THERAPIST: / COUNSELOR: / CLIENT: / PATIENT:
单字母：T: / D: / P: / C:

注意：标签后的字符必须为冒号（中文或英文均可），建议统一使用中文全角冒号或英文半角冒号以提升识别稳定性。

行结构

[可选时间戳] + 角色标签 + 冒号 + 内容

示例：

[00:00:05] 咨：我们先从你这周的感受开始说起，可以吗？
[00:00:12] 访：这周我有两次突然的紧张……

分段与连续性

同一说话者尽量保持连续段落；若中途被对方打断，再开启新一行
建议每句话或每个较完整的语义片段一行，便于高亮与检索

文件与编码

首选 .txt（UTF-8），可用 .docx
大文件会自动分段处理，首次分析可能需要更长时间

解析一致性

解析器位于 backend/domain/transcripts/parser.py，已支持“咨/访/T/D/P/C”等；你也可以使用英文标签
若识别不理想，请检查是否缺少冒号、标签拼写有误或被额外空格/图文混排干扰

相关

逐字稿格式要求：/help/specs/transcript-format
逐字稿分析与“问一问”：/help/manual/transcript/ask

“问一问”功能说明

专业术语库使用指南