(CSV 制作 + 模板选择 + 变量设置 + 统计方法 + 结果解读)

欢迎使用 CME 麻醉论坛的“统计分析工具”。
它的设计目标是:让临床科研用户在不依赖复杂统计软件的情况下,快速获得规范、可复核、可用于论文写作的统计结果与表格(支持 Word 下载)

本指南将按真实科研流程一步步说明:

✅ 如何制作合格 CSV 文件
✅ 如何命名变量(列名)最稳妥
✅ 如何准备“变量字典表”(变量含义/单位/数据类型)
✅ 如何选择统计模板(Table 1 / Table 2 / 回归)
✅ 如何设置分组变量、结局变量、白名单、黑名单
✅ 系统如何选择统计检验方法(包括 Fisher 触发条件)
✅ 如何查看报告、下载 Word 表格并用于论文写作


0. 使用权限说明:仅对白金会员开放

本统计分析工具属于 CME 麻醉论坛的高级科研功能,仅对白金会员开放使用

0.1 如何成为白金会员?

开通方式非常简单:

1)进入网站页面 “我的订单”
2)选择 白金会员
3)完成支付后即可开通并使用统计分析工具(立即生效)

白金会员开通后,你将获得:统计分析工具权限、模板化输出报告、Word 表格下载等科研效率支持。


1. 第一步:准备一个“合格的 CSV 文件”(最重要)

统计分析工具的输入是 CSV 文件(逗号分隔值)。
你可以用以下任意方式制作 CSV:

  • Excel / WPS:编辑好表格 → 另存为 CSV(UTF-8)

  • Numbers(Mac/iPad)

  • HIS/电子病历系统导出

  • REDCap、问卷星、数据库导出

✅ 强烈建议:最终提交 CSV 前,用 Excel/WPS 打开检查一遍,再保存一次,避免编码和格式问题。


1.1 CSV 的基本结构:一行代表一个病例(或一次观察)

推荐结构:

  • 每一行 = 1 个患者/病例

  • 每一列 = 1 个变量

  • 第一行必须是变量名(表头)

示例(简化):

```csv
id,group,age,sex,bmi,asa,op_time_min,bleeding_ml
001,A,5,M,16.3,2,48,12
002,A,6,F,15.9,1,55,5
003,B,7,M,17.5,2,60,8
```

1.2 变量命名规则(列名)——推荐简短英文(强烈建议)

为了保证统计分析稳定且结果可复核,建议列名遵循以下规则:

✅ 规则 1:只用英文/数字/下划线

  • age

  • bmi

  • op_time_min

  • spo2_min

  • 年龄

  • 手术时间(min)

  • SpO₂最低值

✅ 规则 2:不要有空格

  • op_time_min

  • op time min

✅ 规则 3:推荐把单位写进变量名后缀

  • weight_kg

  • height_cm

  • op_time_min

  • bleeding_ml

  • dose_mgkg

这样你导出 Word 表格后,复核和写论文会非常轻松。


1.3 变量内容格式建议(推荐)

① 连续变量(数值型)直接填数字

age = 5
op_time_min = 55
❌ 不要写成 55 min88 bpm(单位不要混进数据)

② 二分类变量(建议 0/1 或 Yes/No)

complication = 0/1
smoke = 0/1

③ 分类变量(建议用短文本或数字编码)

sex = M/F
group = A/B
asa = 1/2/3


1.4 缺失值怎么表示?(很关键)

缺失值建议写成:

  • ✅ 空(留空)

  • NA

不建议写:

  • -

  • unknown


2. 强烈建议你额外准备一张“变量字典表”(变量说明书)

除了 CSV,本工具强烈建议你同时准备一份“变量字典表”(自己保存,不必上传)。
这是团队协作、论文写作、审稿复核时最重要的一步。

推荐格式如下(Excel/Word 均可):

变量名 中文含义 单位 数据类型 取值范围/编码 备注
id 受试者编号 字符 001/002… 不参与分析
group 分组 分类 A/B 主要比较
age 年龄 year 连续 0~18 入组时
sex 性别 分类 M/F 统一大写
bmi 体重指数 kg/m² 连续 10~40 可缺失
asa ASA分级 分类 1/2/3 医生评估
op_time_min 手术时间 min 连续 >0 麻醉记录
bleeding_ml 出血量 ml 连续 ≥0 估算或计量

3. 上传 CSV → 创建统计任务

在统计分析页面:

1)点击 上传 CSV
2)选择 CSV 文件
3)选择一个统计模板
4)点击 创建任务

创建成功后会进入 任务详情页,你可以设置参数并运行统计。


4. 统计模板怎么选?(你要做什么分析)

目前统计分析工具采用“模板驱动”:

  • 不同模板输出不同结构的统计结果

  • 结果包含:在线报告(HTML)+ Word 表格(DOCX)+ JSON


4.1 Table 1:基线资料表(Cohort Characteristics)

适用场景:

  • 回顾性队列、RCT、分组对比

  • 生成论文标准 Table 1:人口学特征与基线指标

你通常需要设置:

  • ✅ 分组变量(group_col):例如 group

  • ✅ 白名单/黑名单:控制哪些变量进入 Table 1


4.2 Table 2:结局分析表(Outcomes)

适用场景:

  • 你希望对一组结局变量进行统计比较

  • 例如:出血量、插管次数、并发症发生率、恢复时间等

你通常需要设置:

  • ✅ 分组变量(group_col):例如 group

  • ✅ 结局变量白名单(whitelist,多选):例如 bleeding_mlcomplicationlos_day

  • ✅ 黑名单(blacklist):排除 ID、备注等列


4.3 回归模板(Regression:线性/Logistic 等)

回归模板适用于更“论文级”的分析:
在比较组别效应时,进一步控制混杂因素(协变量)。

✅ 回归模板里你需要理解的两个关键设置

① 主要结局(primary_outcome):设置为“因变量”

也就是你想解释/预测的那一列:

  • 如果是连续结局:例如 bleeding_mllos_dayop_time_min

  • 如果是二分类结局:例如 complication(0/1)、death(0/1)

📌 举例:
如果你想分析 “分组是否影响出血量”,那么:

  • primary_outcome = bleeding_ml

  • 分组变量 group_col = group


② 白名单(whitelist):设置为“自变量候选集合”

白名单在回归里建议放入:

  • ✅ 分组变量(例如 group

  • ✅ 需要调整的协变量(混杂因素)

    • age

    • sex

    • bmi

    • asa

    • 其他基线差异明显且医学上合理的变量

📌 举例:
你想回归模型调整年龄、性别、ASA:

  • primary_outcome = bleeding_ml

  • whitelist = group, age, sex, asa

注意:白名单放太多变量容易导致过拟合或模型不稳定(尤其样本量小),建议在临床逻辑与样本量允许范围内选择。


5. 变量选择怎么做?(白名单/黑名单的意义)

你在任务详情页可以看到:

  • 分组变量(group_col)

  • 主要结局(primary_outcome)

  • 白名单(whitelist,多选)

  • 黑名单(blacklist,多选)

这套机制的意义是:

✅ 医学数据变量多且混杂
✅ 默认“全部变量都分析”风险太高
✅ 白名单/黑名单让分析更安全、更可控、更像科研真实工作


5.1 白名单(Whitelist):我只分析这些列(推荐)

强烈建议你用白名单控制变量集合,尤其适合:

  • Table 1:放入基线变量

  • Table 2:放入结局变量(多选)

  • 回归:放入协变量 + 分组变量


5.2 黑名单(Blacklist):我明确不分析这些列

黑名单非常有用,常见要排除的列:

  • id

  • name

  • note

  • remark

  • comment

  • timestamp


6. 系统如何选择统计检验方法?(核心规则说明)

你的统计模板输出不仅仅是“结果”,更重要的是:它会尽量按科研规范自动选择合适的检验方法

下面是本工具的总体规则说明(用户能看懂、也能用于论文 Methods 部分):


6.1 变量类型分类(决定统计方法的第一步)

工具会先把变量分为两类:

✅ 连续变量(数值型)

例如:

  • age

  • bmi

  • bleeding_ml

  • op_time_min

✅ 分类变量(非连续变量)

例如:

  • sex

  • group

  • asa

  • complication(0/1)

不同类型变量使用不同检验体系。


6.2 Table 1 / Table 2 的组间比较:连续变量用什么检验?

对于连续变量(例如 agebmibleeding_ml),系统会依据:

1)数据是否近似正态分布
2)两组方差是否齐(homogeneity of variance)

来选择检验方法。

✅ 情况 A:近似正态 + 方差齐

➡️ 优先使用 独立样本 t 检验(Student’s t-test)

✅ 情况 B:近似正态 + 方差不齐

➡️ 优先使用 Welch’s t-test(更稳健)

✅ 情况 C:明显非正态分布

➡️ 优先使用 Wilcoxon 秩和检验(Mann–Whitney U)

因此你在报告中会看到:同样是连续变量,不同变量可能使用不同检验,这是正常且更科学的。


6.3 分类变量用什么检验?(卡方 vs Fisher)

对于分类变量(例如 sexasacomplication),常用方法是:

  • Pearson 卡方检验(Chi-square test)

  • Fisher 精确检验(Fisher’s exact test)

✅ Fisher 检验的触发条件(非常重要)

当列联表中出现以下情况,卡方检验的适用性下降,系统会自动/优先使用 Fisher:

  • 样本量较小

  • 某些格子的期望频数过低

  • 常见经验规则:

    • 任一格期望频数 < 1,或

    • 超过 20% 的格期望频数 < 5

📌 通俗理解:
当你的分类变量非常偏(例如事件很少、某组几乎没有发生),Fisher 更可靠。


6.4 结果展示方式(与检验方法对应)

为了符合医学论文的规范输出:

连续变量通常会输出:

  • 正态倾向:均值 ± 标准差

  • 非正态倾向:中位数(IQR)

分类变量通常会输出:

  • n(%)

并在对应位置给出 P 值。


7. 运行统计 → 查看报告 → 下载 Word 表格

在任务详情页你可以:

✅ 保存参数并提交统计
✅ 在线查看报告(HTML)
✅ 下载表格(DOCX)
✅ 下载结果(JSON)
✅ 下载日志(log.txt)


7.1 在线查看报告(HTML)

适合快速浏览与核对,尤其适合:

  • 检查变量是否选对

  • 看每个变量的数据分布与缺失情况

  • 了解系统最终采用了哪种检验方法


7.2 下载表格 DOCX(Word 版 Table 1 / Table 2)

这是科研用户最常用的输出文件,适用于:

✅ 直接复制进论文 Word
✅ 提交给合作者修改
✅ 根据目标期刊格式排版


7.3 下载 result.json(结构化结果)

适合进一步用途:

  • 自动生成结果段落(Results)

  • 自动生成图表与摘要

  • 将来用于科研自动化与 AI 辅助写作


8. 常见问题(偏科研角度的提醒)

建议你每次分析前先确认:

  • 列名是否规范(英文、无空格、无奇怪符号)

  • 分组变量是否只有 A/B(或你想要的多组)

  • 分类变量编码是否一致(例如 M/F、1/0)

  • 结局变量是否确实是结局(Table 2 里尤其重要)

  • 白名单是否只包含你真正想分析的列(更安全)


9. 结语:让统计变成可复制、可复核、可发表的科研能力

传统统计软件的痛点是:

  • 会用的人少

  • 变量管理混乱

  • 很难团队复用

  • 易错而不自知

而 CME 麻醉论坛统计分析工具的价值是:

✅ 用 CSV 让数据结构标准化
✅ 用模板让统计逻辑规范化
✅ 用白名单/黑名单让变量可控
✅ 用报告+Word表格让输出可直接写论文