循证医学7-8周回顾
二项分布与poisson分布及其应用
二项分布
$$ P(X) = C^x_{n} \pi^x (1-\pi)^{n-x}$$ $$\mu = n\pi, \sigma^2={ n\pi(1-\pi) }$$样本率的方差计算同正态分布时的均值的方差计算:
$$S_{p}=\sqrt{ \frac{p(1-p)}{n} }$$
总体率置信区间计算:
- 查表方法
- 正态近似法(样本容量>100, $\pi \approx 0.5$)
显著:拒绝H_0,因为超过了3个标准差
Poisson分布
$$P(X)= \frac{\lambda^x}{x!}e^{-\lambda}, X=0,1,2,\dots$$
$$\mu=\lambda, \sigma^2=\lambda$$
总体率置信区间计算:
- 查表方法
- 正态近似法($\mu \approx 0.5$)
RR值和OR值的估计
RR值适用于:队列研究(risk ratio)
OR值适用于:病例对照研究(odds ratio)
指标 | 全称 | 定义 | 适用研究 |
---|---|---|---|
RR | 相对危险度(Relative Risk) | 暴露组患病概率 / 非暴露组患病概率 | 队列研究(可以“跟踪”发病) |
OR | 比值比(Odds Ratio) | 病例组的暴露几率 / 对照组的暴露几率 | 病例对照研究(不能计算发病率) |
为何适用于不同研究类型?
队列研究 → RR
- 从“暴露”开始观察,可以得到真正的“发病概率”。
- 所以可以直接算:
$$RR = \frac{P(\text{发病}|\text{暴露})}{P(\text{发病}|\text{非暴露})}$$
病例对照研究 → OR
- 从“疾病状态”出发选人(先有病例和对照),无法算发病率。
- 只能算暴露与非暴露的“比值”:
$$OR = \frac{\text{病例组中暴露/非暴露}}{\text{对照组中暴露/非暴露}}$$
生存分析 → HR(harzard ratio)
定义:HR 衡量暴露组相对于非暴露组在 随时间变化的事件发生速率(例如生存分析中的死亡率、疾病发生率等)的比率。它通常用于 生存分析,尤其是 Cox比例风险模型 中。
计算方法:HR 基于时间的事件发生风险计算,可以理解为暴露组和非暴露组在单位时间内发生事件的风险比:
$$HR = \frac{\text{暴露组事件发生率}}{\text{非暴露组事件发生率}}$$它考虑了随时间推移的风险,而不仅仅是单纯的事件发生与否。
举个例子
发病 | 未发病 | 总计 | |
---|---|---|---|
暴露组 | 30 | 70 | 100 |
非暴露组 | 10 | 90 | 100 |
总计 | 40 | 160 | 200 |
口诀: “RR 看未来,OR 看过去”
- RR 是“先暴露后观察结果” → 队列研究
- OR 是“先有病例找原因” → 病例对照
卡方检验
理论频数的计算:
有效 | 无效 | 总数 | 概率 | |
---|---|---|---|---|
A组 | 68(74*87.59%) | 6 | 74 | 91.89% |
B组 | 52 | 11 | 63 | 82.54% |
总计 | 120 | 17 | 137 | 87.59% |
普通卡方:$n\geq40, E\geq5$
连续性校正卡方:$n\geq40, 1\leq E\leq5$
Fisher确切检验:$n\leq40$ 或 $E\leq {1}$
例题:15只4只发生癌变,对照组10只0只癌变
癌变 | 未癌变 | |
---|---|---|
暴露组 | 4 | 11 |
非暴露组 | 0 | 10 |
配对卡方检验
行列表卡方检验
- 多个率的比较
- 率的多重比较
- 多个构成比的比较
- 两种属性关联性检验
多种R $\times$ C表资料统计分析方法
卡方检验
- 双向无序
- 单向有序:组别有序、结果无序
秩和检验
- 单向有序:组别无序、结果有序
拟合优度的卡方检验
- 单变量
- 二项分布
- Poisson分布
Cover image icon by Freepik from Flaticon
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Evanescence's Blog!