循证医学3-4周回顾
假设检验
- 检验的对象:抽样样本的均值,均值分布满足正态分布、抽样所得样本不一定满足正态分布
- 从正态分布——u分布——t分布(方差未知时用,大部分时候)
- 可信区间的计算(CI):依赖于标准正态分布$\mathcal{N}(0,1)$ ,双边检验和单边检验的区分
变换方法:
$$\begin{aligned}
X \sim \mathcal{N}(\mu, \sigma^2)\\
X-\mu \sim \mathcal{N}(0, \sigma^2)\\
\frac{X-\mu}{\sigma} \sim \mathcal{N}(0, 1)
\end{aligned}
$$
两组均数比较的参数检验
单样本t检验
和已知的均值比较。
假设我检测的样本均值为$\bar{X} \sim \mathcal{N}(\mu_{1}, \frac{\sigma_{1}^2}{n})$,总体均值为常数$\mu_{2}$,然后我们对这两个作差得到:
$$\bar{X}-\mu_{2}\sim \mathcal{N}(\mu_{1}-\mu_{2}, \frac{\sigma_{1}^2}{n})$$
我希望的是:证明作差得到的分布是一个均值为0的分布,这样就可以证明两个样本均值和总体均值是没有差别的。
所以,假设以上均值为0,然后计算出现以上事件的概率。
配对设计
这里是配对样本的差值作为上面单样本检验的样本数据
两总体均数比较
两样本均数满足$$\begin{aligned}
\bar{X_{1}} \sim \mathcal{N}\left( \mu_{1}, \frac{\sigma_{1}^2}{n_{1}} \right)\\
\bar{X_{2}} \sim \mathcal{N}\left( \mu_{2}, \frac{\sigma_{2}^2}{n_{2}} \right)
\end{aligned}
$$
作差得到, 随机变量计算公式:
$$\bar{X_{1}}-\bar{X_{2}} \sim \mathcal{N}\left( \mu_{1} - \mu_{2}, \frac{\sigma_{1}^2}{n_{1}} + \frac{\sigma_{2}^2}{n_{2}}\right)$$
假设上面公式均值为0,计算概率
因为总体方差未知,所以用S代替$\sigma$
方差齐性
我们所做的工作都是针对均值,所以不妨假设方差相同,因为不相同,那显然不是两个相同总体
但是在使用该前提的时候需要证明方差相同。
使用的证明方法就是F检验,F分布就是两个正态分布的比值
$$F=\frac{\frac{\sum_{i=1}^{n_{1}}X_{i}^2}{n_{1}}}{\frac{\sum_{i=1}^{n_{2}}Y_{i}^2}{n_{2}}}$$
其中,$X_{i}$和$Y_{i}$均为来自标准正态分布的样本,则称统计量F满足F分布
$$F \sim F(n_{1},n_{2})$$
方差之比遵从F分布,计算方差之比在假设两方差相同的情况下出现的概率。
有趣的是,后面我们计算多组均数的方差分析中,也是使用的F分布,那个时候我们做出的假设是——组内方差=组间方差
LASSO
文献例子: Development and validation of a model to predict cognitive impairment in traumatic brain injury patients: a prospective observational study
“Variable selection was conducted via the least absolute shrinkage and selection operator (LASSO) method. Independent variables with nonzero coefficients in the LASSO regression model were selected and subsequently analyzed via multivariate logistic regression (P < 0.05) to identify potential predictive factors.”
Cover image icon by Freepik from Flaticon