Epicenter (震中/震源模拟)

参考的文章

从第三个小NC的文章开始,个人觉得这篇的方法学部分作者介绍的很清楚,值得学习借鉴。从Page 10开始:

Individualized W-score maps

这部分得到每个患者的W-score map,类似于z-score map(分母都是标准差,分子是线性模型的实际值-预测值),但是考虑了协变量的影响(年龄和性别),这种“萎缩map”的方法也用的比较多了。

( W_{score} = \frac{TLE_{observed} - TLE_{predicted}} {SD(HC_{observed} - HC_{predicted})} ), TLE is for temporal lobe epilepsy

另外值得注意的是,选择了三个fMRI指标(SV,ReHo,NS),为了合成一个综合指标(即最终只有1个W-score map),使用马氏距离(Mahalanobis distance)来衡量每个患者和健康对照组的差异。对于我来说,想成带PCA的标准化欧式距离会更容易理解(可参考深入理解欧氏距离和马氏距离)。

欧式距离: ( D = \sqrt{(x-\mu)^T(x-\mu)} ) 马氏距离: ( D_M = \sqrt{(x-\mu)^TS^{-1}(x-\mu)} ), 其中S是协方差矩阵(所以各分量不相关时,就是欧氏距离)

引入协方差矩阵可以消除不同指标之间的量纲影响,同时考虑指标之间的相关性。可以这样想:如果3个指标其实是高度相关的,那么计算这三个指标相对于正常对照的欧式距离时就相当于1个变量计算了三次,会高估差异(实际上推测3个指标反映了同一种机制,但被计算了3次),而马氏距离通过协方差矩阵的逆矩阵来校正这种相关性,从而得到更准确的差异度量。

参考下图,单纯的标准化不改变相关性,而马氏距离通过协方差矩阵的逆矩阵来消除相关性对距离计算的影响。

Mahalanobis Distance

接下来作者计算The proportion of extreme deviations (i.e., grouplevel deviation rate),是指每个脑区在患者群体中出现极端偏离(|W-score| ≥ 1.96)的比例。

Neighborhood deviation estimates

[ \bar{p}i = \frac{1}{N_i} \sum{j = 1,, j \neq i}^{N_i} p_j \cdot C_{ij} ]

计算的是每个脑区解剖相连的其他脑区的平均偏离程度(连接强度作为权重),C是结构连接矩阵(SC),N是与脑区i相连的脑区数目。这样就得到了1个脑区的neighborhood deviation map。这个map和上面的脑区deviation map做相关,含义就是:本身偏差较大的脑区,其解剖相连脑区的偏差也推测较大。

然后来到Disease epicenters mapping

前面我们得到了1个脑区deviation map(n个脑区),对于每一个脑区而言,都有一个结构连接模式(n维向量,表示该脑区与其他n个脑区的连接强度)。二者做相关,共有n个脑区的这两个向量的相关系数,相关系数高的脑区即更有可能是疾病的epicenter(也就是全脑的疾病负荷和某个脑区的全脑连接强度高度相关,就符合疾病导致的变化是从某个脑区沿功能连接扩散的假设)。原文Figure 3B给出了直观的示意图。

epicenter

再看第二篇浙二的研究,就基于第一篇冯建峰老师的研究,主要定义一个goodness of fit (GOF)值来寻找epicenter。首先是正文Identification of Degenerative Epicenter Patterns in PD Subtypes–Determination of Individual Regional Degeneration Z-Score Map部分,还是前面的那些概念,只不过把W-score map换成了还是叫Z-score map,用的Deformation-Based Morphometry(DBM)(可参考CAT12的文档Deformation-based morphometry (DBM),发现里面有提到不要使用TIV作为协变量,不知道这里和文章采用的分析是否有矛盾?),类似上面的公式为 [ z\text{-}score_{\text{ROI}} = \frac{\text{Mean}(\varepsilon_{\text{HC}}) - \varepsilon_{\text{PD}}(i)} {\text{STD}(\varepsilon_{\text{HC}})} ] 注意这里的设计:皮层萎缩的(\varepsilon)是真实-预测,协变量多了一个TIV,深部核团QSM是预测-真实,目的是都让更大的值表示更重的疾病影响,最后得到的也是一个degeneration map。

接下来是Determination of Individual GM Regional GOF Score。我觉得这个研究巧妙在先做的是subject-level的epicenter分析,上面NC的文章是直接用group-level的deviation map来找epicenter,而这里是每个患者单独计算epicenter。具体做法是:对于每个脑区,计算该脑区的结构连接模式和该患者的degeneration map的相关系数,得到n个脑区的相关系数,再Fisher z变换,得到该患者的GOF map。见原文图1 1. B-E

epicenter2

这样做巧妙在利用患者的GOF图后续做聚类区分不同的PD亚型。

2025-12-04