关于队列研究
队列研究(cohortstudy)是流行病学研究的基本设计之一,目前被广泛地应用于系统生物学和精准医学研究的各个领域。队列研究对一组人群在纵向的不同时间间隔内进行抽样,并对获得的数据进行统计学分析,来评估各种因素和变量对结果的贡献程度。因为队列研究涉及到对多个个体间众多样品的检测,因此队列研究检测结果的准确性将会极大地影响统计学分析的结果以及所得结论的准确性。
今天我们将要具体介绍的两篇文章,都是根据使用HD4discovery代谢组学平台对英国的双胞胎队列TwinsUK的样品进行分析得到的结果而发表的。
关于TwinsUK:
TwinsUK由风湿病学专家TimSpector教授于1992年使用WellcomeTrust和关节炎研究运动组织(ARUK)提供的资助设立,目前由伦敦国王学院的双胞胎研究所维护。TwinsUK队列已包括来自英国各地的12,000个双胞胎,平均年龄五十多岁,是英国唯一的也是世界上临床数据最全的成人双胞胎队列数据库。
全球60多个研究团队已经采用TwinsUK队列进行研究并发布了600多篇研究论文。最近的两个有关肠道菌群研究和全基因组关联分析的文章在进行代谢组学测试的时候都选择了Metabolon的DiscoveryHD4™代谢组学平台。
一、肠道菌群关联研究
人体肠道微生物在健康中起着关键作用,影响激素、维生素以及支链氨基酸的循环水平,与诸如肥胖症和胰岛素抵抗等问题都有关联性,但微基生物的16SrRNA测序分析和鉴定缺乏具体定量注释的功能,亦不能指示每个细菌基因组内基因的转录活性或区分活菌和死菌。而通过粪便的代谢组学研究,能特别报道出宿主、饮食和肠道微生物群之间的代谢相互作用,并通过提供微生物组的功能读数(functionalreadout)来补充测序获得的信息。
2018年由包括来自伦敦国王学院,HumanLongevityInc.和Metabolon等七家研究单位的作者(Ziereretal.)在NatureGenetics上发表了题为Thefecalmetabolomeasafunctionalreadoutofthegutmicrobiome(粪便代谢组作为肠道微生物组的功能读数)的文章(NatureGenetics,2018,50:790-795)。文章中作者对TwinsUK队列中获取的786个个体的粪便使用了MetabolonDiscoveryHD4™非靶向代谢组学平台进行了检测,以研究粪便代谢物与年龄、性别、BMI、肥胖程度、宿主基因差异以及肠道菌群组成的单-多变量的关联性。
通过研究检测出了1,116个代谢物的水平,发现不同个体间的遗传因素对粪便代谢物的影响只有17.9%(heritability(H2)),属于适度范围。在所鉴定的代谢物中,570种是常见的并且在至少80%的样品中都能检测到,而有345种只能在20%至80%的样品中检测到(图一a)。
▲图一a:粪便代谢物测量数量
通过对上述570种常见代谢物进行的多变量PLS-DA分析得出,粪便代谢物的成分能够将最年长的十分位数人群(>75岁)与最年轻的十分位数人群(<56岁)区分开来(曲线下面积=0.71,P=6.8×10-6),其中一种代谢产物,植烷酸(phytanate),在最年长和最年轻的十分位数人群之间存在显著不同(P=5.0×10-3)。这些结果表明粪便代谢组与年龄之间存在非线性关联,这与先前关于年龄对肠道微生物组影响的报道一致(图二)。
▲图二:粪便代谢组与年龄的关联性
其后,Ziereretal.通过对比内脏脂肪量,一个衡量腹部肥胖的标准,并校正了BMI的关联性,发现了总共102个具有统计学意义的关联代谢物指标,它们共同解释了在内脏脂肪中观察到的28.4%的总方差。
新出现的证据还表明肠道微生物群通过与膳食组分的相互作用影响内脏发育。Ziereretal.这篇文章亦验证了内脏脂肪量与肠道微生物组成之间存在很强的关联性。且与BMI相比,粪便代谢物与内脏脂肪相关的程度更深,并突出了肠道代谢过程对腹部肥胖的强烈影响。
内脏脂肪水平与43个粪便氨基酸(均为正相关)(n=647)和32个OTU(n=540)呈显著相关(6个橙色为正相关,26个绿色为负相关)。红方块表明这些代谢物与OTU之间存在正相关关系(β>0);蓝方块表示负相关(β<0);灰方块表示无显著关联(FDR>5%)。微生物与粪便代谢物的关联性符合它们各自与内脏脂肪的关联性,因此表明微生物的代谢谱对比分类学与宿主表型的关系更加密切。
粪便代谢组与向心性肥胖之间的强烈关联证实了微生物氨基酸代谢参与肥胖的假设,并提出了新的影响机制,如微生物维生素B的代谢影响。
在以前的研究中,Ziereretal.发现几种微生物能使接受人类粪便移植物的无菌小鼠的内脏脂肪量较低,体重增加减少。通过此次粪便代谢组分析,Ziereretal.发现这些微生物的水平与较低的氨基酸水平密切相关,因此表明它们与内脏脂肪的相关性可能与氨基酸含量相关(图3)。这种关联可能是由于这些细菌的增加氨基酸的利用或减少氨基酸的产生,或者可能是更复杂的宿主-微生物相互作用的结果。
▲图三:通过粪便代谢物与肠道微生物组之间的关联性探究微生物对内脏脂肪的影响
NAT2基因位点与粪便代谢特征有关(表一)。NAT2基因编码N-乙酰转移酶,催化咖啡因代谢物的降解。NAT2的表达在肝脏中最高,其与粪便中咖啡因衍生的代谢物的浓度相关。通过比较咖啡因与粪便代谢产物5-乙酰氨基-6-氨基-3-甲基尿嘧啶和1,3-二甲基尿酸之间的关系,发现它们的比例与咖啡摄入量和血清咖啡因水平呈正相关。
▲表一:粪便代谢物与基因的关联
最后,粪便代谢组的检测结果可以较好地反映肠道菌群的不同组成,平均能够解释将近70%的肠道菌群组成差异,而且粪便代谢组的变化与内脏脂肪量密切相关,说明肠道菌群可能通过某些机制对腹部肥胖造成影响。由此提出粪便代谢分析是探索微生物组成,宿主表型和遗传复杂性状之间联系的新工具。
二、多组学关联研究
2017年,美国的人类长寿研究所HumanLongevityInc.在自然遗传杂志NatureGenetics上发表了名为Whole-genomesequencingidentifiescommon-to-rarevariantsassociatedwithhumanbloodmetabolites(全基因组测序鉴定与人血液代谢物相关的常见至罕见变异)的文章(Longetal.,NatureGenetics,2017,49:4,568-578),通过全基因组测序(GWAS)和血清代谢组学分析来进行全基因组与代谢组最大的一次关联性研究。该研究挑选TwinsUK的1,960名成年人的血清样本进行代谢组检测并试图把代谢物水平和常见、低频和罕见的三种遗传变异进行关联,结果发现有101个基因突变与246种代谢物的水平变化呈显著相关(P≤1.9×10-11)。有113个个体携带可能影响17个基因功能的罕见杂合突变,这17个基因中有13个与先天性遗传代谢缺陷或其他儿科遗传病症相关。该项研究发现了更多的影响代谢组水平的基因突变,并强调了罕见的杂合突变在影响成人血液代谢异常表型中的重要性。
Longetal.在长达18年的三个不同时间点,收集了来自1,960名受试者的血清样本,包括413对单卵双胞胎和552对异卵双胞胎。图一中,极坐标代表了基于八个超级生化代谢通路(氨基酸,碳水化合物,辅酶和维生素,能量代谢物,脂类,核酸,多肽和外源物)的644个代谢物的遗传度变化区间(h2),总体而言,高遗传度和一致性表明代谢物作为一种中间表型是遗传关联分析的理想选择。
▲图一:644个血清代谢物的遗传度
通过GWAS分析常见(MAF>5%)和低频(0.5%<MAF≤5%)的遗传突变,发现在所有超级代谢通路途径中有246个代谢物变化与101个基因座呈显著相关(P≤1.9×10-11)(图二)。
▲图二:代谢物水平与基因位点关联的Manhattan图
Longetal.对93个拥有异常代谢物水平的个体进行研究,发现10个基因上的14个罕见突变,这之中有27个个体代谢物水平超过平均值达4SD,且所有罕见突变都是杂合子。通过研究这些变异和遗传代谢病(大部分为常染色体隐性遗传)的关联,发现了5个基因:与乳清酸尿症相关的UMPS(MIM258900)与二甲基甘氨酸脱氢酶缺乏症有关的DMGDH(MIM605850),与短链酰基辅酶A脱氢酶缺乏症相关的ACADS(MIM201470),与戊二酸血症II型相关的ETFDH(MIM231680)和与肉碱乙酰转移酶缺乏症相关的CRAT(MIM606175)(图四)。
▲图四:在具有特异血清代谢物水平的异常个体中定位稀有变异
通过和已知遗传变异比较来说明新发现的变异在遗传代谢病中可能的功能作用,Longetal.在图五中显示了ACADS编码的结构以及与短链酰基辅酶A脱氢酶缺乏症相关的新变异和已知变异的位置。发现两个罕见变异与已知变异位置呈聚集状态:c.596C>T|p.Ala199Val变异位于β-sheetdomain上孟德尔变异c.529T>C|p.Trp177Arg附近,并且c.1066G>A|p.Ala356Thr变异在C-末端α-螺旋结构上的几个孟德尔变异附近。这两种新变异可能导致与邻近单体的空间冲突,导致蛋白功能的丧失。
▲图五:ACADS的结构可视化
总体而言,该项研究成功证实了代谢物的定量性状可以与包括同源基因在内的遗传信息联系起来。