跳到主要内容

基于全基因组测序研究的人工智能代谢综合征预测模型构建

摘要

背景

昼夜节律系统负责调节各种生理活动和行为,并已获得认可。昼夜节律以24小时为周期进行调节,并具有转录-翻译反馈回路。当昼夜节律被中断,影响昼夜节律基因的表达时,疾病的表型就会放大。例如,当编码生物钟核心成分的基因突变导致疾病时,昼夜节律系统赋予的维持内部时间内稳态的重要性被揭示出来。本研究旨在探讨台湾人群中昼夜节律基因与代谢综合征的关系。

方法

我们使用全基因组测序进行分析,读取vcf文件并设置目标昼夜节律基因以确定目标基因是否存在变异。在这项研究中,我们利用基于人群的下一代全基因组测序研究了昼夜节律相关疾病的遗传贡献。我们还使用显著的snp来创建代谢综合征预测模型。采用Logistic回归、随机森林、adaboost和神经网络预测代谢综合征。此外,我们使用随机森林模型变量重要性矩阵选择了40个更显著的snp,随后将其纳入新的预测模型并与先前的模型进行比较。然后使用五倍交叉验证将数据用于训练集和测试集。采用以下标准对每个模型进行评估:接收者工作特征曲线下面积(AUC)、精度、F1评分和平均精度(精度召回曲线下面积)。

结果

在搜索显著变异后,我们使用卡方检验来发现一些变异。发现186个显著性snp,使用186个显著性snp的4个预测模型(logistic回归、随机森林、adaboost和神经网络)的AUC分别为0.68、0.8、0.82和0.81。F1得分分别为0.412、0.078、0.295、0.552。使用40个snp的其他3个模型(logistic回归、adaboost和神经网络),AUC分别为0.82、0.81和0.81。F1得分分别为0.584、0.395、0.574。

结论

昼夜节律基因缺陷也可能导致代谢综合征。我们的研究发现了几个相关基因,并建立了一个简单的模型来预测代谢综合征。

背景

代谢综合征(MetS)是与心血管疾病和2型糖尿病相关的一组常见的代谢危险因素,包括:血压升高、动脉粥样硬化性血脂异常、胰岛素抵抗和中心性肥胖(测量腰围与种族特定值)。因此,代谢综合征最终可导致慢性肾脏疾病(CKD)和动脉粥样硬化性心血管疾病等疾病[1]。

代谢综合征的危险因素包括家族史、吸烟、肥胖、缺乏体育锻炼和生活方式因素[23.]。据报道,含糖软饮料会增加患病风险[45]。体重指数(BMI)、收缩压(SBP)和甘油三酯水平较高的儿童被认为在中年时患MetS的风险更高。6]。

代谢综合征的患病率在超重和肥胖人群中最高。国际糖尿病联合会(IDF)估计,世界上有四分之一的人口患有代谢综合征。考虑到年龄因素,代谢综合征似乎在60岁以上的老年人中最常见[2]。成人中代谢综合征的患病率平均约为23% [7]。在台湾进行的一项全国性调查,即2005-2008年台湾营养与健康调查(NAHSIT)显示,在10-15年期间,男性的met患病率从13.6%(1993-1996年)显著增加到25.5%(2005-2008年),女性患病率分别从26.4%增加到31.5%。糖尿病、高血压、心脏病、脑血管病和代谢综合征之间的关系是密不可分的,因为这些疾病及其关联都在台湾十大死亡原因之列[8]。

昼夜节律在内分泌分泌、体温[9]。昼夜节律的一个重要方面是,它们在没有外部提示的情况下持续存在[10]。在大约24小时周期内周期性表达的昼夜节律基因有助于调节代谢基因[111213]。先前的动物模型表明,敲除特定的昼夜节律基因会影响昼夜节律行为。认识到多个转录因子在昼夜节律基因中起作用,每个转录因子都有数千个基因组DNA结合位点。每一个昼夜节律基因都直接参与单个基因的调节,除了通过定义生物钟本身的转录-翻译反馈回路对其他生物钟基因进行互惠和稳态调节之外[14]。许多疾病已被发现与昼夜节律基因有关,包括阿尔茨海默病,帕金森病[15]、动脉粥样硬化性疾病[16或病毒感染。

昼夜节律也会影响氧化应激。如果人体或细胞经历重大压力,它们调节内部系统的能力,包括氧化还原水平和昼夜节律,可能会受到损害[17]。动物研究表明,利培酮可以重置昼夜节律[18]。研究发现,利培酮通过活性氧(ROS)升高、线粒体潜在塌陷、溶酶体膜渗漏、谷胱甘肽耗竭和脂质过氧化诱导细胞毒性,一些抗氧化剂如辅酶Q10或n -乙酰半胱氨酸可能作为一种治疗选择[19]。昼夜节律也在肝脏脂质代谢和肾素血管紧张素系统中发挥作用[20.]及慢性疲劳综合症[2122]。他汀类药物治疗的时机可能影响疗效[23]。肾素血管紧张素系统可诱导氧化应激和纤维化细胞因子[24]。改变昼夜节律可能对慢性肝病的治疗有很大的影响。

越来越多的证据表明,生物钟基因可能与代谢综合征的发展有关[2526]。生物钟调节生物事件的时间,包括睡眠-觉醒周期、能量代谢和激素分泌等。在Lin等人的关联和相互作用分析中,该研究提出许多核心生物钟基因影响代谢活动和代谢,从而可能导致代谢综合征[27]。我们的目标是与MetS有潜在联系的核心生物钟基因。

方法

研究人群

本研究以台湾生物银行(TWB) NGS群组为研究对象。TWB收集台湾居民的生活方式、基因组数据和代表性疾病。TWB招募30至70岁、无癌症病史的社区志愿者。该队列基于台湾普通人群的招募和监测,并已在先前的遗传研究中使用[28]。我们的研究纳入了642名拥有全基因组序列(WGS)数据的TWB个体。

代谢综合征定义

根据新的国际糖尿病联合会(IDF)的定义,代谢综合征必须符合中心性肥胖的标准(以特定民族值的腰围测量,见下文)加上以下4个因素中的2个:

  • 甘油三酯≥150mg /dL (1.7 mmol/L)或因甘油三酯升高而接受药物治疗

  • 空腹血糖≥100mg //dL或既往诊断为2型糖尿病

  • 降低高密度脂蛋白(HDL)胆固醇或降低HDL胆固醇的药物治疗:

  • 男性< 40mg /dL (1.0 mmol/L)

  • 女性< 50 mg/dL (1.3 mmol/L)

下列任何一种表现为血压升高:

  • 收缩压≥130mmhg或

  • 舒张压≥85mmhg或

  • 有高血压病史患者的降压药治疗。

由于我们的研究在台湾进行,我们的数据来自台湾生物库,我们根据“南亚人”和“中国人”群体使用了种族特定的腰围值,其中中心性肥胖被定义为男性腰围≥90厘米,女性腰围≥80厘米。

发现可疑的单核苷酸多态性

本分析采用illumina平台共分析642例WGS(其中123例定义为代谢综合征患者),目的基因为:ALAS1、APOA5、ARNTL、BUD13、CETP、CLOCK、CRY1、CRY2、CSNK1D、CSNK1E、GSK3B、LIPA、NPAS2、NR1D1、PER1、PER2、PER3、RORA、RORB、RORC、SMAD2、SMAD3、SMAD4、TGFB2、TGFB3、TGFBR2等snp分析范围内的基因。SNP的取值范围为17 ~ 37(平均值> 30),Qual > = 30 [29]。

然而,在本次实验中,由于CSNK1E的单核苷酸多态性(SNP)范围设置问题,数据分析的范围比原先预期的要大。代谢综合征的定义主要基于台湾BioBank数据库的生理数据。将其导入SQL server后,以数据库语言对患者进行分组,作为后续分析的依据。

统计各组中单链变异、双链变异或无变异的发生频率。随后用Python编写数学公式,用统计分析计算95%置信区间,用卡方或费雪精确检验计算p值。在确定了显著snp后,我们进行了亚组分析,以确定这些snp是否与高血压、低HDL水平、糖尿病或高TG水平有关。采用Bonferroni Correction进行多重假设检验,由于代谢综合征有5类,α值设为0.5/5 = 0.1。

统计分析

连续变量的P值采用学生t检验计算。分类变量比较采用卡方检验或精确检验。考虑到本研究的探索性,P < 0.05被认为具有统计学意义。我们使用R软件4.04版本中的插入符号包进行模型预测。我们还使用c#、python和MySQL进行数据操作。

建立基于基因组的预测模型

我们使用显著的snp来创建代谢综合征预测模型。采用Logistic回归、随机森林、adaboost和神经网络预测代谢综合征。数据用于训练集和测试集,采用五重交叉验证。我们假设SNPs存在累积效应,因此取纯合为2,杂合为1,野生型为0。由于体重可能受到这些基因的影响,因此不将体重用作协变量[30.]。除了上述4个模型外,我们根据随机森林重要矩阵选取了40个重要snp,并利用它们分别利用logistic回归、adaboost和神经网络方法建立了另外3个模型(图2)。1).我们使用了一个简单的神经网络,只有一层,隐藏层有10个单元,衰减等于0。采用以下标准对每个模型进行评估:接收者工作特征曲线下面积(AUC)、精度、F1评分和平均精度(精度召回曲线下面积)。

图1
图1

模型构建流程图

结果

代谢综合征个体和对照组的基线特征

642例研究人群中,有代谢综合征124例,无代谢综合征518例。代谢综合征组的平均年龄为51岁,非代谢综合征组的平均年龄为44岁。我们发现代谢综合征患者的腰围、血压、甘油三酯水平、血红蛋白A1C、空腹血糖和糖尿病百分比均高于无代谢综合征患者。此外,代谢综合征患者的高密度脂蛋白值低于无代谢综合征患者,这与代谢综合征的定义相对应(表1)1).

表1患者基线特征

表格1显示代谢综合征基线值。

代谢综合征突变等位基因谱

我们检索了参考昼夜节律基因中的所有等位基因,并使用卡方检验来确定异质性或同质性基因型是否与代谢综合征有关。在这些基因中,我们发现了186个与代谢综合征相关的昼夜节律基因的显著snp。(表2).在186个SNP等位基因中,我们确定了47个与高血压相关的等位基因(表1)3.), 27个与糖尿病相关的等位基因(表2)4), 10个等位基因与低HDL-C相关(表2)5)和46个与高TG水平相关的等位基因(表2)6).

表2显著snp和优势比
表3高血压相关snp
表4糖尿病相关snp
表5低HDL-C相关snp
表6甘油三酯水平相关snp

基于基因的预测模型

我们应用逻辑回归、随机森林、adaboost和神经网络等不同的机器学习模型来预测基于基因数据的代谢综合征。采用logistic回归、随机森林、adaboost和神经网络4种预测模型,AUC分别为0.68、0.8、0.82和0.8。F1得分分别为0.424、0.525、0.528、0.526(详见表)7).我们选择随机森林模型中最显著的40个snp作为新变量。我们将随机森林模型中40个最显著的OR值与40个最重要的snp进行了比较。我们发现只有11个snp重叠(表1)8) SNP选择模型(logistic回归、adaboost和神经网络)的AUC分别为0.82、0.81和0.85。F1得分分别为0.578、0.415、0.5(表1)9).特征选择模型的性能优于原始模型。AUC和F1值均优于前代车型。

表7使用所有显著snp的预测模型
表8随机森林模型中40个最重要的snp及其OR值
表9利用特征选择snp的预测模型

讨论

在这项研究中,我们发现了186个与代谢综合征相关的昼夜节律基因snp。其中与载脂蛋白相关的snp有8个。先前的研究表明,在昼夜节律中断后,载脂蛋白E敲除的小鼠更容易发生心血管疾病[3132]。昼夜节律紊乱会改变我们身体的代谢因子,包括胆固醇和载脂蛋白[33]。另一项动物研究也发现,敲除载脂蛋白e的小鼠在昼夜节律改变后会更快地患上心血管疾病[34]。我们的研究也表明载脂蛋白与高TG水平、低HDL水平和HTN有关。APOL2中的Rs132759与HTN和低HDL水平均相关。既往研究表明,APOL2可能与急性炎症反应和脂质代谢过程有关[3536]。据我们所知,我们的研究首次确定了APOL2与HTN相关。

BMS1P20上有5个长链非编码RNA (lnc RNA)。既往研究表明,BMS1P20与癌症患者尤其是肺腺癌患者的总体生存呈正相关[37]。还有一种假说认为lncrna通过lncRNA-miRNA-mRNA - ceRNA网络调控我们的细胞[38]。有一些lnc-RNA被报道与代谢相关,如116HG、H19、HOTAIR和MIAT [394041]。我们发现BMS1P20中的rs403517和rs405570与DM相关,我们认为我们的研究首次报道了BMS1P20中的lnc-RNA与代谢综合征相关。

MYO18B基因表达在人心肌和骨骼肌中表达的肌球蛋白重链[42]。一些研究表明,MYO18B突变与动物模型或人类的肌病或心肌病有关[4344]。一项动物研究也表明MYO18B基因表达受昼夜节律调节[45]。在我们的研究中,我们发现MYO18B也与代谢综合征有关,尤其是与低HDL水平相关的rs6004865。虽然我们在MYO18B中发现的SNPs都是内含子或基因间的,但我们仍需要更多的研究来发现MYO18B与代谢综合征的关系。

有许多研究探索RORA基因及其与昼夜节律的关系,与许多精神疾病有关,包括重度抑郁症、双相情感障碍或睡眠障碍[464748]。RORA基因突变还会影响酒精、茶、烟草或咖啡因等物质的使用[47]。这是基于一个广为接受的知识背景,即吸烟和饮酒。

食用会增加患代谢综合征的风险。一项动物系统研究的结果表明,抑制RORA基因活性可以改善代谢功能,减少炎症[49]。

许多研究发现SMARCB1是一种肿瘤抑制基因,与不同类型的癌症有关[50]。最近的研究表明,生物钟振荡是在细胞分化过程中形成的,一些癌细胞缺乏昼夜节律基因,这使得胚胎干细胞和癌细胞类型具有相似性[51]。我们的研究发现,SMARCB1基因的多个snp (rs5751740、rs5751741、rs5760038、rs5760046、rs5760057、rs5996620)都与高TG水平和高血压有关。然而,确切的机制尚不清楚。

ZNF280B是前列腺癌和胃癌的致癌基因[52]。我们的研究首次指出ZNF280B突变与代谢综合征有关。在我们的研究中,Rs142445063和rs2051488与糖尿病相关。

之前的一项研究使用了不同的机器学习方法来预测代谢综合征。模型中包含临床信息和遗传信息[53]。在我们的研究中,在不同的模型中选择了整个数据集或选定的snp。snp选择模型的精度、AUC值和F1值均有提高。先前的研究表明,特征选择模型会有更好的性能[54]。

本研究的优势在于:首先,我们检查了多个昼夜节律基因,发现了与代谢综合征相关的多个snp。一些snp首先被发现与代谢综合征有关。在显著snp中,我们进行亚组分析,找出哪些snp对应不同的代谢综合征标准。二是基于遗传信息;我们使用了四种机器学习模型来预测代谢综合征,据我们所知,这在以前的研究中从未进行过,SNPs选择模型的AUC值可以达到0.85。

然而,我们的研究也有一些局限性。首先,样本量很小,只包括健康和有意识的台湾参与者。因此,这项研究应该在其他人群中进行重复和验证。其次,这是一项横断面研究。在这项研究中,我们很难找出因果关系。第三,我们在预测模型中只使用了昼夜节律基因snp。其他与代谢综合征相关的snp或生物标记物也可以纳入以提高准确性。

结论

我们鉴定出186个与代谢综合征相关的昼夜节律基因snp。在这些snp中,与高血压相关的等位基因有47个,与高血清TG相关的等位基因有46个,与糖尿病相关的等位基因有27个,与低血清HDL相关的等位基因有10个。一些snp首先被发现与代谢综合征有关。需要进一步的研究来证实这些snp。此外,我们应用了几个机器学习模型来预测基于昼夜节律基因数据的代谢综合征。我们发现很难产生一个高灵敏度的模型。应加入其他临床数据,以创建更高灵敏度的模型(附加文件)123.45678).

数据和材料的可用性

由于台湾生物样本库的隐私规定,本次研究中产生和分析的数据集不能公开,但在台湾生物样本库许可的情况下,通讯作者可以合理要求提供。

缩写

SNP:

单核苷酸多态性

AUC:

接收机工作特性曲线下的面积

大都会:

代谢综合征

CKD:

慢性肾脏疾病

体重指数:

身体质量指数

SBP:

收缩压

IDF:

国际糖尿病联合会

NAHSIT:

台湾营养与健康调查

材质:

台湾生物

WGS:

全基因组序列

高密度脂蛋白:

高密度脂蛋白

TG:

甘油三酸酯

参考文献

  1. 李建平,李建平,李建平,等。慢性肾脏疾病与慢性代谢综合征的关系。中华医学杂志,2012;14:152-9。

    文章中科院PubMed谷歌学者

  2. 参孙SL,加伯AJ。代谢综合征。中华内分泌杂志,2014;43(3):1 - 23。

    文章PubMed谷歌学者

  3. 孙凯,刘健,宁刚。主动吸烟与代谢综合征风险:前瞻性研究的meta分析。PLoS ONE。2012; 7: e47791。

    文章中科院PubMed公共医学中心谷歌学者

  4. Narain A,郭CS, Mamas MA。软饮料摄入与代谢综合征的风险:一项系统综述和荟萃分析。中华临床医学杂志,2017;71:23。

    文章谷歌学者

  5. Malik VS, Popkin BM, Bray GA, despracims JP, Willett WC, Hu FB。含糖饮料与代谢综合征和2型糖尿病风险的meta分析糖尿病护理。2010;33:2477-83。

    文章PubMed公共医学中心谷歌学者

  6. Burns TL, Letuchy EM, Paulos R, Witt J.中年人代谢综合征的儿童预测因子:Muscatine研究。中华儿科杂志。2009;15(5):559。

    文章谷歌学者

  7. Beltrán-Sánchez H, Harhay MO, Harhay MM, McElligott S. 1999-2010年美国成年人群代谢综合征的患病率和趋势。中华心血管病杂志,2013;32(2):693 - 693。

    文章PubMed公共医学中心谷歌学者

  8. Ranasinghe P, Mathangasinghe Y, Jayawardena R, Hills AP, Misra a .亚太地区成人代谢综合征患病率及趋势的系统回顾。中华医学会公共卫生杂志,2017;17:101。

    文章中科院PubMed公共医学中心谷歌学者

  9. 昼夜节律睡眠-觉醒障碍。连续连续明尼阿波利斯,明尼苏达州2017;23:10 . 51 - 63。

    PubMed谷歌学者

  10. 李建军,李建军,李建军,等。夜间啮齿动物生理节律起搏器的功能分析。[J]中国生物医学工程学报。2006;22(6):391 - 391。

    文章谷歌学者

  11. 崔鹏,钟涛,王铮,王涛,赵宏,刘超,陆辉。基于时间过程基因表达谱的深度学习方法识别人类昼夜节律基因。生物化学学报,2018;1864:2274 - 883。

    文章中科院谷歌学者

  12. Solovyeva IA, Dobrovolskayaa EV, Moskalev AA。昼夜节律和衰老的遗传控制。Genetika。2016;52:393 - 412。

    中科院PubMed谷歌学者

  13. Cox KH, Takahashi JS。生物钟基因和生物钟机制的转录结构。中华内分泌杂志,2019;32(3):391 - 391。

    文章中科院PubMed公共医学中心谷歌学者

  14. Guan D, Lazar MA。生物钟和新陈代谢之间的联系。中华临床医学杂志,2011;31(2):391。

    文章谷歌学者

  15. 认知障碍和痴呆:通过生物钟基因途径获得洞察力。生物分子。2021;34。

    文章中科院谷歌学者

  16. Schober A, Blay RM, SaboorMaleki S, Zahedi F, Winklmaier AE, Kakar M, Baatsch IM,朱M, Geißler C, Fusco AE, Eberlein A, Li N, Megens RTA, Banafsche R, Kumbrink J, Weber C, nazari - jahantih M。循环。2021;144:1059 - 73。

    文章中科院PubMed谷歌学者

  17. 王晓东,王晓东,王晓东,等。氧化应激对人体健康的影响。抗氧化还原信号。2013;19:192-208。

    文章中科院PubMed公共医学中心谷歌学者

  18. Cherukalady R, Kumar D, Basu P, Singaravel M.利培酮重置小鼠生物钟。中国生物医学工程学报,2017;48(4):583 - 591。

    文章中科院谷歌学者

  19. Eftekhari A, Ahmadian E, Azarmi Y, Parvizpur A, Hamishehkar H, Eghbal MA。利培酮诱导氧化应激机制及辅酶Q10和n -乙酰半胱氨酸保护作用的体外/体内研究。毒物分析方法,2016;26:520-8。

    文章中科院PubMed谷歌学者

  20. 肾素-血管紧张素-醛固酮系统的昼夜节律研究综述。中华医学杂志。2004;15(5):387 - 391。

    中科院PubMed谷歌学者

  21. 引用本文:蔡世英,陈海军,廖春芳,郭春芳,高国荣,王文华,姚文武,陈超,杨天宇。炎症性肠病患者慢性疲劳综合征风险增加的人群回顾性队列研究。中华医学杂志,2019;17:55。

    文章PubMed公共医学中心谷歌学者

  22. 杨天宇,林春林,姚万成,廖春春,蒋卫平,林坤,郭春春,蔡世义。结核分枝杆菌感染如何导致慢性疲劳综合征的风险增加和潜在的免疫效应:一项基于人群的回顾性队列研究[J]中华检验医学杂志,2010;20(3):391。

    文章PubMed公共医学中心谷歌学者

  23. Izquierdo-Palomares JM, Fernandez-Tabera JM, Plana MN, AñinoAlba A, GómezÁlvarez P, Fernandez-Esteban I, Saiz LC, Martin-Carrillo P, PinarLópez Ó。时间疗法与常规他汀类药物治疗高脂血症的比较。Cochrane Database System Rev. 2016;11:C009462。

    谷歌学者

  24. Ahmadian E, Pennefather PS, Eftekhari A, Heidari R, Eghbal MA。肾素-血管紧张素系统在肝脏疾病中的作用:潜在干预治疗要点概述。胃肠病学杂志,2016;10:1279-88。

    文章中科院PubMed谷歌学者

  25. Chaix A, Lin T, Le HD, Chang mwne, Panda S.限时喂养对缺乏生物钟小鼠肥胖和代谢综合征的影响。中华医学杂志,2019;29:303-319.e304。

    文章中科院PubMed谷歌学者

  26. 贾甘纳特A, Taylor L, Wakaf Z, Vasudevan SR, Foster RG。昼夜节律、睡眠和健康的遗传学。生物医学通报,2017;26(1):498 - 498。

    文章中科院PubMed公共医学中心谷歌学者

  27. 林娥,郭鹏华,刘玉玲,杨春春,高春春,蔡世杰。生理时钟基因与健康相关行为对台湾人群代谢综合征的影响:来自关联与交互作用分析的证据。PLoS ONE。2017; 12: e0173861。

    文章PubMed公共医学中心中科院谷歌学者

  28. 陈春华,杨建辉,蒋超武,熊春宁,吴培娥,常丽春,朱华伟,常杰,宋益伟,杨少林。以1万名台湾参与者为基础的现代台湾汉族人口结构。生物库工程,2016;25:5321-31。

    中科院谷歌学者

  29. 李华,阮杰,杜宾。绘制短DNA测序读数,并使用绘制质量分数来调用变体。BMJ。2008; 18:1851-8。

    中科院谷歌学者

  30. 饮食诱导肥胖的昼夜节律。中国生物医学工程学报,2017;39(4):591 - 591。

    文章中科院PubMed谷歌学者

  31. 张欣,赵峰,徐超,陆超,金宏,陈松,钱瑞。载脂蛋白E敲除小鼠血栓形成的昼夜节律紊乱及溶栓相关基因表达。中华临床医学杂志,2008;22(2):149 - 153。

    PubMed谷歌学者

  32. Schilperoort M, De Berg R, Bosmans LA, Os BW, doll MET, Smits NAM, Guichelaar T, Baarle D, Koemans L, berb JFP, Deboer T, Meijer JH, De Vries MR, Vreeken D, Gils JM, Willems K, Kerkhof LWM, Lutgens E, Biermasz NR, Rensen PCN, Kooijman S.昼夜节律交替破坏APOE*3-LeidenCETP小鼠的动脉粥样硬化发展。[J] .中国林业科学,2010;22(2):391 - 391。

    文章中科院PubMed谷歌学者

  33. Hyun MH, Kang JH, Kim S, Na JO, Choi CU, Kim JW, Kim EJ, Rha SW, Park CG, Lee E, Seo HS。24小时动态血压、心率和交感神经张力的昼夜变化模式与心血管疾病风险相关:聚类分析中华心血管病杂志,2020;2020:4354759。

    文章PubMed公共医学中心谷歌学者

  34. Chalfant JM, Howatt DA, Tannock LR, Daugherty A, Pendergast JS。持续光照导致的昼夜节律紊乱会加剧雄性载脂蛋白缺乏小鼠的动脉粥样硬化。科学通报2020;10:9920。

    文章中科院PubMed公共医学中心谷歌学者

  35. 癌症杂志,2005;3:21-31。

    中科院PubMed谷歌学者

  36. 饶思聪,Pavicevic Z,杜志,金建刚,范敏,焦艳,Rosebush M, Samant S,顾伟,Pfeffer LM, Nosrat CA.促炎基因在口腔鳞状细胞癌中的生物标志物及治疗靶点。生物化学学报,2010;28(5):357 - 357。

    文章中科院PubMed公共医学中心谷歌学者

  37. 隋杰,李艳华,张玉青,李云云,沈旭,姚文忠,彭辉,洪文文,尹丽莲,蒲玉萍,梁光根。长链非编码rna相关ceRNA网络的综合分析揭示了人肺腺癌中潜在的lncRNA生物标志物。中华医学杂志,2016;49(9):2023 - 36。

    文章中科院PubMed谷歌学者

  38. 郭忠,曹勇。lncRNA-miRNA-mRNA - ceRNA网络对人脂肪源性干细胞脂肪细胞分化的影响。医学杂志2019;19:4271-87。

    中科院PubMed公共医学中心谷歌学者

  39. Powell WT, Coulson RL, Crary FK, Wong SS, Ach RA, Tsang P, AliceYamada N, Yasui DH, Lasalle JM。Prader-Willi基因座lncRNA云调节昼夜基因和能量消耗。生物医学进展,2013;22:418 - 428。

    文章中科院PubMed公共医学中心谷歌学者

  40. 王辉,曹毅,舒磊,朱毅,彭强,冉磊,吴健,罗毅,左刚,罗健,周磊,石强,翁毅,黄安,何超涛,樊军。Long - noncoding RNA (lncRNA) H19通过激活肝细胞MLXIPL和mTORC1网络诱导肝脏脂肪变性。中国生物医学工程学报,2016;24(2):444 - 444。

    文章中科院PubMed谷歌学者

  41. Meydan C, Bekenstein U, Soreq H.脓毒症与代谢综合征的分子调控通路:脓毒症/代谢串扰的非编码RNA元件。中华神经科学杂志,2018;11(1):189。

    文章PubMed公共医学中心中科院谷歌学者

  42. Salamon M, Millino C, Raffaello A, Mongillo M, Sandri C, Bean C, Negrisolo E, Pallavicini A, Valle G, Zaccolo M, Schiaffino S, Lanfranchi G.人横切肌中表达的一种新的非常规肌球蛋白重链MYO18B在分化过程中进入肌核。中华生物医学杂志。2003;32(1):1 - 4。

    文章中科院PubMed谷歌学者

  43. 刘建军,刘建军,李建军,李建军,李建军,李建军。与非常规肌球蛋白MYO18B突变相关的人类肌病斑马鱼模型遗传学。2017;205:725-35。

    文章中科院PubMed谷歌学者

  44. Malfatti E, Böhm J, lac E, Beuvin M, Romero NB, Laporte J. MYO18B过早停止密码子与严重线状性肌病和心肌病相关。中华神经外科杂志,2015;2:219-27。

    文章谷歌学者

  45. Lazado CC, Nagasawa K, Babiak I, Kumaratunga HP, Fernandes JM。大西洋鳕鱼快骨骼肌肌球蛋白基因转录的昼夜节律性和光可塑性。基因工程学报,2014;18(1):21-9。

    文章PubMed谷歌学者

  46. Geoffroy PA, Etain B, Lajnef M, Zerdazi EH, brichan - petitjean C, Heilbronner U, Hou L, Degenhardt F, Rietschel M, McMahon FJ, Schulze TG, Jamain S, Marie-Claire C, Bellivier F.双相情感障碍锂离子反应的生理基因研究:PPARGC1A (PGC-1α)和RORA的关系。基因与大脑行为。2016;15:660-8。

    文章中科院PubMed谷歌学者

  47. 侯世杰,蔡世杰,郭鹏华,刘玉玲,杨国强,林娥,兰涛。台湾生物库的一项关联研究显示,RORA是台湾人口睡眠持续时间的新位点。睡眠医学。2020;73:70-5。

    文章PubMed谷歌学者

  48. 陈震,陶生,朱锐,田森,孙燕,王慧,严锐,邵健,张勇,张杰,姚震,卢强。视交叉上核与颞上回功能异常连接:RORA基因多态性与重度抑郁症情绪变化的桥接。中华精神病学杂志(英文版);2009;32(3):391 - 391。

    文章PubMed谷歌学者

  49. billion C, Sitaula S, Burris TP。无共济失调的新型RORα敲除小鼠模型的代谢特性内分泌杂志,2017;8:141。

    文章谷歌学者

  50. 王晓明,王晓明,王晓明,等。SMARCB1/INI1基因在肿瘤中的表达。中国生物医学工程学报,2017;38(5):547 - 552。

    文章中科院PubMed公共医学中心谷歌学者

  51. 土谷,吴村,Yagita K.生理时钟与癌症:从细胞分化的观点。中华医学杂志,2020;27:518 - 524。

    文章PubMed谷歌学者

  52. 翟杰,杨震,蔡鑫,姚刚,安燕,王伟,范燕,曾超,刘凯。ZNF280B促进胃癌体外和体内生长。中国生物医学工程学报,2018;

    PubMed公共医学中心谷歌学者

  53. 引用本文:李建军,李建军,李建军,李建军,崔世生。基于遗传和临床信息的机器学习模型在非肥胖健康人群代谢综合征预测中的应用。中国生物医学工程学报,2018;16(6):931。

    文章谷歌学者

  54. Gaudillo J, Rodriguez JJR, Nazareno A, Baltazar LR, Vilela J, Bulalacao R, Domingo M, Albia JJPO。基于单核苷酸多态性的哮喘预测机器学习方法。学习。2019; 14: e0225574。

    中科院谷歌学者

下载参考

致谢

我们要感谢台湾生物银行提供的初步数据,Benjamin Lai博士,Che-Wei Su博士和Chon-Fu Lio博士的初步建议,以及资助这个项目的组织。

资金

本研究由台湾麦凯纪念医院医学研究部支持,批准号为MMH-106-81, MMH-107-71, MMH-107-102, MMH-107-135, MMH-109-79, MMH-109-103,以及麦凯医学院,批准号为1082A03。APC由麦凯纪念医院医学研究部资助,共同第一作者郭建峰医生和通讯作者蔡信义医生。

作者信息

作者及单位

作者

贡献

SYT对研究进行了概念化和设计。NWH、KCC、CFK、SYT负责调查、形式分析、数据解读,初稿由作者共同撰写。SYT负责数据的监督、重大修订和验证。所有作者都阅读并批准了最终的手稿。

相应的作者

对应到Shin-Yi蔡

道德声明

伦理批准并同意参与

本研究根据赫尔辛基宣言的指导方针进行,并获得Mackay记忆医院(16MMHIS074)和台湾生物库(TWBR10903-07)的批准。

发表同意书

不适用。

相互竞争的利益

作者宣称他们没有竞争利益。

额外的信息

出版商的注意

伟德体育在线施普林格·自然对已出版的地图和机构关系中的管辖权要求保持中立。

补充信息

附加文件1:表S1。

186个显著的昼夜节律基因snp综述。

附加文件2:补充图S2

神经网络的AUC曲线

附加文件3:补充图S3

神经网络的查全率曲线

附加文件4:补充图S4

Adaboost模型的AUC曲线

附加文件5:补充图S5

Adaboost模型的准确率-召回率曲线

附加文件6:补充图S6

logistic回归的AUC曲线

附加文件7:补充图S7

logistic回归的准确率-召回率曲线

附加文件8:补充图S8

基于生物途径的昼夜节律分析(1)
参考文献
Reactome

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,该协议允许以任何媒介或格式使用、共享、改编、分发和复制,只要您适当地注明原作者和来源,提供知识共享许可协议的链接,并注明是否进行了更改。本文中的图像或其他第三方材料包含在文章的知识共享许可协议中,除非在材料的署名中另有说明。如果材料未包含在文章的知识共享许可中,并且您的预期用途不被法律法规允许或超过允许的用途,您将需要直接获得版权所有者的许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用公共领域免责声明(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非在数据的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

许,西北。,Chou, KC., Wang, YT.T.et al。基于全基因组测序研究的人工智能代谢综合征预测模型构建J翻译医学20., 190(2022)。https://doi.org/10.1186/s12967-022-03379-7

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s12967-022-03379-7

关键字

  • 昼夜节律
  • 代谢综合征
  • 全基因组测序
  • 深度学习
Baidu
map