“养生之道,常欲小劳,但莫大疲,及强所不能耳。”--------孙思邈
大家好,我是Toby老师,曾担任国内最大医药数据中心数据挖掘负责人。10年以上数据科学经验,和中科院,重科院,重庆中药研究所,重庆儿科医院教授有长期项目合作。现在成立了重庆未来之智信息技术咨询服务有限公司。我们公司的宗旨是用人工智能,数据科学挖掘疾病致病因子,提供疾病家庭预防和干预措施降低疾病患病率。人工智能让生活更美好!
糖尿病概述
糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变、肾脏疾病、高血压、中风等、眼部疾病、下肢截肢上百种,由此增加了过早死亡的风险.因此,糖尿病防治形势十分严峻.
截至2022年,中国糖尿病患者近1.3亿。中国糖尿病患病原因受生活方式、老龄化、城市化、家族遗传等多种因素影响。同时,糖尿病患者趋向年轻化。
糖尿病可导致心血管、肾脏、脑血管并发症的发生。因此,准确诊断出患有糖尿病个体具有非常重要的临床意义。糖尿病早期遗传风险预测将有助于预防糖尿病的发生。
根据《中国2型糖尿病防治指南(2017年版)》,糖尿病的诊断标准是具有典型糖尿病症状(烦渴多饮、多尿、多食、不明原因的体重下降)且随机静脉血浆葡萄糖≥11.1mmol/L或空腹静脉血浆葡萄糖≥7.0mmol/L或口服葡萄糖耐量试验(OGTT)负荷后2h血浆葡萄糖≥11.1mmol/L。
糖尿病并非单纯体内血糖过高,3-6年后可能诱发糖尿病并发症,包括最常见的糖尿病肾病,糖尿病肺部,糖尿病足,糖尿病视网膜病变。下图就是糖尿病视网膜病变后视觉成像。
糖尿病并发症很容易人民丧失工作能力和生命。糖尿病肾病最终结局就是肾衰竭,需要做肾移植手术。
2019年估算中国糖尿病患病率排名世界第二
中国糖尿病患者数量为1.2亿,位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人属于糖尿病后备军,未来也将加入糖尿病市场,成为药企摇钱树。
下图为中国糖尿病患病率历史数据
糖尿病给经济带来巨大负担
糖尿病也给经济带来了巨大的负担,每年诊断出的糖尿病成本约为 3270 亿美元,而未确诊的糖尿病和前驱糖尿病的总成本接近 4000 亿美元。
糖尿病可预防
虽然糖尿病无法治愈,但减肥、健康饮食、积极运动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以改变生活方式和更有效的治疗,使糖尿病风险预测模型成为公共和公共卫生官员的重要工具。
糖尿病致病因子多样化
虽然有不同类型的糖尿病,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康的社会决定因素而异。这种疾病的大部分负担也落在社会经济地位较低的人身上。
糖尿病与遗传基因关系
今天我们有个疑问,糖尿病与遗传基因关系紧密吗?两者关系有多紧密?
本实验就是通过建立人工智能机器学习模型,分析糖尿病和遗传基因是否有相关性,并且挖掘糖尿病重要致病因子。
模型价值和意义
通过我们建立的人工智能机器学习预测模型,可实现以下一些研究问题:
0.探索糖尿病和遗传基因关系
1.模型能准确预测个人是否患有糖尿病。
2.模型能挖掘哪些风险因素最能预测糖尿病风险。
3.我们能使用风险因素的一个子集来准确预测一个人是否患有糖尿病。
4.我们可以使用筛选几个重要糖尿病致病特征,然后组合创建为一个简短的问题,以准确预测某人是否可能患有糖尿病或是否有糖尿病的高风险。
糖尿病建模数据集介绍
此次临床试验数据总人数5000左右,其中糖尿病患者1936人,占比38.7%,变量9个。
性别:1表示男性,0表示女性;
BMI指数:体重除以身高的平方,单位kg/m2;
糖尿病家族史:标识糖尿病的遗传特性,记录家族里面患有糖尿病的家属,分成三种标识,分别是父母有一方患有糖尿病、叔叔或者姑姑有一方患有糖尿病、无记录;
舒张压:心脏舒张时,动脉血管弹性回缩时,产生的压力称为舒张压,单位mmHg;
口服耐糖量测试:诊断糖尿病的一种实验室检查方法。数据采用120分钟耐糖测试后的血糖值,单位mmol/L;
胰岛素释放实验:空腹时定量口服葡萄糖刺激胰岛β细胞释放胰岛素。数据采用服糖后120分钟的血浆胰岛素水平,单位pmol/L;
肱三头肌皮褶厚度:在右上臂后面肩峰与鹰嘴连线的重点处,夹取与上肢长轴平行的皮褶,纵向测量,单位mm;
target为患有糖尿病标识:数据标签,1表示患有糖尿病,0表示未患有糖尿病。
Toby老师通过建立模型,喂养模型数据,让模型像人类一样学习数据,学会区分糖尿病能力。
模型学习完毕后,Toby老师验证模型质量,如下图,模型各个指标都非常优秀。这几乎是个完美的糖尿病预测模型。
接下来,我们分析哪些变量是导致糖尿病的高位因子。如下图BMI指数是最重要的糖尿病因子,其次是肱三头肌皮褶厚度。胰岛素释放实验,口服耐糖量测试,血压也是糖尿病相关因子。性别和糖尿病家族史看起来不像糖尿病重要因子。
回到建模初衷,Toby老师想知道糖尿病和糖尿病家族史关系有多紧密。通过统计分析,多种算法分析,糖尿病和糖尿病家族史没有显著相关性。这有点颠覆我们医学上认真。潜意识上,我们认为遗传基因会提升后代糖尿病概率,但从这份数据来看,两者并没有关系。Toby老师备注一下,此结论是根据实验数据集得到的,不同数据集可能会有不同分析结果。
如下图,Toby老师通过数据统计,发现糖尿病和糖尿病家族史没有显著相关性。
假设糖尿病和糖尿病家族史没有显著相关性,我们需要注意后天生活方式,最重要是控制BMI指数。
适当锻炼,合理饮食,可以让身体保持正常BMI指数,身体更年期,延缓衰老。我国唐代医药学家孙思邈曾言:“养生之道,常欲小劳,但莫大疲,及强所不能耳,且流水不腐,户枢不蠹,以其运动故也。”孙思邈把如何运动的细节和精髓都说透了。
孙思邈的话戳中了现代人的痛点,久坐,运动量减少,肥胖,然后是糖尿病患者越来越多。让我们适当合理运动,对糖尿病说bye bye!
三头肌皮褶厚度(triceps skinfold thickness)
肩峰和尺骨鹰嘴连线的上臂中点上1cm处的皮下脂肪厚度。是人体测量的一个指标。不能准确反映总体脂肪量。
非糖尿病患者的三头肌皮褶厚度平均值是2.588,糖尿病患者的三头肌皮褶厚度平均值是14.126 。两组数据在统计学上有显著差异。因此三头肌皮褶厚度和糖尿病有紧密相关性。Toby老师通过统计发现肱三头肌皮褶厚度和糖尿病有0.3的相关性,在医药领域,这是一个重要因子。
舒张压和糖尿病关系之前文章已经描述过,这里不重复描述。此数据集里舒张压是一个中等强度的变量。
口服耐糖量测试OGTT
诊断糖尿病的一种实验室检查方法。数据采用120分钟耐糖测试后的血糖值,单位mmol/L。
Toby老师统计非糖尿病患者的口服耐糖量测试平均值:5.66,
糖尿病患者的口服耐糖量测试平均值:6.4。这两组数据有显著差异,说明口服耐糖量测试对糖尿病检测有效性。
口服葡萄糖耐量试验是一种葡萄糖负荷试验,用以了解胰岛β细胞功能和机体对血糖的调节能力,是诊断糖尿病的确诊试验,广泛应用于临床实践中。具体试验方法是指给成人口服含75g无水葡萄糖的水溶液,儿童按每公斤体重1.75g计算,总量不超过75g,然后分别于0.5、1.0、2.0小时采血 ,测其血糖变化,以观察病人耐受葡萄糖的能力,是公认的诊断糖尿病的金标准。在血糖异常增高但尚未达到糖尿病诊断标准时,可采用该试验明确是否为糖尿病。
判断标准
1.当静脉空腹血糖<6.1mmol/L,OGTT2小时血糖<7.8mmoI/L,说明人体对进食葡萄糖后的血糖调节能力正常,为正常人。
2.当静脉空腹血糖≥7.0mmol/L或OGTT2小时血糖≥11.1mmoI/L,说明人体处理进食后葡萄糖的能力明显降低,可以确诊糖尿病。
3.当静脉空腹血糖<7.0mmol/L,并且OGTT2小时血糖介7.8-11.1mmoI/L之间,说明人体对葡萄糖的调节能力轻度下降,可以诊断糖耐量减低。
4.当静脉空腹血糖介于6.1-7.0mmol/L之间,且OGTT2小时血≤7.8mmol/L,说明人体对进食葡萄糖后的血糖调节能力尚好,但对空腹血糖调节能力轻度减退,可以诊断空腹血糖受损。
下图可见正常人和糖尿病患者的口服耐糖量测试OGTT数据分布是不一样的。
口服耐糖量测试OGTT实验结果不合格,表示身体细胞不能有效处理葡萄糖。如果空腹血糖和2小时后血糖检验都不合格,基本可以确定糖尿病。
胰岛素释放实验
胰岛素释放试验(Ins)反应基础和葡萄糖介导的胰岛素释放功能。
Toby本次实验统计非糖尿病的胰岛素释放实验平均值为: 3.04,
糖尿病的胰岛素释放实验平均值为:5.85,两组数据有显著差异。说明胰岛素释放试验能够很好反应糖尿病。
胰岛素释放试验就是令病人空腹时定量口服葡萄糖(或馒头),使血糖升高刺激胰岛β细胞释放胰岛素,通过测定空腹及服糖后0.5小时.1小时、2小时、3小时的血浆胰岛素水平,来了解胰β细胞的储备功能,也有助于糖尿病的分型及指导治疗。
下图是胰岛素释放试验,正常人和各种患者的血浆胰岛素浓度分泌变化比较表。
正常人空腹血浆胰岛素浓度,测试时胰岛素浓度达峰时间和胰岛素分泌达峰浓度如上表,其余患者的反应如表中所列。
糖尿病时,无论空腹还是胰岛素释放试验分泌曲线均较常人有明显不同,一是胰岛素分泌减少,空腹胰岛素水平降低;二是胰岛素分泌迟缓,高峰后移。其中1型糖尿病与2型糖尿病,在胰岛素分泌曲线和空腹胰岛素水平上也有明显的不同,而各自具有不同的特点。
1型糖尿病患者空腹血浆胰岛素水平明显低于正常,其基值一般在5mu/L以下,服糖刺激后其胰岛素释放也不能随血糖升高而上升。常呈无高峰的低平曲线,有些病人甚至不能测得。
2型糖尿病患者空腹胰岛素水平可正常,或稍低于正常,但往往高峰出现的时间延迟,如在服糖后2小时或3小时出现,呈分泌延迟高峰后移。(而你是在30-60分钟胰岛素分泌是高峰)其中尤其是肥胖的糖尿病病人,血浆胰岛素释放曲线明显高于正常,但低于同体重的非糖尿病病人的释放曲线。
胰岛素瘤患者,肿瘤分泌不受血糖浓度调节,血浆胰岛素水平明显高于正常人,正常血糖的生理调节反应改变,胰岛素分泌过多。
欢迎商务合作
如果您们对糖尿病遗传风险检测模型项目感兴趣,欢迎各大医疗机构,科研机构,生物医药企业与UP主联系。
更多内容请点击下面视频
版权声明:文章来自公众号(python生物信息学),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。