当你去看医生或医院时,除了你的姓名、地址和保险信息外,你总是被要求提供的一条信息是紧急联系人。通常,那个人是你的血亲。现在,一个由来自纽约市三个主要学术医疗中心的研究人员组成的合作小组正在展示,包含在个人电子健康记录(EHRs)中的紧急联系信息可以用来生成家谱。这些家谱反过来可以用来研究数百种疾病的遗传性。这项研究发表在5月17日的杂志上细胞.
“这是第一次从电子病历中建立家庭谱系,”哥伦比亚大学生物医学信息学研究生、该研究的第一作者费尔南达·波鲁布里奇诺夫(Fernanda Polubriaginof)说。“这也是迄今为止使用电子病历进行的最大规模的性状遗传研究。”
三个参与的学术医疗机构是哥伦比亚大学瓦格洛斯内科和外科医学院和威尔康奈尔医学院(两者都与纽约长老会医院合作)以及西奈山的伊坎医学院。使用一种匹配人们的姓、名、地址和电话号码的算法,以及他们与紧急联系人的关系,调查人员能够识别740万个家庭联系。
一旦确定了这些关系,就会删除患者标识符,以保护隐私。包括姓名在内的患者标识符仅由算法在匹配过程中使用,而不会在机构之间共享。
然后,根据医疗记录中的测试结果和观察结果,生成的数据库用于计算500种不同疾病表型的遗传力估计。这些特征包括血液疾病、皮肤病和精神健康状况。
“这真的是令人兴奋的新研究,这只是这类研究的开始,”哥伦比亚大学瓦格洛斯内外科医学院生物医学信息学助理教授、该论文的资深作者之一尼古拉斯·塔托内蒂(Nicholas Tatonetti)说。“我们确定了400个特征的遗传性,这些特征以前从未以这种方式研究过。直到现在,我们还不知道它们是可遗传的。这项研究为更多的发现开辟了机会。”
为了验证他们方法的准确性,研究人员将他们的发现与一些已知的遗传疾病的遗传能力进行了比较,比如镰状细胞病。验证方法的另一个组成部分涉及将西奈山纳入其中。由于该中心已经拥有一个大型生物库,其中包括2.5万多名提供了家庭关系并进行了基因分型的人,因此西奈山医院的数据可以用来确认研究方法的准确性。
研究人员表示,他们的数据将有助于确定许多常见疾病的遗传水平。本文报道的一个例子是血液中高密度脂蛋白和低密度脂蛋白胆固醇的高水平是遗传的程度。先前关于高胆固醇遗传的研究使用了几十或几百人的数据集。在这篇论文中,研究人员收集了12万人的胆固醇数据。他们发现高密度脂蛋白水平升高有50%是遗传的,而低密度脂蛋白水平升高只有25%是遗传的。未来的研究可以寻找可能成为某人电子病历一部分的任何特征的遗传贡献。
Polubriaginof指出,新数据集特别有价值的一点是,它包括了来自广泛种族和民族的人。她说:“大多数关于疾病遗传性的研究都是在北欧血统的高加索人身上进行的。”“这个数据集将使我们首次能够计算出其他种族和民族是否存在差异。”
Tatonetti解释说,由于隐私规定,目前这些数据只能用于研究目的。他说:“人们很容易对临床应用感到兴奋,但我们还没有做到这一点。”“然而,在未来,经过适当的同意,你可以想象这样的信息与临床医生分享,这样他们就可以提醒病人潜在的健康风险和他们可能需要接受的额外筛查。”它可能对识别2型糖尿病和乳糜泻等疾病非常有用。”
对于这500种情况中的每一种,调查人员都发布了受隐私保护的数据集,供其他机构的研究人员使用。他们还分享了他们的计算算法,以便其他医院的科学家可以对自己的病人进行研究。
故事来源:
提供的材料细胞出版社.注:内容可能会根据风格和长度进行编辑。
期刊引用:
引用此页: