您的DNA是机器学习模型:它已经在那里

即使您从未对基因组进行测序,预测系统已经对此了解很多。基因组推断已成为一个人口规模的模型,您可能会在其中。您的DNA是一种机器学习模型:它已经首先出现在数据科学方面。

来源:走向数据科学

避免使用23andMe或Ancestry之类的DNA测试服务将帮助您保护最机密的数据。但是,实际上,这种控制逐渐减弱了。

DNA

使用当今的基因组数据和高级推理方法,人们可以在不需要输入的情况下重建您的遗传概况。这不是可能发生的事情;它正在发生。这是机器学习用于大量与家庭相关数据的典型结果。

今天,基因组系统更像是团队合作而不是独立档案。当数据,遥远的表亲和二级亲戚中有足够的遗传亲密关系时,该模型可以猜测您的特征,您的风险甚至DNA的一部分。发生的不是数据盗窃,而是数据的统计方式分组。

本文解释了使它成为可能的技术变化,将它们链接到常见的ML方法,并讨论生物学与行为一样可预测的含义。

预测金州杀手,没有发现

当警察在2018年逮捕了黄金州杀手时,他们与数据库中的任何东西都没有与他的DNA相匹配。作为替代方案,他们将犯罪现场DNA放在GedMatch上,并确定了一个亲戚,第三个表弟。之后,他们建立了一棵部分家谱,并使用遗传三角剖分和谱系推理发现了嫌疑人。

2018年的黄金州杀手

允许逮捕的不是数据的存在,而是如何存储数据。当足够的亲戚共享他们的遗传数据时,研究人员就可以重建目标的基因组的外观。本质上,这是一个图形搜索问题,其中生物网络几乎没有标签,并且搜索受重组和继承模式的限制。

基因组

这不仅是取证的重大进步。它提醒您,您的DNA现在以您可能不同意的方式连接到其他人的数据。

st (作者的图像)