人类基因组于2003年首次完成定序,解码第一套人类的基因蓝图,成本约为30亿美元。接下来的十多年中,定序技术大幅进步,在2017年,一个人类基因组定序成本已经降至约1,000美元[1]。未来,定序成本还会更便宜,针对大众消费者的基因定序服务将会更加普及。
当今的医疗保健体系,最主要的一个挑战是每个医院或医疗相关单位基本上是无法相互沟通的数据孤岛,其中包括基因组和其他医疗数据在内的有用资讯仍然掌握在收集这些资料的组织手中。然而,个人医疗数据所有者并没有拥有对这些数据的使用方式保留完全的所有权或控制权。
最新一篇发表于Genome Research期刊的论文,介绍当前使用区块链来解决基因体学发展过程的问题,并提供区块链技术对生命科学可能的未来影响及展望。
●基因组的大数据烦恼
定序人类基因组带来了电脑运算负载量以及后续数据的隐私和所有权的问题。基因定序需要大量的计算资源,高昂费用限制执行定序产业的普及。此外,定序分析的结果大都是集中保存在所属机构的资料库,根据该机构的规定得以有限制性的取用,或是使用标准档案传输协议来进行资料的交换与使用。这样通常会引发两个问题:第一,集中管理机构成为数据的守门人,实际上是基因资料与提供者之间不必要的中介;第二,该机构发生故障的风险,甚至会遭受恶意窃取个人的隐私资料。
理想情况下,基因资料的提供者应能够直接或通过受信任的第三方(例如具有必要许可和道德委员会批准的医生或研究单位)来控制。因此,需要具备安全且去中心化的平台,让用户可直接来管理自己的基因组数据。从广义上来说,区块链技术可以实现分散的,不可改变的,不可摧毁的公共帐本(public ledgers),有助于改善基因组数据的分析与存取问题。
●区块链技术的懒人包
区块链(blockchain)技术是像比特币这类数字货币的底层技术,它是一种分散形式资料库,其中数据(或货币)安全地存储在全世界的数万台电脑中,而不是像银行这样的集中式机构。存储在区块链中的数据可以被检视和共享,而没有操纵或信息丢失的风险。因为区块链上的各区块(block)或称作帐本资讯是采用阶流加密(Cascaded encryption)的方式,也就是前一个区块的加密结果都会叠加到目前的区块上,同时搭配时间的纪录进去每个新区块中,按照时间顺序可以串连起每个区块组成一条所谓的区块链。因此,想要篡改区块的内容,必须把整条链上面每个区块的帐本资讯都进行修改与验证,是需要控制整个网络上过半的电脑运算能力才可能成功地攻击区块链。
举个当前大家较为熟悉的脸书为例,随着脸书页面不断地更新动态,每一项动态就像是一个区块,这些资讯基本上都是完全公开透明,每分每秒累积的动态就像是专属你的个人脸书区块链,想要涂改你过去某时间的动态,将需要连带之后的动态都同步修改。区块链的技术透过详细记录过程与共识加密演算法,使区块链的运作机制提供了近乎不可涂改的特性,可以让各个领域的资讯都放在各自的区块链上。
●区块链于基因组定序的应用
这篇论文主要介绍了区块链的数个应用实例,以及相应的提案项目或潜在的使用领域。包括分散式运算(distributed computation),数据存储与分散式整合用户协议(data storage and distribution voting),个人身份和数据所有权通过区块链进行验证(identity and ownership)。
随着基因组定序的样本数大量增加,或对新版的参考基因组(reference genome)进行再分析,运算效能的问题就更加明显,对于医疗或研究机构是越来越大的计算负担。目前已经有数个公司与提案利用区块链「挖矿」,施行分散式运算来进行基因组的序列组装与注解,如Gridcoin,Curecoin和FoldingCoin等公司。
资料共享向来就是科学发展的重要基石,开放取用个人基因资料,再进行分析以撷取更多有用的资讯;但是要同时保护个人隐私,并符合政策规范是很重要且高度挑战的问题。其中,Filecoin 是分散式网络存储的一个操作实例。而Nebula Genomics,提供免费的平台让用户可通过区块链技术安全地把基因组资料“租”给制药厂商使用,甚至换取电子货币(Nebula tokens)。其他公司如Zenome, Gene-chain也采用区块链技术让用户真正拥有自己的数据。
总括来说,区块链技术期望透过全球的计算资源,以较低的成本完成定序服务,并且使用私密金钥的演算法规避法规在个人基因资料的使用问题,同时保有个人的隐私权。虽然区块链不是解决巨量基因组数据的万灵丹,可以期待的是区块链仍然还有更多应用跟开发的空间。
本文链接地址:https://www.wwsww.cn/hqfx/6051.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。