主页> 励志故事> 周五啦,讲个小故事

周五啦,讲个小故事

励志人生网 2020-05-17 08:02 励志故事 160次

小编来和大家讲个小故事

还记得当年声势浩大,被称为20世纪人类三大自然科学研究计划之一的“人类基因组计划”吗?

对,就是那个集美、中、英、法等世界多个国家之力,预计耗时15年和耗资30亿美元,旨在测定人类基因组全部DNA序列的项目。

1.png

人类基因组计划logo

不过这个项目在进行到第八年的时候,却发生了一段小插曲,正是这个小插曲,加速了人类基因组计划的完成。

今天的故事

我们就从这个小插曲展开


时间回到1998年

当时人类基因组计划正有条不紊地进行,这时突然冒出一个叫Celera的公司,竟然宣称说,他们可以用更少的资金(仅3亿美元),并在三年内完成这一项目!

▐ What?集世界上多个国家人力物力的项目,竟然抵不过一家私人公司?

显然,Celera公司是有备而来,他们有如此底气的原因就是采用了和人类基因组计划不同的测序策略——全基因组霰弹枪测序法

简单来说,这项技术是将整个基因组直接切成许多小而重叠的片段,然后再统一将这些小片段直接进行“Sanger测序”,最后通过算法检测小片段之间的重叠部分来直接重构人类基因组,使得基因测序的速度更快。

2.png

此外,Celera公司还想申请对基因的专利保护,他们一开始宣称只寻求对200至300个基因的专利权保护,但随后又修改为寻求对“完全鉴定的重要结构”的总共100至300个靶基因进行知识产权保护。到1999年,Celera想要申请对6500个完整的或部分的人类基因进行初步专利保护。Celera公司的这一举动被认为会阻碍遗传学研究,而招致了批评。由此,人类基因组计划团队感受到了巨大压力,这使得他们不得不改进策略,进一步加速其工作进程。

最终,经过3年你追我赶,这个比赛有结果了。


2001年2月

双方握手言和,同时发布了完成度超过90%的人类基因组草图。这比原定计划提早了好几年,并且所有人类基因组数据为人类共同财富,不允许专利保护,且必须对所有研究者公开!

3.png

为庆祝人类基因组计划完成而发行的邮票

回过头来看,人类基因组计划对整个生命科学研究带来了深远影响,相关应用已大大超出了生命科学本身,推动了一系列相关产业的发展。想象一下,曾经需要全球数个国家花费数十年,耗资超过30亿美元的基因组测序,到今天只需几小时、几百元的成本

不过,虽然技术在突飞猛进,但每个人身上大约31.6亿个碱基对却是始终不变,而这就带来了一个问题——数据量太大了。

4.png

基因测序的步骤是将细胞放入基因测序仪,以此启动破译流程。但人类基因组数量庞大,如果从头至尾全部测序工作量实在太大。因此,细胞中的DNA会被分解成更易于管理的很多个小片段。从本质上来说,测序仪就是拍摄所有片段的快照,并利用计算能力对快照进行初始分析,然后将分析结果按某种文件格式进行保存,以便在流程下一阶段进行处理。

在这个过程中,不仅需要强大的计算能力以快速得出分析结果,并且每一次的快照都会产生大量数据,而一个人完整的基因组测序数据文件大小约为200GB,随着近年来基因测序产业的火热,这给基因测序公司带来了巨大的IT挑战。

具体来说,海量基因数据带来的数据存储、计算、安全等多方面挑战,已成为行业进一步发展必须解决的问题:

◆ 数据存储:从最初的人类基因组开始细分扩展,目前基因测序技术已经涉及到肿瘤、遗传病检测,扩展到植物、远古生物、细菌、病毒、微生物的基因检测。因此,数据种类和数据量都异常庞大,经常以PB为单位保存

◆ 数据计算:基因序列数目庞大,对基因进行同源性搜寻、比对、分析、遗传发育分析等需要对海量、复杂、多变的数据进行分析和挖掘。这要求海量计算资源的支持,对计算性能、内存容量、数据带宽等要求很高

◆ 数据安全:基因数据较为隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱

网站分类
标签列表