如果您想研究与表型信息相关的遗传变异,特别是在稀有遗传变异的背景下,您将需要一个大样本集。如果幸运的话,所需的样品已经放在冰箱里了。但更可能的是,你需要在其他地方获得它们。
大样本数的一个潜在来源是生物库。顾名思义,生物银行是各种生物材料的档案或存储库。“维持在生物库中的各种生物样本(包括血液,唾液,血浆和纯化的DNA)可以被描述为人类生物体的文库,” Coriell医学研究所说,它运行着一种这样的资源。
根据RUCDR Infinite Biologics的**运营官安德鲁·布鲁克斯(Andrew Brooks)所说,这是一个罗格斯大学运营的生物保存库,包括大约1200万个DNA样本和850万个细胞系,生物库有各种形状和大小,并且具有不同的通道。有些是通用档案,有些则专注于特定的医疗条件。一些公开提供样品,另一些是私人样品,还有一些样品介于两者之间 - 仅对特定临床研究的研究成员开放。
那么,物理上,生物库是什么?从根本上说,它可以像专用的实验室冷冻机一样简单,并附有严格的文件。但据汉密尔顿存储公司总裁马修汉密尔顿称,许多生物银行选择更精细的设置来确保库存样品的一致性,准确性,文档和质量。“并不是手册还没有完成,”他说,“但随着时间的推移,人们开始接受使用机器人来存储珍贵样品的更有效方法。”
例如,传统冰柜的一个重要问题是,每次打开和关闭时,样品都可以预热。此外,当冷冻柜可以自由进出时,样品可能会丢失,错位或被污染。为了解决这些问题,Hamilton Storage销售一种名为Hamilton BiOS的自动冷冻系统,用于存储10,000到1000多万个样品。不是手动添加和删除样本,而是通过计算机界面进行交互。系统根据需要插入和检索样本,不仅记录样本的位置,还记录它们的检索时间,由谁和多长时间。“机器人技术用于实施行业的**佳实践,因为需要样本完整性和审计跟踪,以便为已发表的研究提供可靠,准确的数据,”Hamilton说。
汉密尔顿补充说,他的公司正与荷兰格罗宁根的LifeLines Biobank合作开发一个存储库,**终将存储大约1300万个样本。
英G生物银行 由大约50万英G公民的生物材料组成,是公共生物库的一个例子。根据英G生物银行副行政长官蒂姆·西姆曼(Tim Peakman)的说法,被招募进银行的人并没有被选中以适应任何特定情况。**的招聘标准是年龄:所有参与者年龄在40**69岁之间。这些个体通过生活方式和心理评估以及物理测量进行了广泛的表型分析,并收集了一系列生物标本。参与者还同意随着时间的推移跟踪他们的医疗进展,从而可以建立大型患者队列并将生物标志物与生物学相关联。
“这是一个完全开放的资源,”匹克曼说。“生物银行建立了资源,研究人员的工作就是利用它。”
生物库通常**少记录有关样本的基本信息,例如性别,年龄和样本来源。但他们经常用更专业的信息补充这些数据,这可以增加银行对研究人员的价值。例如,英G生物银行获得资金,为100,000名参与者进行MRI和超声成像,Peakman说,并对所有参与者进行基因分型。
英G生物银行使用名为UKBiobankAxiom®Array的定制微量滴定板微阵列,为其500,000个人中的每一个收集了大约820,000个单核苷酸变体的数据,产生了超过4000亿个数据点的集合。然后,这些数据被传递到牛津的Wellcome人类遗传信托中心,该中心使用生物信息学算法来“估算”(或推断)每个基因组的另外7000万个碱基,Peakman说。这占整个基因组的约2%。
根据Affymetrix遗传分析基因分型业务**副总裁兼总经理Laurent Bellon的说法,该公司为世界各地的许多生物银行项目开发了定制基因分型阵列,其中包括英G生物银行,美G百万退伍军人项目 。中G(500,000人)和韩G(600,000人)的退伍军人事务和生物银行。
“我们拥有广泛的可定制功能,”Bellon说。“不同的生物银行有不同的科学目标,需要量身定制的内容,没有两个设计是相同的。”
在**近的一个例子中,研究人员使用英G生物银行的50,000名参与者的数据来搜索与吸烟和肺功能相关的遗传变异,确定了6个新的候选基因座[1]。
Bellon说,不属于生物库研究的研究人员通常也可以获得这些阵列。通过使用它们,他们可以轻松地将他们的数据集与银行的数据集进行比较,并通过构建更大规模的元分析来丰富他们的数据。
Illumina还提供专门用于生物银行应用的微阵列,产品经理John Picuri说。其中包括CoreExome-24和OmniExpress-24,以及该公司**新的产品,Multi-Ethnic Array系列。“OMIM,ClinVar和PharmGKB的超过400,000个外显标记和20,000多个手工标记”包括“针对”全世界所有人群“的变种”,以及“针对欧洲,东亚和南亚的更具针对性的阵列”人口(EUR / EAS / SAS)和西班牙裔和非洲裔美G人(AMR / AFR)。“
Picuri说,这种阵列具有广泛的应用,包括分层临床试验人群和疾病特异性研究。对于具有特定研究目标的生物库(例如,特定疾病或疾病群),“进行遗传分析可以更好地了解疾病或表型的潜在遗传基础。”
不幸的是,布鲁克斯说,获取生物样本的样本和数据并不普遍。他说,在某些情况下,样本或多或少一般可以象征性收费。在其他情况下,研究人员必须向资助机构或项目的研究协调员申请。但无论如何,这种努力可能是值得的:对于可以访问的研究人员来说,结果是他们可能无法利用的大量数据。
[1] Wain,WL等人,“对吸烟行为,肺功能和慢性阻塞性肺病遗传学的新见解(英GBiLEVE):英G生物银行的遗传关联研究”,Lancet Respir Med,3:769 -81,2015。[PMID:26423011 ]