亚马逊加入NIH的STRIDES计划,意在促进生物医学的创新研究
扫描二维码
随时随地手机看文章
2018年10月25日,获悉,AWS(亚马逊网络服务)将加入NIH(美国国立卫生研究院)STRIDES(发现、实验和可持续性的科学和技术研究基础设施)计划,利用AWS云端的先进技术促进生物医学的创新研究。
STRIDES计划于2018年7月推出,旨在为NIH生物医学研究人员提供商业云计算服务。最初,NIH的工作重点是帮助研究人员获得高价值数据集,并尝试用新的方法来优化技术密集型研究。 STRIDES计划是NIH共同基金数据管理新模式(NMDS)的组成部分,NMDS的另一组成部分是NIH数据共享测试计划,该计划旨在测试将高价值生物医学数据集纳入云计算系统,建立和评估使用数据的最佳方法。AWS是继Google Cloud之后加入STRIDES计划的第二家云服务提供商。
AWS是亚马逊的子公司,它以付费订阅的方式向政府、公司和个人提供按需云计算平台服务,该服务始终允许订阅用户通过网络访问虚拟计算机数据集。
NIH与AWS达成的协议将帮助NIH研究人员以及全国2500多所学术机构的研究人员获得NIH的资助以及AWS的一系列技术。STRIDES项目的负责人希望通过与AWS这类的商业云服务提供商(CSP)合作提供的数据能够达到生物医学研究界认可的可查找、可访问、可互操作和可重用(FAIR)的标准。
他们还希望AWS直接与NIH及其资助的研究人员合作,开发和测试新的方法,组建更多的数据集和相关的计算工具,供更广泛的研究群体使用和访问。CSP和NIH 数据共享测试阶段的研究人员将为三个测试用数据集建立云存储服务,同时设置准则、制度和流程。在完成一系列试点计划以及修订该计划的制度和程序后,这项服务将提供给NIH资助的研究机构。
NIH资助的三个测试用数据集是基于他们在生物医学研究界的价值、数据的多样性以及基础研究和临床研究的覆盖率而决定的。
目前,这三个数据集包括以下内容:基因型——组织表达 (GTEx)数据集,GTEx数据集探索人类基因在不同组织中的表达和调控方式,以及基因组变异在改变基因表达中的作用;基因组资源整合(AGR),AGR数据集由6个MOD(模型生物数据库)组成,MOD为模式生物的深度研究提供深层次的生物学数据;精准医学的Trans-Omics(TOPMed),TOPMed数据集收集并配对全基因组测序(WGS)。