科研项目
大数据助力新型冠状病毒及疫苗研发的智能分析平台
针对新冠病毒的研究数据数据的快速生成和分享既创造了新的机遇,也带来了新的挑战。这些生成的数据以及其他免疫学、生物体结构等相关数据,尤其是冠状病毒家族中与SARS-CoV-2相似的病毒数据,都迫切需要一个专用系统以综合的方式来编辑和整理。并且这一系统将会促进进行探索性和应用驱动型的科学研究。本项目将着眼于解决这一需求,并且将使用这个平台通过生物大数据的智能分析来指导疫苗开发和药物设计。
目前已有的存储SARS-CoV-2信息的数据库并非用于处理来自免疫学研究的信息,也不能将这些信息与基因组序列和蛋白质结构数据整合在一起。此外,这些数据库中数据的格式不统一,当前没有平台可用于识别和整合这些数据库中的所有相关信息。而这恰恰是对SARS-CoV-2进行全面分析的重要先决条件。因此,可得到的特殊的SARS-CoV-2数据和一般的冠状病毒数据是异类的,需要进一步的预处理操作,以使它们可以共同用于旨在研发治疗性干预措施的多个下游分析任务。但是有效的整合这些数据需要一个完整的数据治理及平台。
设计病毒序列分析的方法,开发一个web平台集成网上的公开数据集并嵌入我们设计的分析方法。
本项目将提供一个针对新型冠状病毒的序列分析、靶点预测、有效的诊断和评估及药物设计方案开发一个生物大数据智能分析平台。这个平台包括四个方面:
(1)快速实时地整合各个国际合作项目和组织发布的同冠状病毒相关的共享数据;
(2)为研究新型冠状病毒以及合理设计候选疫苗提供分析工具;
(3)智能辅助新型冠状病毒诊断和治疗过程;
(4)及针对新冠状病毒开发抗病毒药物的研究任务提供技术支持。
五、下一步计划
相关的科研模型设计及验证已经完成,我们正在开发一个基于web的新冠病毒分析平台,用于将与COVID-19相关的各种生物数据集中在一起并进行整合,同时结合可视化,分析和解释机制。目前这个平台的主要框架已经搭建完毕。其他各个相关的模块正在逐个实现。
六、合作伙伴
香港科技大学
七、团队成员
罗智泉,Matthew R. McKay,万翔,李镇,刘李