来源:先进细胞智造系统研发平台
承载单位:深圳赛动智造科技有限公司
时间:2022-06-24
面向未来的生物经济时代,才刚刚开始
伴随数据集中度的提升,基因组学领域会不会像互联网时代一样出现垄断的巨头?如何谨防这种现象的出现?
由于测序通量和效率的提升,测序成本的大规模下降,数字化的工具和理解力的提升,每年仅测序就能为我们带来海量的生物数据。但这种基于基因测序而来的数据,只是我们理解生物和世界的基本构建模块之一,还需要有更多的组学数据和多维度、多层次、高水平的临床表型数据,当然,伴随着算力、生物信息和算法的进步,将赋予人类掌握获得更多维度数据的工具和理解分析这些数据的能力。
未来有可能会有多样性数据集中的趋势,也有可能演绎出生物科技领域的巨头垄断现象,尤其是同时掌握大规模数据获取工具、超量算力设施和算法开发团队的公司更易形成生物经济时代的垄断巨头。Google公司搭建的超量算力设施支持的算法开发正在显示这种集聚的趋势,先后演绎出以AlphaGoZero为代表的围棋数据库,发展出以AlphaFold为代表的蛋白质数据库,还有目前正在优化的以人群行为轨迹结合检索关键词“骤升”的新发疫情预警数据库等。
新时代,以数据集聚和分析、利用为特征的垄断,与传统经济领域中以实物或实体积聚为特征的垄断有着本质的区别,数据形成的垄断有着显著的隐匿性、非排他性以及难以实物分割等特点,并且需要极高投入的算力设施、储存设施做支撑。因此,了解数据垄断的特点,可以从如下几个方面布局,以期尽可能避免。
第一、基于数据的非排他性和设施建设投入的巨大性,可由政府投资建设并所有,巨大投资的算力设施和储存设施作为科技公共品,开放给研究团队进行算法开发、应用衍生。其实就是我国政府的“新基建”部署。
第二、基于数据的公共性和产品的排他性,通过公共算力设施和公共资金支持产生的新数据,回传给公共储存设施。以国际基因数据库为例,其公共性、开放性和共享性,极大地加速了我们了解Covid-19背后病毒的能力,提升了我们快速诊断Covid-19的准确性,缩短了我们开发应对Covid-19疫苗和疗法的周期。
图为赛动智造交付的国际首台套全自动细胞智造系统