如何用好生物多样性大数据?

发表时间:2019-05-09 来源:《中国生态文明》杂志 作者:张文娟

海量的生物多样性数据是国家的重要战略资源。我国是生物多样性信息学发展比较好的国家,但信息资源整合度低,深度挖掘不够,有效利用程度不高。如何高效有效利用?社会各界广泛关注。

我国的生物多样性数据有多少?

我国与生物多样性有关的数据主要是《中国生物物种名录》《中国生物多样性红色名录》,以及国家动植物种质资源共享平台、国家标本资源共享平台等。在国家标本资源共享平台上,包含植物、动物、岩矿化石和极地资源在内的标本照片、名录、文献等数字化标本总量已超过1200多万份。

我国于20世纪80年代,先后启动编写植物和动物红皮书。2004年起出版的《中国物种红色名录》,为我国当时濒危物种的研究、教育和相关保护政策的制定提供了最新、最可靠的依据。

从2007年开始,中科院生物多样性委员会组织院内外分类学专家编研《中国生物物种名录》,并从2008年起以年度名录的形式每年更新和向社会公开发布,为全球使用者提供实时在线的中国动物、植物和微生物等生物类群的分类和分布信息,中国也成为世界上唯一一个连续多年发布年度生物物种名录的国家。

同时,为全面掌握我国生物多样性受威胁状况,提高生物多样性保护的科学性和有效性,原环境保护部于2008年联合中国科学院启动了《中国物种红色名录》升级版——《中国生物多样性红色名录》的编制。这一升级版已先后发布高等植物卷、脊椎动物卷和真菌卷。

有关生物多样性的这些研究成果为相关部门和地方政府制定物种保护相关政策和规划提供了依据,对我国生物多样性保护与管理产生了深远影响。比如,物种名录查明了我国已知脊椎动物、高等植物和真菌的种的本底状况、受威胁程度及分布差异,确定了各个大类群的濒危状况和保护等级,分析了濒危物种灭绝的原因。据此,就可有针对性地制定和完善自然保护区规划,新建或调整自然保护区的面积或功能区,并为迁地保护提供决策参考。

尽管已积累的数据十分丰富,但生态学家依然对缺乏高质量数据感到苦恼。研究指出,当前全世界在生物多样性方面都存在着知识欠缺,主要包括七个方面:一是新物种的发现,二是已知物种的地理分布,三是种群数量与时空动态,四是物种进化史,五是物种功能性状,六是物种与环境之间的关系,七是物种之间的相互作用。这些空缺导致当前研究只能限制在一些特定的区域,特定的生物有机体,特定的环境条件等,也极大地限制了研究的普适性和为决策提供参考的可能性。

全球大数据研究进展如何?

目前,全球已收集了数十亿个标本及其相关数据,其中大部分可以在网上找到。远程传感器和无人机等新技术使科学家能够监测植物和动物,并实时传输数据。公众通过记录和报告他们通过数字工具(如iNaturalist)的观察结果来贡献生物数据。全球和区域水平的生物多样性数据库不断建立和完善,例如,全球生物多样性信息网络(GBIF)等全球大型数据库包括10亿多条物种分布信息,澳大利亚生物多样性信息系统和美国标本数字化平台,也可以提供数千万条物种分布信息。这些数据资源为科学家和自然资源保护者提供了关于地球上生命的过去、现在和未来的丰富信息。

利用大数据为生物多样性保护做支持的研究越来越多,内容涉及到土地利用和覆盖变化、气候变化、城市化等对生物多样性的影响,物种进化历史,物种灭绝风险评估与预测,生物多样性与生态系统的功能关系等。这些研究展示了大数据在生物多样性研究中的巨大潜力,为弥补生物多样性知识欠缺,驱动更具创新的科学发现提供了更多可能。

比如,基于数据分析全球无路地区的生态价值。德国埃伯斯瓦尔德可持续发展应用技术大学的Pierre Ibisch带领团队,利用维客世界地图上超过3600万公里道路的数据,绘制了除格陵兰岛和南极洲以外所有无路地区的地图。所谓无路,即距离公路1公里以外的地区。结果显示,全球共有1.32亿平方公里的土地,约1.05亿没有道路覆盖。其中,四分之一基本是荒芜之地,三分之一是牧场,也有一些生物种类繁多的地方,如亚马逊和北美的北方森林。研究者发现,目前只有9.3%的地方得到了国际保护力量的保护。他们认为,随着关于道路负面影响的科学证据越来越多,应该优先保护地图上最具生态价值的无路地区。这篇文章2016年12月15日发表在《自然》杂志上。

再比如,基于大数据分析森林生产力与物种多样性之间的关系。美国西弗吉尼亚大学的梁晶晶教授等,收集了来自44个国家及地区、横跨13个不同生态区域的77万多个森林样地数据。研究者以树的种类丰富度、林分断面积、初级生产力、气候、土壤状态、降水等为变量,建立了一个幂函数模型来反映生物多样性与生态系统生产力之间的关系。结果显示,如果树木物种减少10%,那么森林的生产力会下降2%~3%;而如果树木只剩下一种,即使树木总数不变,森林的生产力也会下降26%~66%。结论是,物种多样性的持续缺失会加剧森林的生产力衰退,保护物种多样性作为一种防微杜渐的预防手段,具备极高的经济价值,生物多样性在维持森林生产力方面的经济价值相当于每年1660亿~4900亿美元。这篇文章发表在2016年10月的《科学》杂志上。

深度挖掘和利用从何处破题?

作为科学研究的新范式,大数据促使生物多样性研究不再仅仅满足于数据的采集、处理、保存和共享,必须迈上一个新的维度。研究需要回答一些问题:是否能够基于各类数据的分析,驱动更具创新的发现。是否能够提供可视化、标准化的服务,为政府决策做科技支撑。是否能够提供共享程度更高的数据产品,服务于科普教育和提升公众文化水平。

用大数据的思维方式去推动变革,目前最大的障碍是,如何使属于不同组织、机构的数据库能够顺利地相互协作。不同国家、组织和机构建立的生物多样性系统中的数据,通常以完全不同的方式收集,如何将这些数据集成起来,实现无缝连接,是一个重大挑战。

以中国科学院系统为例。多年来,中科院积累了大量生物物种(包括古生物)和遗传信息资源,已经建成全球最大的古生物学与地层学专业数据库、国家标本资源共享平台、世界微生物数据中心、中国生物物种名录、中国生态系统评估和生态安全数据库、中国生态系统研究网络和中国森林生物多样性监测网络等一系列信息不断更新的大数据平台。全面整合这些信息资源,是一项重大工程。

据了解,中国科学院已经在推动中国生物多样性大数据平台建设。平台将聚焦服务国家资源的应用场景,利用分析模型和可视化技术实现对生物多样性数据资源的挖掘和利用,构建开放开源的通用接口,支撑国家公益性科学研究和产业创新,促进信息最大限度地整合、分析、评价、保护和利用,为生物多样性科学发展和科普教育、履行《生物多样性公约》、评估国家生态承载能力和构建生态安全格局提供强有力的支撑和服务。

生物多样性信息数据是国家的重要战略资源,也是国家生态安全和生态文明建设的重要保障。面对生物多样性数据的高异构性和动态性挑战,还需要顶层设计和更高层次的协同创新,促进地理、气象、遥感、环境、国民经济等跨领域的数据融合,构建我国生物多样性资源保护新格局。