当大数据遇到生物多样性,不仅是共享那么简单

来源:    发布日期:2016-12-21 14:19:50   阅读量:0

撰文 赵斌(复旦大学生命科学学院教授)

地球的生物多样性为人类提供了重要的服务,但人类活动已经改变了进化多样化与生物灭绝之间速率的平衡。物种灭绝速率达到了估计“背景”灭绝速率的一千倍,而且还可能会增加到一万倍。要降低生物多样性丧失的速率和实现环境目标,需要了解威胁生物多样性的原因是什么,这些风险发生在什么地方,威胁类型和强度如何变化,以及采用何种行动来避免发生这些变化。

随着大数据时代的来临,数据已成为新型战略资源,成为驱动创新的重要因素,数据科学作为一门新的学科已开始蓬勃发展,大规模收集的广泛数据正在被数字化和共享,正在各个角落改变人类的科研、生产和生活方式。传统的生物多样性研究也开始逐渐向数据密集型的科研方式过渡,随着技术的进步和智能监测的发展,同时伴随着越来越多的人正在加入到现代化公民科学行列,人类社会已经在集体生产生态学大数据了。例如,GBIF(全球生物多样性信息网络)收集的物种标本数据和NEON(美国国家生态系统观测站网络)的各种监测数据,已经成为保护生物学与宏观生态学研究的一个重要部分。

也许,有关“大数据”和信息革命的新闻故事会让人觉得我们已经淹没在数据海洋中,但对于有关威胁全球生物多样性的数据来说恰恰相反。2016年6月发表在《自然》周刊上的一篇文章发现,有关生物多样性威胁的数据其实并不是那么容易获得的,这使得人们很难充分理解对生物多样性的威胁,也难以确定减轻这些威胁的措施和步骤。研究发现,在国际自然保护联盟(IUCN)红色名录中有大量受威胁的海洋和陆地物种,但针对这些威胁可用于分析的数据却寥寥可数。虽然在某些情况下,存在一些对有效保护有用的数据,但总体上这些数据并不能为保护政策提供合理的建议。为了填补这些数据缺口,文章作者建议,针对各主要类别的生物多样性威胁迫切需要编撰一系列“黄金标准”数据集,而目前只有5%的全球生物多样性威胁数据集符合“黄金标准”。

这里所说的“威胁”,是指“已经造成、正在造成或可能造成生物多样性目标的破坏、退化和/或损害的近期人类活动或过程”。不同的威胁,其生物多样性重要程度是不一样的,因此需要评估对于不同的重要程度是否有足够的数据支撑。分析中使用了IUCN的濒危物种红色名录的威胁信息,这也是物种灭绝风险的全球信息库。结果发现,红色名录中海洋或陆地以及内陆水体中受威胁物种的频率与可提供的威胁数据集不成比例:生物资源的使用(包括狩猎、渔获与标记的直接和间接影响)是对物种最常见的威胁,但在威胁数据集中仅占5%。由于缺乏正式的元数据,要确定其准确属性值往往是比较困难的,满足所有五种属性标准(容易获取、空间分辨率足够、近10年的新数据、有重复、对准确性进行过评估)的数据集在绝对数量上具有不确定性,只有14个数据集(5%)满足所有这五个属性。也就是说,大量数据集通常只适用于少数类群或栖息地。

因此,生物多样性保护领域应该确定一个“黄金标准”数据集,满足表中最低的所有五个属性,并尽可能适用于更多的类群。如何解决这个问题呢?文章建议与相关数据供应商合作开发商业模式,与政府和私营部门建立新颖的长期资金机制和伙伴关系。显然有些“黄金标准”数据集的建立,并不用从头开始,因为许多数据已经存在,主要是如何建立数据关联的通道。

例如,入侵外来物种使全球生物多样性匀质化,并对本土物种构成重大威胁。如果有全面的数据,比如何种物种在什么地方以什么方式移动,就可进行早期监测并作出快速响应。目前,受威胁的岛屿生物多样性数据库与IUCN全球入侵物种数据库都是由国际机构和专家网络支持的,如果增加适当的资源,就可以满足上述五个关键数据属性。

土地利用和覆盖变化产生的生境丧失是生物多样性下降的主要原因,大数国家都有地方、区域和国家的保护自然景观的立法,而在全球范围内对生物多样性保护并没有一个标准的土地利用和覆盖变化评估工具。目前许多新兴标准化方法和中高分辨率的数据产品虽然带来了希望,但离全球尺度和标准化还有不少的距离。遥感学家们总是在尝试各种遥感算法,他们更需要一系列可相互在时间和空间上进行比较的全球地图,来打破这种格局。■