动物所研究人员连续发表生物多样性数据共享方面建议
科学数据共享越来越引起广泛地关注和讨论,一方面由于数据共享对于科学本身和“大科学(big science)”的发展至关重要,也由于它是各国政府科学决策的重要议题。在全球变化和环境恶化背景下,为更好地理解和保护地球生物资源,生物多样性数据的共享显得尤其重要。2001年,由联合国环境规划署和多国政府启动了“全球生物多样性信息机构(Global Biodiversity Information Facility,GBIF)”,旨在促进全球生物多样性数据的共享。虽然近年来有越来越多的大型数据共享计划被启动,但包括GBIF在内的众多计划存在一定的问题:一是它们“自上而下”的运作模式会忽略众多科学家们的观点和看法,从而妨碍数据共享进程;二是需要新的、有效的数据共享模式。
针对这些问题,通过对主要全球性多样性数据库的调研,中国科学院动物研究所蚜虫系统进化研究组的科研人员提出“多样性数据库和科学期刊采用联合数据保存政策”的建议,通过联合数据保存政策,将研究论文所基于的多样性数据用较为统一的数据格式整合进数据库。通过对《Journal of Biogeography》2010年所发表的104篇标明物种和分布数量的论文(全年论文的一半)的统计分析,他们发现这些论文贡献了12782个物种的367000条分布记录。这些数据说明一个期刊一年就可以贡献大量的生物多样性数据。采用联合数据保存政策对于数据库和期刊是双赢的策略,并将是一个在数据数量和质量上可持续的方法。他们的建议发表于《Trends in Ecology & Evolution》,并引起国际同行的关注和讨论(Huang & Qiao, 2011, 2012)。
实际上,作为数据的收集者、发表者和使用者,科学家们的任何意见都应该被科学决策过程充分考虑。为了更好地了解科学家对于生物多样性数据共享的态度、经验和期望,黄晓磊和乔格侠进一步联合中国科学院动物研究所、美国加州大学和加拿大蒙特利尔大学的同行,于2011年7月至9月期间,开展了第一项有关该主题的国际调查研究。调查采用网络问卷的形式,被邀请参与调查的对象包括生物多样性和保护生物学领域主要期刊的通讯作者,以及相关领域国际学会的成员。调查引起了科学家们很大的兴趣,研究团队共收到五百多份回复,还收到来自150多位科学家约十八页的评论。这些回复和评论真正反映了科学家们对于生物多样性数据共享的观点,总结和讨论该调查结果的论文最近发表在《Conservation Letters》(Huang et al., 2012)。
调查结果显示大部分科学家都认为数据共享非常重要,并愿意分享已发表研究论文的相关多样性数据,但超过60%的科学家承认不愿意共享未发表的原始数据。调查揭示了在生物多样性领域分享文化并不发达,一些技术和认识障碍包括需要将数据保存在自己手中做更多的分析、同行竞争、缺少足够的回报、不熟悉相关数据保存机构、缺少简单方便的数据提交工具、没有足够的时间和经费等。科学家最关心的,还是希望能够从数据分享中获得相应的回报和利益,比如数据所有权、共同作者身份、更多的引用等。很多被调查者在评论中指出,数据共享应该在科研评价体系中获得足够的认可,比如像论文引用一样,数据集的重新利用或引用也应该获得相应的对待。对调查结果的统计分析清晰地反映出受到单位或资助机构鼓励的科学家应该更倾向于分享数据。这个结果暗示研究结构或资助结构对于科学家的分享行为有重要的影响力,来自单位的积极措施将有助于促进数据共享。
大部分被调查者表示愿意接受期刊和数据库的联合数据保存政策,并表示愿意在论文发表后立刻或者在一小段时间内将相关生物多样性数据共享。这暗示多样性数据库和期刊采用联合数据保存政策的方法值得推进。科学家对于多样性数据库的期望包括标准数据格式、简单易用的数据提交工具、提高数据质量、数据库间的交互和协调等。
针对调查反应出来的问题,论文给出了相应的建议,比如:利用统一数据标识符(DOI)可以解决数据所有权和计算引用的问题;研究结构和资助机构应该更多地鼓励数据分享并提供详细的分享指南;数据库和期刊采用更加合理和严格的数据保存政策;数据库应更多地考虑数据提供者和使用者的夙求,提高数据库的可操作性和数据质量。
该国际性调查研究首次关注作为生物多样性数据分享者和使用者的科学家们的看法,结果对于研究结构和资助机构的科学决策,以及科学家、数据库、期刊的数据共享实践有重要的参考价值,所获得的数据集也有重要价值。为了践行数据分享,研究团队已将所获得的原始数据集和十八页评论在网络上共享。
相关文章及链接:
1. Xiaolei Huang, Bradford A. Hawkins, Fumin Lei, Gary L. Miller, Colin Favret, Ruiling Zhang, Gexia Qiao*. 2012. Willing or unwilling to share primary biodiversity data: results and implications of an international survey. Conservation Letters, doi: 10.1111/j.1755-263X.2012.00259.x (http://onlinelibrary.wiley.com/doi/10.1111/j.1755-263X.2012.00259.x/abstract)
2. Xiaolei Huang, Gexia Qiao*. 2012. Biodiversity data sharing is not just about species names: response to Santos and Branco. Trends in Ecology & Evolution, 27: 7-8. (http://www.cell.com/trends/ecology-evolution/fulltext/S0169-5347(11)00301-6)
3. Xiaolei Huang, Gexia Qiao*. 2011. Biodiversity databases should gain support from journals. Trends in Ecology & Evolution, 26: 377-378. (http://www.cell.com/trends/ecology-evolution/fulltext/S0169-5347(11)00139-X)