@ 2014.01.28 , 13:56

原始数据丢失的“80/20法则”

[-]

帕累托法则,或者用更为人所熟知的名称“80/20法则”,用处多多。它的意义是:80%的结果通常由20%的原因造成。它几乎可以用于任何情景——80%的利润来自20%的客户、80%的销量由20%的员工创造、当然不乏商业之外的例子,比如80%的医疗资源提供给了20%的病人。

如果《当代生物学》(Current Biology)杂志的这一研究结果可以在其他科学领域推广的话,就意味着一个关于科研数据丢失的80/20法则的出现。这一研究的研究者考察了从1991年到2011年的516篇生态学文献,发现随着时间的推移,对越老的研究原始数据的丢失率越高。总之,文献发表20年后,原始数据丢失率为80%。

但值得注意的是,同一时期正是科学界吸收数字技术最快的时期。这可能意味着科研数据丢失的80/20法则只适用于这一时期,或包括了其前后的一段时期。

随着技术的更新、合作的推广、存储成本的下降,期刊与科学家访问数据会变得越来越容易。虽然一些研究的性质决定了它们的数据过一段时间就不再有用,保存所有原始数据也意味着关键的数据能得到保留。

本文译自 Akshat Rathi,由 Gaga 编辑发布。

支付宝打赏 [x]
您的大名: 打赏金额:
赞一个 (2)