国际科学联合会理事会(ICSU) 世界数据中心(WDC)

S.Ruttenberg

(国际科学联合会理事会世界数据中心专门委员会主席,1992年11月)

数据,数据,谁得到了数据?为什么我不能发现它们?若我已经发现它们,为什么不能获得?若我真的能得到它们,为什么格式会出现错误?为什么它们是打印或出版而不是存贮在计算机可读的媒体中?为什么我并不需要100盘磁带,只要获得摘录而费用却如此昂贵?为什么文件资料会出现遗漏或不完整?为什么在数据管理方面要花宝贵的科研经费?国家和世界数据中心是什么?它们能为我做什么?

对上述问题有二种响应,即“仅仅因为”和“你需要简短的或冗长的回答”。仅仅因为是一个不太令人满意的答复,但它也包含着实际情况的核心。冗长的回答会使读者弄糊涂,因此,我试图作一简短讨论,对你们有的已经了解的背景进行回顾以及涉及某些奇想,我深表歉意。数据本身解释需要富有想象力,以便在开始时就引起你的关注,使你,耐心的读者得以继续。

在此文中,我们将讨论现代数据管理的历史。“数据记录、分析与传播的历史”一文是最好的评论,该文是J.H. Westbrook在1990年第十二届国际科学与技术数据委员会(CODATA)大会上的报告,现已正式出版。我在这里的简要概括并不是百科全书式的,当涉及WDC系统时还是要用一些例证来说明。因此,对涉及到你不特别喜爱的事再次抱歉。

以下是当前ICSU WDC系统的简要情况,其中对WDC系统正在接收的新数据本身将作些讨论。从合作的愿望出发,下面简要介绍的WDC-A(美国中心)的各种组成部分,已经同意在地球观测系统(EOS)上定期发表新数据采集、产品或服务等方面的公报。

起初,在18世纪和19世纪,数据的交换来自早期地磁和地震的观测。例如,地磁变化的时均值,大部分要通过台站每年处理数据的出版物来交换,要复制原始记录没有更为便利的方式。其它种类的地球物理信息,比如,来自海洋和地质考察的信息,只有通过考察报告来告知同行,有些观测资料仅靠有事业心的研究者收集。B. Franklin和后来的M.F.Maury收集的大西洋海洋数据直接来自轮船的船长,因此,出现了第一次初步的海洋研究,从而“发现”和描述了墨西哥湾流。Maury建议在数据采集方面开展国际合作,由此,促进了1882—1883年第一次极年(FPY)。FPY的数据以研究报告和出版物的形式进行收集。

第一阶段,国际地球物理年(IGY)的倡导者在1955年布鲁塞尔召开的国际地球物理年专门委员会(CSAGI)会议上 感到象IGY如此庞大的国际性数据采集工作需要比台站出版物和考察报告更先进的数据管理,以满足现代科学研究的需求。他们认为IGY数据采集,包括监测类型和特殊的数据集,应长期正式保存在世界数据中心。以备后用。然而,一些著名的IGY倡导者却不同意,他们认为,我既然经常能从朋友那得到我所需要的数据,为什么我们还要创建如此麻烦的数据系统呢?旧思想再次抬头,然而,新思想获得最后的成功。这些CSAGI倡导者具有非凡的预见,建议管理数据的方式采用机器可读形式。在那时就是霍尔瑞斯卡(即穿孔卡),但这一告诫对现代技术来说仍是适当的。

由IGY的每一学科,逐渐形成了WDC系统,并制定了明确的数据管理计划。这些计划详述了哪些数据应以何种格式在什么时候作为档案和今后存取的形式提交给IGY的WDC存档,并进一步便于研究者使用;尽管WDC系统有些变化,但IGY数据集仍是使用者容易得到的。WDC每个学科数据交换指南成了国际计划的基本数据交换协定,并为今后项目的基本数据管理计划树立了榜样。

第二阶段,在IGY后不久,60年代逐渐形成了一些新的计划,它们利用IGY结构作为基本框架,如固体地球物理学的上地幔计划(UMP)和日地计划中的国际太阳宁静年计划(IQSY),其数据管理计划在许多方面都和IGY类似。此外,IGY后WDC系统继续由ICSU主持,仅有少许变化,大多数原先支持的国家团体同意WDC系统继续为后来的计划服务,只有少数要重新配置。为了服务于新的固体地球科学计划,建立了两个新的学科中心,即海洋地质学与地球物理学以及现代地壳运动。

然而,IGY计划本身是有局限的,它的WDC系统不可能覆盖所有令人感兴趣的领域,IGY不包括水文学和传统的地质学,从未交换过卫星数据,冰川学的数据交换仅包括已发表的文献目录。气象数据交换从未包含大气化学,在国际禁止大气核试验生效以后,IGY核辐射计划(追踪辐射性的核爆炸副产物)停止执行。

第三阶段,60年代及70年代期间,几个新进步极大地影响着WDC系统。各国气象局通过世界气象组织创建了世界天气监视网,以及范围广大的全球电信系统(GTS)和全球数据处理系统。通过这些系统,每日两次收集气象数据,并分发预报和很多气象产品。因此,研究所需的大部分气象数据是可以得到的。但也存在一些不足之处,如各国拒绝通过GTS交换所有的数据,假如这些数据的分辨力较高或者一些特定的数据更多地关系到国家利益的话。例如,某些高空和辐射数据,以及较密集的气象网络采集的数据较短缺,但基本上可从国家机构得到。不管怎么样,WDC系统也服务于新的专门计划,例如全球大气研究计划和世界气候研究计划。

成立于联合国教科文组织(UNESCO)中的政府间海洋委员会(IOC),目的是协调和发起主要为业务上使用的海洋计划。它已形成了一个广泛的数据中心系统和海洋数据交换的指南。ICSU WDC系统吸收这个指南并作为数据交换的最好建议。现在,iOC和ICSU数据系统已从整体上合并。

在IGY期间,决定增加一些中心是有益的,它可以保护数据集的安全,预防政治对获得数据的干涉,并提供更广泛的获取数据地理覆盖度。因此,几个欧洲国家,曰本和澳大利亚都构建了单学科中心,这些中心的集合体称为WDC-C。

1988年,中国科学院、地质矿产部、国家气象局、国家海洋局及国家地震局组建了WDC系统的一个系列,并成为ICSU WDC系统的一部分。

ICSU WDC系统正和ICSU天文与地球物理联合会(FAGS)紧密合作,共同实施,也有许多其它数据中心的业务与地球物理有关。1987年出版WDC指南中第一部分,论述了WDC的历史、原则和义务以及详尽的WDC系统,FAGS的各个中心和其它相关的数据中心。现有的指南可从南安普敦大学地球物理系H. Rishbeth教授 (Southampton, S095NH,UK)或 NCAR S. Ruttenburg教授(P.O Box3000, Boulder,CO 8037)处得到。指南的修改正在进行之中,因为自从1988年后发生了很多变化。

正如上述,WDC系统各中心一般都设在各国家数据中心之内,WDC资金取决于国家机构的资助重点和难以预测的因素,因此,并不是所有想得到的数据和信息服务都能提供。所提供的数据和服务将随国家资助重点的变化而变化。

然而,许多WDC系统的中心还是能够一如既往的依靠国家数据中心的资源起到比较好的数据管理作用。例如,先进的数据或信息服务包括寻找和收集那些在国际交换协定下采集的相关的数据;帮助使用者寻找WDC系统中没有的数据的服务;和数据的作者一起改善有关的文献编集;发起数据抢救活动计划,包括把表格式的和模拟的数据转换成计算机可读格式的数据;建立多个紧密相关数据集的数据库;为广泛而经济地分发数据,用磁盘,尤其是CD-ROM出版普遍受欢迎的数据集;提供机内电子目录和数据索引,与来自不太发达国家的科学家合作,为他们提供现代数据管理经验和以国家数据集进入国际范畴;为现场进行研究的有经验的科学家提供WDC掌握的数据。

WDC或国家数据中心(NDC)系统能够做很多事,第一至少要确保这些新活动得到长期而稳定的资助。其次,开发和提供新的数据服务。科学家需要什么?我们需要你们的帮助,以便及早作出计划。

这是一个多么有趣的时代。针对整个地球系统进行研究的全球计划有广泛的科学意义,而且得到了政府的关注。如果我们希望使我们的数据机构进入有秩序的状态,以便更好地服务于科学和我们的政府资助人,那么,现在正是时候了。

[孙建宏译  蒋宏耀校]