Z3950收获

Z3950是一种远程搜索和捕获协议,通常用于允许搜索和捕获元数据。尽管该协议通常用于类库编目,但也可以使用Z3950搜索重要的地理空间元数据编目(例如,参与澳大利亚空间数据目录(ASDD)的澳大利亚政府机构的元数据集合)。这个收割机允许用户指定一个Z3950查询并从一个或多个Z3950服务器检索元数据记录。

增加Z3950收割机

可用选项包括:

  • Site

    • Name -对Z3950收割机的简短描述。它将显示在使用此名称的收割主页面中。

    • Z3950服务器 -这些是将要搜索的Z3950服务器。您可以选择这些服务器中的一个或多个。

    • Z3950查询 -指定搜索选定Z3950服务器时要使用的Z3950查询。目前已知此字段支持前缀查询格式(也称为前缀查询表示法),该格式在以下URL中描述:http://www.indexdata.com/yaz/doc/tools.html#PQF。有关更多信息和一些简单示例,请参见下文。

    • Icon -分配给已获取元数据的图标。显示搜索结果时将使用该图标。

  • 选项 -计划选项。

  • 收获的内容

    • 将此XSLT应用于收集的记录 -在这里选择一个XSLT,它将把捕获的记录转换为不同的格式。

    • 验证 -如果选中,则将拒绝未验证/无法验证的记录。

  • Privileges

  • Categories

注解

这个收割机自动创建一个新的类别命名为每个Z3950服务器返回记录。服务器返回的记录被分配到以该服务器命名的类别。

关于PQF Z3950查询的更多信息

PQF是一种相当神秘的查询语言。它基于属性和属性集的思想。Z3950服务器中用于地理空间元数据的最常见属性集是地理属性集(它是BIB-1和GILS属性集的扩展-请参阅http://www.fgdc.gov/standards/projects/GeoProfile). 因此,所有对地理空间元数据Z3950服务器的PQF查询都应该从@attrset geo开始。

地理属性集中最有用的属性类型如下:

@属性数

意义

描述

1

使用

要搜索的字段

2

关系

如何比较指定的术语

4

结构

这个词是什么类型的?例如日期、数字、短语

5

截断

如何截短例如右边

在地理网络中,可以为 @attr 1 映射到lucene索引字段名,如下所示:

@属性1=

Lucene索引字段

ISO19139元素

1016

任何

所有元数据元素中的所有文本

4

标题,altTitle

gmd:identificationInfo//gmd:引文//总经理:职务/gco:字符字符串

62

摘要

gmd:identificationInfo//gmd:摘要/gco:字符字符串

1012

_changeDate

不是元数据元素(由GeoNetwork维护)

30

创建日期

gmd:MD_元数据/gmd:日期戳/gco:日期

31

公布日期

gmd:identificationInfo//gmd:引文//gmd:日期/gmd:CI_DateCode/@codeListValue='发布'

2072

临时扩展域

gmd:identificationInfo//gmd:范围//gmd:temporalElement//gml:开始(位置)

2073

温度延伸

gmd:identificationInfo//gmd:范围//gmd:temporalElement//gml:结束(位置)

2012

文件ID

gmd:MD_元数据/gmd:文件标识符/*

12

标识符

gmd:identificationInfo//gmd:引文//gmd:标识符//gmd:代码/*

2129200231213122

关键字

gmd:identificationInfo//gmd:关键字/*

2060

北界、东界、南界、西界

gmd:identificationInfo//gmd:范围//gmd:地理边界框/gmd:西界经度*/gco:十进制(等)

请注意,这不是一个完整的映射集Z3950 GEO属性集和ISO19139的geonnetwork lucene索引字段名之间的映射。查看INSTALL_DIR/web/geonwork/xml/search/z3950服务器.xsl安装目录/web/geonetwork/xml/schemas/iso19139/index-字段.xsl有关更多详细信息,请参见Z3950的地理属性集附录Ahttp://www.fgdc.gov/standards/projects/GeoProfile/annex_a.html更多细节。

关系属性的公共值 (@attr=2 ):

@属性2=

描述

1

小于

2

小于或等于

3

等于

4

大于或等于

5

大于

6

不等于

7

重叠

8

完全封闭在

9

包围

10

完全超出

因此,要获取任何字段中都有“the”一词的所有元数据记录,一个简单的查询是:

@attrset geo @attr 1=1016 the

  • @attr 1=1016 意味着我们正在搜索元数据记录中的任何字段

对边界框进行更复杂的搜索可以表述为:

@attrset geo @attr 1=2060 @attr 4=201 @attr 2=7 "-36.8262 142.6465 -44.3848 151.2598

  • @attr 1=2060 意味着我们正在进行边界框搜索

  • @attr 4=201 表示查询包含坐标字符串

  • @attr 2=7 意味着我们正在搜索其边界框与查询末尾指定的查询框重叠的记录

笔记

  • Z3950服务器必须在中为GeoNetwork配置 INSTALL_DIR/web/geonetwork/WEB-INF/classes/JZKitConfig.xml.tem

  • 每次收割机运行时,它都会删除以前收获的记录并创建新的记录。