Z3950收获¶
Z3950是一种远程搜索和捕获协议,通常用于允许搜索和捕获元数据。尽管该协议通常用于类库编目,但也可以使用Z3950搜索重要的地理空间元数据编目(例如,参与澳大利亚空间数据目录(ASDD)的澳大利亚政府机构的元数据集合)。这个收割机允许用户指定一个Z3950查询并从一个或多个Z3950服务器检索元数据记录。
增加Z3950收割机¶
可用选项包括:
Site
Name -对Z3950收割机的简短描述。它将显示在使用此名称的收割主页面中。
Z3950服务器 -这些是将要搜索的Z3950服务器。您可以选择这些服务器中的一个或多个。
Z3950查询 -指定搜索选定Z3950服务器时要使用的Z3950查询。目前已知此字段支持前缀查询格式(也称为前缀查询表示法),该格式在以下URL中描述:http://www.indexdata.com/yaz/doc/tools.html#PQF。有关更多信息和一些简单示例,请参见下文。
Icon -分配给已获取元数据的图标。显示搜索结果时将使用该图标。
选项 -计划选项。
收获的内容
将此XSLT应用于收集的记录 -在这里选择一个XSLT,它将把捕获的记录转换为不同的格式。
验证 -如果选中,则将拒绝未验证/无法验证的记录。
Privileges
Categories
注解
这个收割机自动创建一个新的类别命名为每个Z3950服务器返回记录。服务器返回的记录被分配到以该服务器命名的类别。
关于PQF Z3950查询的更多信息¶
PQF是一种相当神秘的查询语言。它基于属性和属性集的思想。Z3950服务器中用于地理空间元数据的最常见属性集是地理属性集(它是BIB-1和GILS属性集的扩展-请参阅http://www.fgdc.gov/standards/projects/GeoProfile). 因此,所有对地理空间元数据Z3950服务器的PQF查询都应该从@attrset geo开始。
地理属性集中最有用的属性类型如下:
@属性数 |
意义 |
描述 |
---|---|---|
1 |
使用 |
要搜索的字段 |
2 |
关系 |
如何比较指定的术语 |
4 |
结构 |
这个词是什么类型的?例如日期、数字、短语 |
5 |
截断 |
如何截短例如右边 |
在地理网络中,可以为 @attr 1
映射到lucene索引字段名,如下所示:
@属性1= |
Lucene索引字段 |
ISO19139元素 |
---|---|---|
1016 |
任何 |
所有元数据元素中的所有文本 |
4 |
标题,altTitle |
gmd:identificationInfo//gmd:引文//总经理:职务/gco:字符字符串 |
62 |
摘要 |
gmd:identificationInfo//gmd:摘要/gco:字符字符串 |
1012 |
_changeDate |
不是元数据元素(由GeoNetwork维护) |
30 |
创建日期 |
gmd:MD_元数据/gmd:日期戳/gco:日期 |
31 |
公布日期 |
gmd:identificationInfo//gmd:引文//gmd:日期/gmd:CI_DateCode/@codeListValue='发布' |
2072 |
临时扩展域 |
gmd:identificationInfo//gmd:范围//gmd:temporalElement//gml:开始(位置) |
2073 |
温度延伸 |
gmd:identificationInfo//gmd:范围//gmd:temporalElement//gml:结束(位置) |
2012 |
文件ID |
gmd:MD_元数据/gmd:文件标识符/* |
12 |
标识符 |
gmd:identificationInfo//gmd:引文//gmd:标识符//gmd:代码/* |
2129200231213122 |
关键字 |
gmd:identificationInfo//gmd:关键字/* |
2060 |
北界、东界、南界、西界 |
gmd:identificationInfo//gmd:范围//gmd:地理边界框/gmd:西界经度*/gco:十进制(等) |
请注意,这不是一个完整的映射集Z3950 GEO属性集和ISO19139的geonnetwork lucene索引字段名之间的映射。查看INSTALL_DIR/web/geonwork/xml/search/z3950服务器.xsl安装目录/web/geonetwork/xml/schemas/iso19139/index-字段.xsl有关更多详细信息,请参见Z3950的地理属性集附录Ahttp://www.fgdc.gov/standards/projects/GeoProfile/annex_a.html更多细节。
关系属性的公共值 (@attr=2
):
@属性2= |
描述 |
---|---|
1 |
小于 |
2 |
小于或等于 |
3 |
等于 |
4 |
大于或等于 |
5 |
大于 |
6 |
不等于 |
7 |
重叠 |
8 |
完全封闭在 |
9 |
包围 |
10 |
完全超出 |
因此,要获取任何字段中都有“the”一词的所有元数据记录,一个简单的查询是:
@attrset geo @attr 1=1016 the
@attr 1=1016
意味着我们正在搜索元数据记录中的任何字段
对边界框进行更复杂的搜索可以表述为:
@attrset geo @attr 1=2060 @attr 4=201 @attr 2=7 "-36.8262 142.6465 -44.3848 151.2598
@attr 1=2060
意味着我们正在进行边界框搜索@attr 4=201
表示查询包含坐标字符串@attr 2=7
意味着我们正在搜索其边界框与查询末尾指定的查询框重叠的记录
笔记¶
Z3950服务器必须在中为GeoNetwork配置
INSTALL_DIR/web/geonetwork/WEB-INF/classes/JZKitConfig.xml.tem
每次收割机运行时,它都会删除以前收获的记录并创建新的记录。