别拿索引不当干粮啊 这些技巧你都会?

2022-01-31 02:05:16 来源:
分享:

索引菜鸟是这样索引的:想到的一堆关键字词统统往查找框进去塞,然后要么看着查找结果进去的 0 欲哭无泪,要么面对成千上万条查找历史记录瞬间懵逼。

但索引高手不仅可随心所欲扩充或增加索引范围,格外能从元数据成千上万的文献资料当中找到真正所需要的文献资料。

MIT Libraries 为读者提供索引时必要的技巧,无论是 meta 深入研究还是文献资料索引都有必要,与大家回馈之。

赫尔语义字词的妙用

赫尔语义字词一般来说指称 AND/OR/NOT 这三个字词,用来扩充或增加索引范围。主要用途包括:

当纯数学都有多个索引字词时,可以通过一次索引将碎片文档连结出去,从而想得到你真正所需要的撰文

举例:second creation (title) AND wilmut and campbell (author) AND 2000 (year)

1. AND 的用到:

意在:使所有索引字词在一次查找当中呈现出来并增加索引结果

如索引样式为 cloning AND humans AND ethics:

三个椭圆形的空集即当中间淡绿色的大多是本次索引结果,所需要注意在许多元数据当中(但不是全部)存有 潜在的 AND 机能。如Google公司就会自动地在你的索引字词当中沙上 AND。

1.OR 的用到:

通过连结 2 个或多个类似的表达模样式(同义字词)来扩充你的索引结果,使你的元数据并能索引到任何一个索引字词。例如 cloning OR genetics OR reproduction

三个椭圆形的并集即所有淡绿色的大多是本次索引结果。

1.NOT 的用到:

通过考虑到那些潜在于索引字词当中的一些表达模样式来增加索引结果,如用到 cloning NOT sheep 来考虑到关于羊的克隆研究。所需要特别注意索引次序:

(1)元数据就会依据你转换成索引字词的次序来得出索引结果,在用到赫尔语义连结字词时其所注意他们相互间的语义次序

(2)一般来说元数据就会先执行 AND 命令,如果你在一次索引当中所需要同时用到 AND 和 OR,将用 OR 连结的字词用逗号括出去。例如:

ethics AND (cloning OR reproductive techniques)

(ethic* OR moral*) AND (bioengineering OR cloning)

斜字词若无/通配若无的用到

简写字词干一般来说就会有很多结尾,例如 sun = suns, sunshine, sunny, sunlight,位于字词干末的斜字词若无可以只用字词干后的所有简写字母。

英样式英语和美样式英语还存有一些序言面语模样式完全不同但涵义不同的字词如 color, colour。此时,单字词当中间或者末尾的通配若无可以亦然 1 个或多个简写字母。

这些情况的存有就就会导致查找显现偏差。

完全不同元数据的斜字词若无/通配若无是完全不同的,你可以通过博客的 help 来追寻该元数据用到的斜尾字词/通配若无。

斜字词若无的用到

特指称的斜字词若无号包括以下四个: *, !, ?, #。转换成字词干沙斜字词若无的图案若无号,元数据将就会执行字词干沙任意结尾的索引。

例如:child* = child, childs, children, childrens, childhood;genetic* = genetic, genetics, genetically

通配若无的用到

通配若无可以亦然单字词当中的一个简写字母,当涵义不同序言面语模样式完全不同时,可以尝试这种步骤,例如:wom!n = woman, women;colo?r = color, colour

关键字词索引 PK 主旨字词索引

主旨字通信协议叙述了每一个元数据条目(读物、周刊撰文)的总括,用到这些字通信协议可以找到同一纯数学下之外条目。

追寻主旨字词

追寻合适的主旨字词有 2 种步骤:一是查看学校图序言馆的在线字词库,看前提有与你纯数学匹配的主旨字词;二是索引尝试法,步骤如下:

用到叙述你纯数学的关键字词或单字词来查找

页面结果,筛选出 2~3 条之外历史记录

查看这些撰文的主旨字词或叙字词URL,记下相应的名字词

如此一来重新用这些名字词开展查找

这样下来,你的索引结果就会比初始的关键字词索引格外沙正确地。

追寻关键字词

关键字词索引是你用到页面查找引擎的典型查找模样式,在索引框当中转换成一些最重要的单字词或者单字词来想得到结果。下图展示了二者的区别:

用到URL来正确地索引

学校图序言馆元数据的文献资料历史记录由都有特定文献资料目录文档的URL组合成,主要URL(fields)有创作者、篇名,周刊地名,摘要,出版商,出版日期/先后顺序,主旨字词/叙字词

将索引约束在特定的URL当中就会想得到格外正确地的结果, 如你索引的是 Adam Smith 写的序言而不是关于他的序言,将索引约束为」创作者」URL就会格外沙高效。你可以通过下拉条目或者菜单来考虑想索引的URL,也可以根据想达到的正确地往往将索引字词和URL用赫尔语义或者方位算若无连结在一起。

如果不考虑特定的URL索引,元数据就会开展关键字词索引,你的索引字词将在所有文献资料历史记录内索引,如果你的关键字词索引想得到了过于多结果(超过了 50),试着去增加索引范围来想得到格外有用的结果。文档满载(即索引结果过于多)比 10 条非常之外的索引结果格外糟糕。

上头的文献资料历史记录显示了位于左侧的URL名:创作者/篇名/缺少/标准号/详细文档/语言学/摘要/叙字词:

单字词索引

完全不同的元数据有完全不同的索引模样式,其当中元数据分辨单字词的模样式存有值得注意差异。一些元数据默认转换成时座落在的字词其所被视为单字词来索引,还有些元数据就会在你的索引字词当中自动沙入赫尔语义 AND,并敦促所有的字词显现在索引结果当中,但不一定无非挨着。这些索引模样式想得到的结果千差万别。以下 2 种步骤可以实现单字词索引:

1. 沙逗号或省略

许多元数据强制均须紧邻的字词作为单字词来索引,用到逗号或省略是一种最类似的单字词索引步骤,例如「genetic engineering」。但并非所有的元数据或查找引擎都用到这个步骤。亲情提示:从元数据高级索引或指称南索引当中开展单字词索引非常容易,点击遥控器就能均须你的索引字词前提作为单字词来索引,例如

2. 方位算若无

许多元数据强制索引字词相互间保留一定靠近来索引,方位限定算若无比赫尔语义算若无格外沙特异,能实现格外正确地的索引。完全不同元数据有完全不同的方位算若无,但是许多算若无比较通用,如:w# = with、n# = near。算若无#坚称若无号两道的单字词隔的靠近,可以不应或用数字只用,不应坚称两道的字词座落在(靠近为 0),沙了坚称当中间可以隔开#个单字词。

w# 可以均须单字词显现的次序依照转换成的次序,例如 genetic w engineering(将索引 genetic engineering)、Hillary w2 Clinton (将索引 Hillary Clinton, Hillary Rodham Clinton 等字词)

n#可以均须两道的字词以任何次序显现,例如 cloning n3 human(可以索引 cloning of humans,human cloning 等字词)

你可以查看元数据的 help 页面来核实该元数据用到单字词或方位限定算若无的步骤。

你意味著不告诉他的停顿若无

完全不同的元数据停顿若无完全不同,你可以查看 help 当中的条目。停顿若无是指称显现增益很频繁,但在文献资料历史记录、撰文或页面当中无最重要意义的字词,最类似的有 a、an、the、in、of、on、are、be、if、into 、which。在索引时,元数据就会或许索引样式当中的这些停顿若无,因为如果都有的话,将索引到过于多结果。但当停顿若无是主旨字词或叙字词的一大多时,许多元数据就会分辨这些停顿若无并索引它们,如 balance of payments。

在订立索引方针(索引样式)时,不应删去停顿若无,如果它们是你索引的最重要组合成大多,则所需保留,用到以下步骤可以将停顿若无作为索引样式的一大多,能避免索引时停顿若无被或许:

1. 用到省略,例如 Title keyword = out 「of」 africa 将索引以 Out of Africa 为篇名的撰文

2. 考虑与你纯数学最之外的字词汇,用赫尔语义或者方位算若无连结出去

3. 在特定的URL当中索引含有停顿若无的纯数学,如创作者/篇名/主旨字词。

注:撰文当中的纯数学,指称你索引的主旨 topic,为与主旨字词基本上,故用纯数学坚称。

对索引必学的中医主旨字词 MeSH 想学习格外多的恰巧,关注研究机构论文时间(dxypaper),我们就会邀请资深大多人将索引方针,通过 Pubmed 实例讲解给你。

Tips:中医主旨字通信协议 MeSH(Medical Subject Headings)是美国政府国立中医学校图序言馆编制的权威性主旨字通信协议。

查看信源地址

编辑: 任悠悠

分享:
365整形网 整形医院哪家好 五官整容整形 整形医院咨询 整形知识 整形医生 美容整形 整形医院排名 整形医院咨询 整形专业知识 济南整形医院 C店求购 快手买卖平台 抖音号出售 出售公众号网站 买卖小红书网站 出售快手网 出售小红书网站