本科《信息檢索與利用》教材配套PPT課件
本科《信息檢索與利用》教材配套PPT課件,信息檢索與利用,本科,信息,檢索,利用,教材,配套,PPT,課件
信息檢索與利用信息檢索與利用第2章 信息檢索的基本原理與方法2.12.22.3信息檢索語言信息檢索原理和手段信息檢索研究范圍與對象2.4信息檢索方法、程序、策略及效果評價(jià)學(xué)習(xí)目標(biāo)了解信息檢索語言。掌握信息檢索的原理和手段。了解信息檢索的研究對象和范圍。了解信息檢索程序、策略和效果評價(jià)。第2章 信息檢索的基本原理與方法2.1 信息檢索語言 檢索語言在信息檢索中的作用2.1.1 檢索語言是根據(jù)檢索的需要而發(fā)明的一種專門的人工語言,是在文獻(xiàn)檢索領(lǐng)域中用來描述文獻(xiàn)特征和表達(dá)信息檢索提問的一種專用語言。檢索語言與檢索效果之間有著密切的關(guān)系,它在檢索過程中起著極其重要的作用。信息檢索的全過程包括信息的存儲(chǔ)過程和檢索過程。當(dāng)存儲(chǔ)信息時(shí),文獻(xiàn)標(biāo)引人員首先要對各種文獻(xiàn)進(jìn)行主題分析,通過分析選出若干能代表文獻(xiàn)主題的概念,并用信息檢索語言把這些概念標(biāo)引出來,然后納入信息檢索系統(tǒng)中。當(dāng)檢索信息時(shí),信息檢索人員也首先要對檢索課題進(jìn)行分析,并且通過分析明確其檢索范圍,選出若干能代表信息需要的概念,并把這些概念轉(zhuǎn)換成信息檢索語言,然后從信息檢索系統(tǒng)中查找用該檢索語言標(biāo)引的文獻(xiàn),從而找到用戶所需的信息。信息檢索語言的組成、特點(diǎn)和功能2.1.2信息檢索語言的組成信息檢索語言的組成1)實(shí)質(zhì)上信息檢索語言是表達(dá)、概括文獻(xiàn)信息內(nèi)容的概念及相互關(guān)系的概念標(biāo)識(shí)系統(tǒng)。信息檢索語言是由詞匯和語法組成的。在這里詞匯指的是登錄在分類表、詞表中的全部標(biāo)識(shí),一個(gè)標(biāo)識(shí)(分類號(hào)、檢索詞、代碼)就是它的一個(gè)語詞,而分類表及詞表則是它的詞典;語法是指如何創(chuàng)造和運(yùn)用那些標(biāo)識(shí)(單個(gè)標(biāo)識(shí)或幾個(gè)標(biāo)識(shí)的組合)來正確表達(dá)文獻(xiàn)內(nèi)容和信息需要,以有效地實(shí)現(xiàn)信息檢索的一整套規(guī)則。2.1 信息檢索語言信息檢索語言的特點(diǎn)信息檢索語言的特點(diǎn)2)檢索語言不同于自然語言,它所表述的概念只有一種解釋,不允許一詞多義、多詞一義,而使概念的表述模棱兩可。檢索語言的這種單一性保證了表述概念的唯一性和標(biāo)引與檢索的一致性,從而使信息檢索人員全面、準(zhǔn)確、快速地檢索到含有所需信息的文獻(xiàn)。2.1 信息檢索語言信息檢索語言的功能信息檢索語言的功能3)通過檢索語言標(biāo)引文獻(xiàn)的主題概念,不僅能簡明地提示文獻(xiàn)包含的信息內(nèi)容及其外表特征,而且還能將同一主題概念的文獻(xiàn)集中在一起,使文獻(xiàn)的存儲(chǔ)集中化、系統(tǒng)化、組織化,便于進(jìn)行有規(guī)律的檢索。2.1 信息檢索語言 檢索語言的分類2.1.3 體系分類語言體系分類語言1)(1)(1)體系分類語言的定義體系分類語言的定義 體系分類語言是一種直接體現(xiàn)知識(shí)分類的等級(jí)結(jié)構(gòu)的標(biāo)識(shí)系統(tǒng)。它根據(jù)一定的觀點(diǎn),以科學(xué)分類為基礎(chǔ),以文獻(xiàn)內(nèi)容的科學(xué)性質(zhì)為對象,運(yùn)用概念劃分與概括的方法,按照知識(shí)門類的邏輯次序,從一般到具體,從簡單到復(fù)雜,進(jìn)行層層劃分,每劃分一次就產(chǎn)生許多類目,逐級(jí)劃分就產(chǎn)生許多不同級(jí)別的類目。2.1 信息檢索語言(2)(2)體系分類語言的特點(diǎn)體系分類語言的特點(diǎn) 體系分類法具有按學(xué)科或?qū)I(yè)集中地、系統(tǒng)地提示文獻(xiàn)信息內(nèi)容的功能,有利于從學(xué)科或?qū)I(yè)角度進(jìn)行全面的檢索。體系分類法按結(jié)構(gòu)逐級(jí)劃分,具有等級(jí)結(jié)構(gòu),便于擴(kuò)檢和縮檢。體系分類法用分類號(hào)作為檢索標(biāo)識(shí),不能直接表達(dá)概念;檢索時(shí),首先要將檢索的主題內(nèi)容轉(zhuǎn)換為分類號(hào),然后進(jìn)行檢索。2.1 信息檢索語言 分類法不宜經(jīng)常修訂,列舉在分類表中的類目不能隨時(shí)改變,因而分類法不能及時(shí)反映新的科學(xué)技術(shù)。分類法是按直線或序列編制類目,遇到跨學(xué)科的課題時(shí),與課題相關(guān)的文獻(xiàn)只能標(biāo)引在一門學(xué)科的類目之下,因此檢索時(shí)可能漏檢。體系分類語言是一種先組式檢索語言,因此,不能按檢索課題的需要進(jìn)行組配檢索。2.1 信息檢索語言 標(biāo)題詞語言標(biāo)題詞語言2)(1)(1)標(biāo)題詞語言的定義標(biāo)題詞語言的定義 標(biāo)題詞語言是規(guī)范化了的自然語言。它以經(jīng)過標(biāo)準(zhǔn)化處理的名詞術(shù)語作為標(biāo)識(shí),來直接表達(dá)文獻(xiàn)所論及或涉及的事物之間的相互關(guān)系(這種關(guān)系是借助于參照系統(tǒng)來間接顯示的)。2.1 信息檢索語言(2)(2)標(biāo)題詞語言的結(jié)構(gòu)及類型標(biāo)題詞語言的結(jié)構(gòu)及類型副標(biāo)題。說明語。主標(biāo)題。標(biāo)題詞語言結(jié)構(gòu)2.1 信息檢索語言混合標(biāo)題單級(jí)標(biāo)題帶說明語的單級(jí)標(biāo)題多級(jí)標(biāo)題倒置標(biāo)題帶限定詞的標(biāo)題標(biāo)題詞語言類型2.1 信息檢索語言(3)(3)標(biāo)題詞的書寫格式標(biāo)題詞的書寫格式正序式。倒序式。并列式。2.1 信息檢索語言(4)(4)標(biāo)題詞表標(biāo)題詞表 標(biāo)題詞表是把標(biāo)題詞按一定方式組織與展示的詞匯表。它由編制說明、主表、副表3部分組成。2.1 信息檢索語言(5)(5)標(biāo)題詞語言的特點(diǎn)標(biāo)題詞語言的特點(diǎn)標(biāo)題詞在詞表中按字順排列,無字級(jí)性。標(biāo)題詞語言標(biāo)引文獻(xiàn),是以事物為中心,從有關(guān)該事物出發(fā)便于進(jìn)行特性檢索。標(biāo)題詞語言只能通過參照系統(tǒng)進(jìn)行擴(kuò)檢和縮檢,因此,查全率較低。2.1 信息檢索語言關(guān)鍵詞語言關(guān)鍵詞語言3)(1)(1)關(guān)鍵詞語言的定義關(guān)鍵詞語言的定義 關(guān)鍵詞語言是為適應(yīng)主題目錄、主題索引編制自動(dòng)化的需要而產(chǎn)生的一種主題語言型檢索語言,是文獻(xiàn)量迅猛增長、信息傳播速度加快的必然產(chǎn)物。關(guān)鍵詞是指在文獻(xiàn)的標(biāo)題、摘要或正文中出現(xiàn)的,對表達(dá)文獻(xiàn)內(nèi)容具有實(shí)質(zhì)意義,能作為檢索入口的,起關(guān)鍵性描述作用的詞匯。關(guān)鍵詞語言,就是針對文獻(xiàn)中的關(guān)鍵詞選定或抽出,不做或極少做詞匯控制,按字順排列,從而提供檢索途徑的一種檢索語言。2.1 信息檢索語言(2)(2)關(guān)鍵詞語言的特點(diǎn)關(guān)鍵詞語言的特點(diǎn) 關(guān)鍵詞語言可實(shí)現(xiàn)檢索工具編制過程的計(jì)算機(jī)化,因而降低對編目人員知識(shí)和業(yè)務(wù)水平的要求,降低標(biāo)引難度,節(jié)約人力。利用計(jì)算機(jī)自動(dòng)標(biāo)引文獻(xiàn),編制關(guān)鍵詞索引非常迅速,從而大大縮短檢索刊物的報(bào)道時(shí)差。由于這些優(yōu)點(diǎn),關(guān)鍵詞語言在國外被普遍應(yīng)用。關(guān)鍵詞語言直接使用自然語言,因此用它作為信息檢索語言,質(zhì)量較差。2.1 信息檢索語言單元詞語言單元詞語言4)單元詞又稱為元詞,它是從文獻(xiàn)中抽取出來并經(jīng)過控制處理的,能表達(dá)文獻(xiàn)主題的最小、最基本的詞匯單位。它可以是一個(gè)單純詞,也可以是一個(gè)合成詞。這些詞具有一個(gè)共同的特點(diǎn):它們在概念上不能再進(jìn)一步分解,如再分解,就再也不能表達(dá)原來所代表的特定概念,從而失去檢索本意。單元詞語言就是經(jīng)過詞匯控制的,能表達(dá)文獻(xiàn)主題的元詞集合。元詞的靈活組配性使它處理文獻(xiàn)的能力很強(qiáng),但在檢索中也產(chǎn)生了相當(dāng)?shù)恼`檢,因此,這種語言現(xiàn)在很少用,它被敘詞語言所代替。2.1 信息檢索語言敘詞語言敘詞語言5)敘詞是經(jīng)過詞匯控制的,在標(biāo)引中用來顯示文獻(xiàn)主題,在檢索中用來構(gòu)成提問式的一種檢索詞匯。敘詞語言采用科技術(shù)語作為標(biāo)識(shí)文獻(xiàn)主題概念的標(biāo)目。敘詞語言可謂是博采各種信息檢索語言之長,吸取了多種信息檢索語言的原理和方法。敘詞語言是一種采用規(guī)范化的單詞或詞組,由標(biāo)引人員或讀者自行組配,來表達(dá)文獻(xiàn)(或課題)主題概念的一種后組式索引語言,或者叫做后組式的檢索語言。(1)(1)敘詞語言的定義敘詞語言的定義2.1 信息檢索語言(2)(2)敘詞的組配原則敘詞的組配原則概念相交概念相交概念并列概念并列概念限定概念限定2.1 信息檢索語言圖圖2-2 2-2 概念組配示意圖概念組配示意圖2.1 信息檢索語言(3)(3)敘詞表敘詞表 主表。主表即敘詞字順表,包括全部的敘詞和非敘詞;敘詞條目下列有與該詞有關(guān)的所有上位詞、下位詞、被代替詞和相關(guān)詞,從而可以詳細(xì)了解到這類詞的組成情況,同時(shí)也可以得到相關(guān)文獻(xiàn)的“參見”項(xiàng),以便擴(kuò)大檢索,提高查全率。輔表。輔表包括敘詞等級(jí)索引、敘詞分類索引、敘詞輪排索引。敘詞等級(jí)索引按概念的等級(jí)關(guān)系排列,即將有上下從屬關(guān)系的詞按等級(jí)集中在一起,這樣的一組詞稱為詞族,最上位的一級(jí)詞稱為族首詞,全部款目按族首詞的字順排列。2.1 信息檢索語言(4)(4)敘詞語言的特點(diǎn)敘詞語言的特點(diǎn) 敘詞語言有一套較完整的參照系統(tǒng),能顯示敘詞之間的相互關(guān)系,可供擴(kuò)檢或縮檢用。利用敘詞的詞族索引和范疇索引,還可以按學(xué)科分類進(jìn)行族性檢索。敘詞語言直接用敘詞作為檢索標(biāo)識(shí),不必轉(zhuǎn)換,具有語言的直接性。敘詞語言是后組式檢索語言 敘詞表的等級(jí)結(jié)構(gòu),便于增刪、修訂敘詞。科學(xué)技術(shù)有了新的進(jìn)展,增添相應(yīng)的敘詞后,就能標(biāo)引和檢索這些新科技的文獻(xiàn)。2.1 信息檢索語言2.2 信息檢索原理和手段 信息檢索原理與類型2.2.1信息檢索原理信息檢索原理1)人類的信息檢索行為總是從特定的信息需求開始,并在特定環(huán)境和信息檢索系統(tǒng)中完成,這里所說的環(huán)境包括產(chǎn)生需求的環(huán)境、信息檢索系統(tǒng)的運(yùn)行環(huán)境和其他制約因素。廣義的信息檢索包括信息的存儲(chǔ)和檢索兩個(gè)過程。信息的存儲(chǔ)就是將搜索到的一次信息,經(jīng)過著錄其特征(如題名、著者、主題詞、分類號(hào)等)而形成款目,并將這些款目組織起來成為二次信息的過程。信息的檢索是針對已存儲(chǔ)好的二次信息庫進(jìn)行的,是存儲(chǔ)的逆過程。存儲(chǔ)是為了檢索,而為了快速而有效的檢索,就必須存儲(chǔ)。沒有存儲(chǔ),檢索就無從談起。這是存儲(chǔ)與檢索相輔相成、相互依存的辯證關(guān)系。信息檢索類型信息檢索類型2)(1)(1)依檢索內(nèi)容劃分依檢索內(nèi)容劃分?jǐn)?shù)據(jù)信息檢索事實(shí)信息檢索文獻(xiàn)信息檢索2.2 信息檢索原理和手段(2)(2)按照信息存儲(chǔ)和檢索的方式和技術(shù)劃分按照信息存儲(chǔ)和檢索的方式和技術(shù)劃分 手工檢索。手工檢索是指人們通過手工的方式來存儲(chǔ)和檢索信息。計(jì)算機(jī)檢索。計(jì)算機(jī)檢索是指人們利用數(shù)據(jù)庫、計(jì)算機(jī)軟件技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)以及通信系統(tǒng)進(jìn)行的信息存儲(chǔ)和檢索,其檢索過程是在人機(jī)協(xié)同作用下完成的。2.2 信息檢索原理和手段 信息檢索手段2.2.2 傳統(tǒng)信息檢索傳統(tǒng)信息檢索1)優(yōu)點(diǎn)可以參閱檢索工具中的附圖。可對不同的檢索工具同時(shí)進(jìn)行對比,從而提高檢索質(zhì)量。在檢索過程中可以隨時(shí)獲取反饋信息,及時(shí)調(diào)整檢索策略。檢索條件簡單,成本低。2.2 信息檢索原理和手段缺點(diǎn)手工檢索工具提供的檢索點(diǎn)有限,很難進(jìn)行多元檢索。速度慢、效率低,檢出的文獻(xiàn)款目必須抄錄。難以找到涉及幾個(gè)概念組合的多主題的文獻(xiàn)。2.2 信息檢索原理和手段現(xiàn)代信息檢索現(xiàn)代信息檢索2)(1)單機(jī)檢索。單機(jī)檢索是計(jì)算機(jī)檢索的最初形式,隨著計(jì)算機(jī)存儲(chǔ)介質(zhì)的發(fā)展變化,也在不斷發(fā)生變化。目前主要有計(jì)算機(jī)磁盤檢索、計(jì)算機(jī)磁帶檢索和計(jì)算機(jī)光盤檢索3種形式。(2)網(wǎng)絡(luò)檢索。網(wǎng)絡(luò)檢索是近十幾年發(fā)展起來的,它目前主要有圖書館局域網(wǎng)的檢索、聯(lián)機(jī)檢索及Internet信息檢索3種形式。2.2 信息檢索原理和手段傳統(tǒng)信息檢索與現(xiàn)代信息檢索的比較傳統(tǒng)信息檢索與現(xiàn)代信息檢索的比較3)(1)檢索語言方面(2)概念的組配方面(3)檢索入口方面 (4)檢索 結(jié)果方面2.2 信息檢索原理和手段2.3 信息檢索研究范圍與對象 信息檢索的研究范圍2.3.1 信息檢索的研究范圍包括一切與信息存儲(chǔ)與檢索有關(guān)的系統(tǒng)、過程、理論和方法。一切可供存儲(chǔ)和檢索利用的信息類型,如文獻(xiàn)、數(shù)據(jù)、事實(shí)、知識(shí)、聲音、圖形等;各種信息檢索系統(tǒng)及其運(yùn)行過程,如信息采集、標(biāo)引、組織、存儲(chǔ)、處理、匹配、傳送等各種過程中使用的方法;以及在信息檢索實(shí)踐和研究的基礎(chǔ)上形成的各種理論和假設(shè),均包括在這個(gè)范圍內(nèi)。信息類型側(cè)重于文獻(xiàn),其次是數(shù)據(jù)和事實(shí)。信息檢索的研究對象2.3.2(1)(1)信息檢索理論信息檢索理論 它主要包括檢索語言與標(biāo)引理論、信息檢索的數(shù)學(xué)模型、知識(shí)表示理論、相關(guān)性理論,以及有關(guān)的哲學(xué)問題。2.3 信息檢索研究范圍與對象(2)(2)信息檢索系統(tǒng)信息檢索系統(tǒng) 它是實(shí)現(xiàn)信息檢索的物質(zhì)基礎(chǔ),是現(xiàn)實(shí)的研究對象,主要研究其結(jié)構(gòu)、功能、演變,其設(shè)計(jì)開發(fā)技術(shù)、管理維護(hù)技術(shù)和評價(jià)技術(shù),還研究它與其他信息系統(tǒng)乃至整個(gè)外部世界的關(guān)系。其中,數(shù)據(jù)庫是信息檢索系統(tǒng)的核心部分之一。數(shù)據(jù)庫的建造和維護(hù)是非常重要的信息技術(shù)。數(shù)據(jù)庫的質(zhì)量直接影響信息檢索系統(tǒng)的功能和效率。2.3 信息檢索研究范圍與對象(3)(3)計(jì)算機(jī)信息檢索計(jì)算機(jī)信息檢索 它涉及許多計(jì)算機(jī)設(shè)備、軟件技術(shù)、存儲(chǔ)技術(shù)革新、檢索技術(shù)、系統(tǒng)管理和經(jīng)營知識(shí)、市場營銷技術(shù)等,是一門綜合性很強(qiáng)的技術(shù)。2.3 信息檢索研究范圍與對象(4)(4)檢索策略與方法檢索策略與方法 它是用戶從信息檢索系統(tǒng)中獲取有關(guān)信息所必需的。好的檢索策略是檢索成功的必要前提,計(jì)算機(jī)的應(yīng)用為檢索策略和方法的發(fā)展提供了有力的支持。近30年來,涌現(xiàn)了許多新穎而有效的檢索技術(shù)和方法,如布爾檢索、位置檢索、截詞檢索、加權(quán)檢索、聚類檢索等,人們利用、研究、評價(jià)和完善現(xiàn)有的各種檢索策略和方法,研究開發(fā)新的更有效的策略和方法。2.3 信息檢索研究范圍與對象(5)(5)用戶研究與培訓(xùn)用戶研究與培訓(xùn) 用戶是信息檢索系統(tǒng)的生命,無論是系統(tǒng)的研制開發(fā)、管理維護(hù)、功能和服務(wù)的擴(kuò)展,還是系統(tǒng)評價(jià),都離不開用戶研究工作。用戶培訓(xùn)是用戶研究的繼續(xù),是與用戶建立緊密聯(lián)系和發(fā)展新用戶的一種非常有效的措施。此外,還有自動(dòng)標(biāo)引、自動(dòng)分類和自動(dòng)摘錄,以及相關(guān)設(shè)備等研究領(lǐng)域。2.3 信息檢索研究范圍與對象2.4 信息檢索方法、程序、策略及效果評價(jià) 信息檢索方法2.4.1 追溯法是指在沒有檢索工具的情況下,人們利用書、刊之后的引用或參考文獻(xiàn)查找資料的方法追溯法追溯法1)常用法這是指利用各種類型檢索工具,通過技巧查找資料的方法。常用法又可分為順查和倒查兩種。順查法:即由遠(yuǎn)而近的查找方法。如已知某研究課題的起始年代,需要了解它的全面發(fā)展情況時(shí),可從最初研究的年代開始,由遠(yuǎn)及近地進(jìn)行查找。倒查法:也稱為叫逆查法。和順查法相反,倒查法是由近及遠(yuǎn)的查找方法,這種方法常用于正在研究課題的過程中。常用法常用法2)2.4 信息檢索方法、程序、策略及效果評價(jià)循環(huán)法循環(huán)法3)循環(huán)法又稱為分段法,這是前兩種方法的結(jié)合,即首先利用檢索工具查找一部分資料以后,為了了解其前因后果,再利用這部分資料的引用文繼續(xù)追查的方法,利用這種方法能夠保證所查的資料較全面、系統(tǒng)。2.4 信息檢索方法、程序、策略及效果評價(jià) 信息檢索程序2.4.2 信息檢索之際,首先要對課題進(jìn)行充分的了解,掌握課題有關(guān)的基本知識(shí),詳細(xì)摸清課題所需資料范圍及要求,以及弄清課題有關(guān)的名詞、術(shù)語等。分析課題分析課題1)2.4 信息檢索方法、程序、策略及效果評價(jià) 根據(jù)檢索人員已掌握的資料情況,確定采用何種檢索方法。如果是新立的課題,一般采用順查法和追溯法結(jié)合查找,正在進(jìn)行中的課題一般用倒查法。選擇檢索方法選擇檢索方法2)2.4 信息檢索方法、程序、策略及效果評價(jià) 在檢索過程中,根據(jù)所掌握的有關(guān)課題的資料,確定檢索途徑。一般情況下,所研究的課題較專深、單一時(shí),常用主題途徑;課題所涉及的內(nèi)容較復(fù)雜時(shí),常用分類法。確定檢索途徑確定檢索途徑3)2.4 信息檢索方法、程序、策略及效果評價(jià) 在確定檢索途徑之后,根據(jù)檢索標(biāo)識(shí),通過有關(guān)索引進(jìn)行信息檢索,查找信息線索。查找信息線索查找信息線索4)2.4 信息檢索方法、程序、策略及效果評價(jià) 通過檢索獲得信息線索后,確認(rèn)有一定的參考價(jià)值,需要詳細(xì)查閱信息的全文時(shí),即可根據(jù)文摘指出的信息出處,向有關(guān)部門索取原始信息。索取原始信息索取原始信息5)2.4 信息檢索方法、程序、策略及效果評價(jià) 檢索策略2.4.3 首先利用國內(nèi)檢索工具或用中文編輯的報(bào)道外文的檢索工具入手檢索。這樣,檢索者從自己熟悉的文字可以很容易地掌握課題的概況,并可以從中選擇出切題的關(guān)鍵詞、主題詞,為進(jìn)一步查找外文檢索工具提供方便。先國內(nèi)后國外先國內(nèi)后國外1)2.4 信息檢索方法、程序、策略及效果評價(jià) 信息語言復(fù)雜多變,作者使用的語詞不盡相同,為了避免漏檢,檢索時(shí)盡量多選幾個(gè)同義詞、近義詞作為檢索詞。檢索時(shí)多選幾個(gè)同義詞、近義詞檢索時(shí)多選幾個(gè)同義詞、近義詞2)2.4 信息檢索方法、程序、策略及效果評價(jià) 當(dāng)要求查全率高而不計(jì)查準(zhǔn)率時(shí),可利用上、下位詞進(jìn)行檢索。巧妙地利用上、下位詞的關(guān)系巧妙地利用上、下位詞的關(guān)系3)2.4 信息檢索方法、程序、策略及效果評價(jià) 在檢索時(shí),盡量從內(nèi)容上選詞,以避免有關(guān)問題因選詞不當(dāng)被漏檢。盡量避免從字面出發(fā)選擇檢索詞盡量避免從字面出發(fā)選擇檢索詞4)2.4 信息檢索方法、程序、策略及效果評價(jià) 某些課題,在檢索中反復(fù)查找而沒有結(jié)論時(shí),應(yīng)考慮倒置詞序的可能。檢索詞序的準(zhǔn)確與否是檢索成敗的關(guān)鍵。變換檢索詞的詞序變換檢索詞的詞序5)2.4 信息檢索方法、程序、策略及效果評價(jià) 檢索工具中的參見(see also)項(xiàng),把內(nèi)容有關(guān)的主題聯(lián)為一體,以便族性檢索。例如,CA中每一大類末尾均列有與該類有關(guān)的全部相關(guān)大類和具體相關(guān)文摘。絕大多數(shù)檢索工具中的主題詞表、主題索引或文摘部分中均沒有參見項(xiàng),檢索時(shí)分別查找各有關(guān)的標(biāo)題,以獲取某一課題的全部信息。利用參見系統(tǒng),擴(kuò)大檢索范圍利用參見系統(tǒng),擴(kuò)大檢索范圍6)2.4 信息檢索方法、程序、策略及效果評價(jià) 要想把各種索引配合使用,首先熟悉各種索引的結(jié)構(gòu)、特點(diǎn)、款目內(nèi)容及其功能。例如,CA中的化學(xué)物質(zhì)索引與分子式索引、登記號(hào)索引、環(huán)系索引、雜原子索引關(guān)系十分密切。如果從化合物登記號(hào)索引入手檢索,只能獲得化合物的名稱與分子式而查不出文摘號(hào),必須轉(zhuǎn)查化學(xué)物質(zhì)索引才能獲得信息線索。又例如,對商品名稱與俗稱,必須首先查索引指南。類似的情況在檢索時(shí)常常遇到,只有熟練掌握各種檢索工具的結(jié)構(gòu)體例、編排特征、各索引款目結(jié)構(gòu)及其相互關(guān)系,檢索起來才能得心應(yīng)手,取得滿意的效果。各種索引配合使用各種索引配合使用7)2.4 信息檢索方法、程序、策略及效果評價(jià) 檢索結(jié)果的評價(jià)方法2.4.4查全率是對所需信息被檢出程度的量度。查全率查全率1)2.4 信息檢索方法、程序、策略及效果評價(jià) 查準(zhǔn)率是衡量檢索系統(tǒng)拒絕非相關(guān)信息的能力。查全率和查準(zhǔn)率均可以用公式來表示:查全率(R)=aa+c100%查準(zhǔn)率(P)=aa+b100%式中,a表示被檢出的相關(guān)信息,b表示被檢出的非相關(guān)信息,c表示未檢出的相關(guān)信息。除此之外,c/(a+c)100%為漏檢率,是查全率的補(bǔ)數(shù);b/(a+b)100%為誤檢率,是查準(zhǔn)率的補(bǔ)數(shù)。一般來說,查準(zhǔn)率與查全率之間存在反變關(guān)系。當(dāng)某一課題的查全率與查準(zhǔn)率處于某一比例關(guān)系時(shí),繼續(xù)提高查全率,查準(zhǔn)率會(huì)降低。查準(zhǔn)率查準(zhǔn)率2)2.4 信息檢索方法、程序、策略及效果評價(jià) 相關(guān)性是用戶判斷信息與信息需求之間關(guān)系的標(biāo)準(zhǔn)。信息系統(tǒng)回答的不是用戶提問本身,而是檢索式表達(dá)的信息提問。因此,檢出的是與信息提問相關(guān)的信息,但不一定是對用戶切題的信息。相關(guān)性相關(guān)性3)2.4 信息檢索方法、程序、策略及效果評價(jià)謝謝觀看!
收藏
編號(hào):65494732
類型:共享資源
大?。?span id="hfbny0d" class="font-tahoma">11.41MB
格式:ZIP
上傳時(shí)間:2022-03-24
35
積分
- 關(guān) 鍵 詞:
-
信息檢索與利用
本科
信息
檢索
利用
教材
配套
PPT
課件
- 資源描述:
-
本科《信息檢索與利用》教材配套PPT課件,信息檢索與利用,本科,信息,檢索,利用,教材,配套,PPT,課件
展開閱讀全文
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學(xué)習(xí)交流,未經(jīng)上傳用戶書面授權(quán),請勿作他用。