MENU 服務(wù) 案例
網(wǎng)站建設(shè)-網(wǎng)站設(shè)計-北京網(wǎng)站建設(shè)-高端網(wǎng)站制作公司-尚品中國
我們通過擁抱變化創(chuàng)造
360°的品牌價值__
簡體
簡體中文 English

尚品與山東真諾智能設(shè)備有限公司簽署網(wǎng)站改版合作協(xié)議

類型:尚品動態(tài) 了解更多

計算機信息檢索的原理

來源:尚品中國| 類型:網(wǎng)站百科| 時間:2014-06-19
根據(jù)計算機檢索定義,我們知道存儲與檢索是信息檢索的兩個核心。因此,計算機信息檢索網(wǎng)站建設(shè)的原理可以這樣表述:以信息的充分交流和有效利用為目標,在對大量分散的信息進行搜集的基礎(chǔ)上,標引人員以文獻或信息描述體構(gòu)成文獻或信息庫,提煉或選取用以表達文獻、信息特征和主題內(nèi)容的標識,按一定的方式分別予以有序化組織,建成各種各樣的檢索系統(tǒng),在統(tǒng)一存儲和檢索過程的基礎(chǔ)上,將用戶表達檢索詞的標識與位索系統(tǒng)中表達文獻或信息內(nèi)容、形式特征的標識進行相符性比較,若是雙方標識一致.就將具有這些標識的文獻或信息技要求從檢索系統(tǒng)中輸出.在用戶的信息檢索過程中,檢索系統(tǒng)輸出的文獻可能是用戶需要的最終信息,也可能是用戶需要的文獻線索,用戶按此信息的標引,可進一步獲取需要的最終文獻的信息。計算機信息檢索包括信息存儲和信息檢索兩個過程。計算機信息存儲過程是指將收集到的原始文獻進行主題概念分析,根據(jù)一定的檢索語言抽取主題詞、分類號及文獻的其他特征進行標識或?qū)懗鑫墨I的內(nèi)容摘要,然后再把這些經(jīng)過“前處理.的數(shù)據(jù)按一定格式輸入計算機中存儲起來,計算機在程序指令的控制下對數(shù)據(jù)進行處理,形成機讀數(shù)據(jù)庫,存儲在存儲介質(zhì)(如磁帶、磁盤或光盤)上,完成信息的加工存儲過程。
計算機信息

計算機信息檢索過程是指用戶對檢索播求加以分析,明確檢索范圍。弄清主題概念,形成檢索標識及檢索策略,愉入到計算機中進行檢索。計算機按照用戶的要求將檢索策略轉(zhuǎn)換成一系列提問,在專用程序控制下,進行離級邏輯運算。選出符合要求的信息并輸出。計算機檢索的過程實際上是一個比較、匹配的過程,是用計算機代替人工檢索的匹配過程。計算機一方面接受檢索提問(即檢索提問表達式),另一方面從數(shù)據(jù)庫中接受文獻記錄。然后在兩者之間進行匹配運算,即計算機信息檢索把檢素提問與文獻記錄之間的相關(guān)性檢索轉(zhuǎn)變成了檢索詞與標引詞之間的相似計算。目前.一般計算機信息檢索系統(tǒng)為進行檢索詞與標引詞之間的相似性運算,所采用的方法可以分為以下幾個等級。

(1)單個整詞的比較.例如.檢索詞是psychoan目ysis,而標引詞也是psyeh咖alys畜s,兩者全等,則為命中.全等是相似性的一種特殊形式,對于一些包含數(shù)值的詞,如出版年、文摘號等也可以進行大于(>)、小于(<)的運算.

(2)詞的片斷(主要是詞根)比較.例如,檢索詞是用截斷符號(如@)表示的Pscho@,則命中所有開頭與截斷符號之前相同的詞,如Psych。姍!ysis、Psychobiology等.這就是截詞檢索.截詞有右截斷、左截斷、左右同時截斷以及中間掩符等幾種形式。對截斷符之后的允許字符數(shù).可不限制,也可限制在若千字符之間。即可分有限截斷和無限截斷兩種模式。不論叮種,其基本原理都是進行詞的片斷對比。這種對比不要求檢索詞和標引詞全等.而是部分相等或近似.因此,這個級別的比較是一種較典型的相似性運算。

(3)固定詞組的比較.例如,檢索詞是Libra卿and bformation science,而標引詞也是LibraJ,and Info,ation science.這是由多個整詞構(gòu)成的詞組.但比較仍然是全等的運算.

(4)多個整詞之間位置邏輯的比較。即可以指定兩個整詞,詞與詞之間至多相隔幾個字(即可以擂入其他的字或字毋.忽略不計).兩詞出現(xiàn)的先后次序可以指定為可以對換或不可以對換.例如.檢索Information(2w)Re州eval,可以命中Infonm舊lion stora朗andR。州cval.這種位宜邁輯的運抹可以說是帶有貝活性的詞組比較,而這種比較是允許有一定范幽的相似性運算。它稱為相鄰度檢索。

(5)由若干單獨的檢索詞或詞組構(gòu)成的定邏輯組合的比較。它的目標不是檢索各個單獨的檢索詞或詞組.而是在愈義上彼此結(jié)合、互扣限定的詞(成詞組)的完整組合。例如.“信息”和“網(wǎng)絡(luò).,它們分別是兩個單獨的詞,而“信息網(wǎng)絡(luò)”是這兩個詞邏輯組合的一種形式。“信息網(wǎng)絡(luò)”不是“信息,和“網(wǎng)絡(luò).這兩個詞的混合,而是兩種愈義的結(jié)合,是兩種概念合成了一種新的概念。
來源聲明:本文章系尚品中國編輯原創(chuàng)或采編整理,如需轉(zhuǎn)載請注明來自尚品中國。以上內(nèi)容部分(包含圖片、文字)來源于網(wǎng)絡(luò),如有侵權(quán),請及時與本站聯(lián)系(010-60259772)。
TAG標簽:

如果您的網(wǎng)站可以增加轉(zhuǎn)化次數(shù)并提高客戶滿意度,該怎么辦?

預(yù)約專業(yè)咨詢顧問溝通!

*尚品專業(yè)顧問將盡快與您聯(lián)系

免責(zé)聲明

非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請您仔細閱讀本聲明的所有條款。

1、本站部分內(nèi)容來源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動。

2、本站不承擔用戶因使用這些資源對自己和他人造成任何形式的損失或傷害。

3、本聲明未涉及的問題參見國家有關(guān)法律法規(guī),當本聲明與國家法律法規(guī)沖突時,以國家法律法規(guī)為準。

4、如果侵害了您的合法權(quán)益,請您及時與我們,我們會在第一時間刪除相關(guān)內(nèi)容!

聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com

現(xiàn)在就與專業(yè)咨詢顧問溝通!

  • 全國服務(wù)熱線

    400-700-4979

  • 北京服務(wù)熱線

    010-60259772

信息保護中請放心填寫
在線咨詢

免責(zé)聲明

非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請您仔細閱讀本聲明的所有條款。

1、本站部分內(nèi)容來源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動。

2、本站不承擔用戶因使用這些資源對自己和他人造成任何形式的損失或傷害。

3、本聲明未涉及的問題參見國家有關(guān)法律法規(guī),當本聲明與國家法律法規(guī)沖突時,以國家法律法規(guī)為準。

4、如果侵害了您的合法權(quán)益,請您及時與我們,我們會在第一時間刪除相關(guān)內(nèi)容!

聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com