- 相關推薦
淺探網絡環境下搜索引擎的使用
畢業論文摘要: 隨著網絡信息時代的到來,信息檢索處于1個互聯的網絡系統之中,用戶、信息檢索技術、信息資源構成信息檢索3個基本要素。主要通過Intemet搜索引擎來介紹信息檢索技術。
關鍵詞: 網絡 信息檢索 搜索引擎
1、前言
隨著Internet的迅速發展,網上信息正以爆炸性的速度增長,其資源內容幾乎涉及所有領域,已經成為知識、信息的集合體,是人們獲取信息的基本工具。在Internet網上進行瀏覽和檢索,就好比進入了世界上最大的圖書館,而這個圖書館里的書刊、雜志、廣告、新聞及各種形式的文獻信息全都沒有規律地排放著,沒有1個中心目錄將這些信息組織起來。正是因為Internet資源既豐富又分散且處于無序狀態,使得人們在網上查找自己所需的信息并非易事。這時為滿足人眾信息檢索的需求,搜索引擎便應運而生。搜索引擎是指使用某些自動索引軟件來發現、收集網絡上的信息,然后對收集的網頁進行標引,建立1個可供查詢的大型數據庫。
Intemet提供了多種不同的檢索工具,它們各自有各自的數據庫、語言、檢索功能和顯示方式,對用戶來說,最重要的就是熟悉這些工具的性能,掌握檢索技巧,提高檢索的命中率。
2、搜索引擎的工作原理
搜索引擎的工作原理可以簡單概括為:從互聯網上抓取網頁→建立索引數據庫→在索引數據庫中搜索排序。
從互聯網上抓取網頁利用能夠從互聯網上自動收集網頁的Spider (又名為:Robot, Crawler,Worms,Wanders)系統程序,自動訪問互聯網,并沿著任何網頁中的所有URL爬到其它網頁,重復這過程,并把爬過的所有網頁收集回來。
建立索引數據庫由分析索引系統程序對收集回來的網頁進行分析,提取相關網頁信息(包括網頁所在URL、編碼類型、頁面內容包含的關鍵詞、關鍵詞位置、生成時間、大小、與其它網頁的鏈接關系等),根據1定的相關度算法進行大量復雜計算,得到每1個網頁針對頁面內容中及超鏈中每1個關鍵詞的相關度(或重要性),然后用這些相關信息建立網頁索引數據庫。
在索引數據庫中搜索排序當用戶輸入關鍵詞搜索后,由搜索系統程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好,所以只需按照現成的相關度數值排序,相關度越高,排名越靠前。最后由頁面生成系統將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。說到這里,網絡搜索引擎的基本工作原理基本上讓大家了解了。
3、檢索技巧
(1) 科學選擇關鍵詞。由于搜索引擎智能化程度的影響,它只能在現存的數據庫中查找匹配的關鍵詞,因此,這種匹配相對比較盲目,我們在選擇關鍵詞時,要注意兩方面的問題,才有可能得到較好的搜索效果。
(2)使用雙引號進行精確查詢。如果查找的是1個詞組或多個漢字,最好的辦法就是將它們用雙引號括起來,這樣得到的結果最少、最精確。
(3)使用加號(+)、減號(1)限定查找。很多搜索引擎都支持在搜索詞前冠以加號(+)限定搜索結果中必須包含的詞匯,用減號(1)限定搜索結果不能包含的詞匯。
(4)靈活運用使用通配符。很多搜索引擎支持通配符號,如“*”代表1連串字符,“?”代表單個字符。
(5)使用邏輯詞輔助查找。比較大的搜索引擎都支持使用邏輯詞進行更復雜的搜索界定,常用的有:AND (和)、OR (或)、NOT(否)及NEAR(兩個單詞的靠近程度),恰當應用它們可以使搜索結果非常精確。另外,也可以使用括號將搜索詞分別組合,如[(新聞OR足球)AND米盧)NoT 新聞”OR足球) (6) 有針對性地選擇搜索引擎。用不同的搜索引擎進行查詢得到的結果常常有很大的差異,這是因為它們的設計目的和發展走向存在著許多的不同,比如:Download.com是針對軟件類的搜索引擎,可搜尋大量的自由軟件和共享軟件。驅動之家主要是提供查找驅動程序及硬件廠商信息。
(7)使用元詞檢索。大多數搜索引擎都支持“元詞”(metawords)功能,用戶把元詞放在關鍵詞的前面,就可以告訴搜索引擎你想要檢索的內容具有哪些明確的特征。例如,你在搜索引擎中輸入“title:清華大學”,就可以查到網頁標題中帶有清華大學的網頁。其他元詞還包括:image,用于檢索圖片;link,用于檢索鏈接到某個選定網站的頁面;URL,用于檢索地址中帶有某個關鍵詞的網頁。
(八) 細化查詢。許多搜索引擎都提供了對搜索結果進行細化與再查詢的功能,如有的搜索引擎在結果中有”查詢類似網頁”的按鈕,還有1些則可以對得到的結果進行新1輪的查詢。
(九)盡可能將搜索范圍限制在特定的領域里。比如在yahoo中文網站中,你要查找的是與電腦相關的知識,那么你沒有必要讓搜索引擎在休閑與運動、健康與醫藥、藝術與人文等其他分類中查找。你可以進入“電腦與因特網”這1類,選中“檢索此目錄下的網站”。然后再開始搜索。
4、結束語
要完成1個有效的搜索,首先要確定要檢索的主題,選擇合適的檢索工具、抽取適當的關鍵詞。為避免可能出現搜索結果的冗余性,要盡可能限制查詢范圍,正確構造檢索式。同時要使用邏輯條件限制及模糊或精確查詢的功能保證能真正檢索到我們所需的網絡信息資源。
總之,只要掌握1定的方法與技巧并經常實踐.利用搜索引擎1定能從網上獲取許多有價值的信息。由于網上信息具有動態性、多變性,今天能看到的信息也許明天便不復存在,要注意對檢索到的有價值信息的進行保存。
參考文獻
1。符紹宏,雷菊霞.因特網信息資源檢索與利用[M].北京:清華大學出版社,2000
2。陳春陽。如何利用網絡搜索引擎檢索網絡信息資源。 蘭州工業高等專科學校學報。2003
3。劉毓華。網絡信息資源檢索初探。現代情報,2003
4。陳永斌,邱葦.網絡時代搜索引擎帶來的社會問題[J].圖書情報lT作,2006;(3):l19~122
5。宋蓓玲,王新.淺析構建網絡信息檢索體系[J].現代情報.2005;(6):54~57
6。賈紅英.網絡搜索引擎探析[J].情報資料工作,2002;(3):44~46
7。張曼玲.現代信息檢索[M]。哈爾濱:哈爾濱工程大學出版社,2OOO
8。費巍,黃如花.基于用戶行為分析的搜索引擎優化策略[J].圖書情報T作,2005’(10):75-77
【淺探網絡環境下搜索引擎的使用】相關文章:
居民環境權淺探03-25
淺探ERP環境下的會計業務流程01-06
淺探素質教育下的英語教學03-21
淺探企業網絡交易的稅收問題及對策03-21
淺探多媒體網絡教學模式構建與運用03-20
對現代美術的淺探03-01
淺探室內陳設01-07
《左傳》修辭方式淺探12-20
淺探企業稅收籌劃12-06
遠程實時審計淺探03-24