|
|
搜索引擎的技(jì )術發展趨勢 |
發布日期:2007-5-25 |
關鍵詞:發展趨勢 |
搜索引擎經過幾年的發展和摸索,越來越貼近人們的需求,搜索引擎的技(jì )術也得到了很(hěn)大的發展。搜索引擎的最新(xīn)技(jì )術發展包括以下幾個方面:
一、提高搜索引擎對用(yòng)戶檢索提問的理(lǐ)解
為(wèi)了提高搜索引擎對用(yòng)戶檢索提問的理(lǐ)解,就必須有(yǒu)一個好的檢索提問語言,為(wèi)了克服關鍵詞檢索和目錄查詢的缺點,現在已經出現了自然語言智能(néng)答(dá)詢。用(yòng)戶可(kě)以輸入簡單的疑問句,比如“how can kill virus of computer?”。搜索引擎在對提問進行結構和内容的分(fēn)析之後,或直接給出提問的答(dá)案,或引導用(yòng)戶從幾個可(kě)選擇的問題中(zhōng)進行再選擇。自然語言的優勢在于,一是使網絡交流更加人性化,二是使查詢變得更加方便、直接、有(yǒu)效。就以上面的例子來講,如果用(yòng)關鍵詞查詢,多(duō)半人會用(yòng)“virus”這個詞來檢索,結果中(zhōng)必然會包括各類病毒的介紹、病毒是怎樣産(chǎn)生的等等許多(duō)無效信息,而用(yòng)“how can kill virus of computer?”,搜索引擎會将怎樣殺病毒的信息提供給用(yòng)戶,提高了檢索效率。
二、對檢索結果進行處理(lǐ)
1)基于鏈接評價的搜索引擎
基于鏈接評價的搜索引擎的優秀代表是Googel(http://www.googel.com),它獨創的“鏈接評價體(tǐ)系”是基于這樣一種認識,一個網頁(yè)的重要性取決于它被其它網頁(yè)鏈接的數量,特别是一些已經被認定是“重要”的網頁(yè)的鏈接數量。這種評價體(tǐ)制與《科(kē)技(jì )引文(wén)索引》的思路非常相似,但是由于互聯網是在一個商(shāng)業化的環境中(zhōng)發展起來的,一個網站的被鏈接數量還與它的商(shāng)業推廣有(yǒu)着密切的聯系,因此這種評價體(tǐ)制在某種程度上缺乏客觀性。
2)基于訪問大衆性的搜索引擎
基于訪問大衆性的搜索引擎的代表是direct hit,它的基本理(lǐ)念是多(duō)數人選擇訪問的網站就是最重要的網站。根據以前成千上萬的網絡用(yòng)戶在檢索結果中(zhōng)實際所挑選并訪問的網站和他(tā)們在這些網站上花(huā)費的時間來統計确定有(yǒu)關網站的重要性 排名(míng),并以此來确定哪些網站最符合用(yòng)戶的檢索要求。因此具(jù)有(yǒu)典型的趨衆性特點。這種評價體(tǐ)制與基于鏈接評價的搜索引擎有(yǒu)着同樣的缺點。
3)去掉檢索結果中(zhōng)附加的多(duō)餘信息
有(yǒu)調查指出,過多(duō)的附加信息加重了用(yòng)戶的信息負擔,為(wèi)了去掉這些過多(duō)的附加信息,可(kě)以采用(yòng)用(yòng)戶定制、内容過濾等檢索技(jì )術。
三、确定搜索引擎信息搜集範圍,提高搜索引擎的針對性
1)垂直主題搜索引擎
網上的信息浩如煙海,網絡資源以十倍速的增長(cháng),一個搜索引擎很(hěn)難收集全所有(yǒu)主題的網絡信息,即使信息主題收集得比較全面,由于主題範圍太寬,很(hěn)難将各主題都做得精(jīng)确而又(yòu)專業,使得檢索結果垃圾太多(duō)。這樣以來,垂直主題的搜索引擎以其高度的目标化和專業化在各類搜索引擎中(zhōng)占據了一系席之地,比如象股票、天氣、新(xīn)聞等類的搜索引擎,具(jù)有(yǒu)很(hěn)高的針對性,用(yòng)戶對查詢結果的滿意度較高。作(zuò)者認為(wèi),垂直主題有(yǒu)着極大的發展空間。
2)非www信息的搜索
提供FTP等類信息的檢索
3)多(duō)媒體(tǐ)搜索引擎
多(duō)媒體(tǐ)檢索主要包括聲音、圖像的檢索。
四、将搜索引擎的技(jì )術開發重點放在對檢索結果的處理(lǐ)上,提供更優化的檢索結果
1)純淨搜索引擎
這類搜索引擎沒有(yǒu)自己的信息采集系統,利用(yòng)别人現有(yǒu)的索引數據庫,主要關注檢索的理(lǐ)念、技(jì )術和機制等。
2)元搜索引擎
現在出現了許多(duō)的搜索引擎,其收集信息的範圍、搜索機制、算法等都不同,用(yòng)戶不得不去學(xué)習多(duō)個搜索引擎的用(yòng)法。每個搜索引擎平均隻能(néng)涉及到整個www資源的30-50%(search engine watch數據),這樣導緻同一個搜索請求在不同搜索引擎中(zhōng)獲得的查詢結果的重複率不足34%,而每一個搜索引擎的查準率不到45%。
元搜索引擎(metasearch enging)是将用(yòng)戶提交的檢索請求到多(duō)個獨立的搜索引擎上去搜索,并将檢索結果集中(zhōng)統一處理(lǐ),以統一的格式提供給用(yòng)戶,因此有(yǒu)搜索引擎之上的搜索引擎之稱。它的主要精(jīng)力放在提高搜索速度、智能(néng)化處理(lǐ)搜索結果、個性搜索功能(néng)的設置和用(yòng)戶檢索界面的友好性上,查全率和查準率都比較高。目前比較成功的元搜索引擎有(yǒu)metacrawler、dopile、ixquick等。
| |
|
上一條:
互聯網需要全文(wén)檢索 |
|
下一條:
主要中(zhōng)文(wén)網頁(yè)搜索引擎介紹
|
|
 |
|