Google搜索技術 搜索引擎只是一個索引資料庫,一般沒有自己的信息資源,信息的可獲得性與搜索引擎無關。不過搜索引擎有時也會在資料庫中存儲某些信息的內容。 一、普通搜索技術 1、預設模糊搜索、預設拆分語句和過長的短語 排除常用詞規則: 在Google的檢索規則中,有些常用詞如“的”、“the”或者“ ...
Google搜索技術
搜索引擎只是一個索引資料庫,一般沒有自己的信息資源,信息的可獲得性與搜索引擎無關。不過搜索引擎有時也會在資料庫中存儲某些信息的內容。
一、普通搜索技術
1、預設模糊搜索、預設拆分語句和過長的短語
- 排除常用詞規則:
在Google的檢索規則中,有些常用詞如“的”、“the”或者“of”等這些詞是不被當作檢索詞的,而被忽略掉。 不區分大小寫規則:
Google對於檢索詞中的大小寫是完全不做區分的,這個規則的設置是為了改善檢索結果,因為利用這樣一個規則,就可以檢索到包含該詞的所有網頁,避免了因為大小寫不規範而造成的在查全率上的損失排除標點符號規則:
Google並不認為標點符號具有與文字一的重要地位,因此Google會忽略檢索之間絕大多數的標點符號。但是對於單引號和連字元而言,它們是不被省略的。檢索詞的詞序和鄰近規則:
在Google中,檢索詞的排序方式對於整個檢索式具有重要的影響,它將首先匹配按照檢索式給出的次序進行搜索。同時它也將優先匹配檢索詞相互鄰接的網頁。2、精確搜索:雙引號“”。(短語搜索。可以查到各個單詞按相同順序出現的網頁)
3、通配符*用法
4、點號匹配任意字元(也可不用引號)
5、布爾邏輯
- 邏輯與:空格、AND。
(在Google的檢索規則中,最基本的一條是預設And規則,即當你輸入多個檢索詞之後,Google預設為要檢索所有的包含所有檢索詞的網頁,它們之間為And連接。) - 邏輯或:OR
在檢索式中運算符OR必須以大寫的形式出現,否則會把它看成是普通的檢索詞。OR運算符告訴Google查找包含其中任何一個詞的網頁。
邏輯非:-(減號)。
運算符“-”表示不包含該運算符後面的詞。6、約束條件:+。(運算符“+”表示包含運算符後面的詞)
7、同義詞:~(英文適用。運算符“~”讓Google檢索該詞及其同義詞)
8、數字範圍:..
二、高級搜索語法
1、intitle、allintitle:搜索範圍限制在網頁的標題
2、intext,allintext:搜索範圍限制在網頁中的正文中搜索,即忽略超鏈接文本、URL以及題目等。
3、inurl、allinurl:搜索範圍限制在URL。
4、inanchor、allinanchor :搜索範圍限制在頁面的鏈接錨點進行搜索,即在一個鏈接的描述文本內進行檢索。網頁中的代碼
5、info:進入某URL更多信息的引導頁面。
cache:搜索谷歌緩存的頁面
related:檢索與某特定網頁類似的網頁。這在搜尋相關內容或者具有類似功能的網頁的時候,非常有幫助。
link:搜索所有鏈接到某個特定 URL上的頁面列表
site:搜索範圍限制在某網站或者頂級功能變數名稱中。6、filetype:根據文件尾碼搜索特定文件類型
7、define:搜索定義
8、谷歌高級搜索語法也可以通過“高級搜索”頁面來實現部分功能,不過,直接用高級搜索語法能更方便、更靈活、更高效。
Daterange:查找在一定的日期或者一定的日期範圍內,Google索引的網頁(該語法只關註被Google收錄的時間,而不關註網頁創建的時間)。
三、混合使用搜索技術
1、混合使用技術
- 縮小搜索範圍最好的選擇:混合使用intitle、site。例如,intitle:自動化site:edu.cn;
- 限定搜索特定類別的信息:inurl限定。例如,等愛的玫瑰 inurl:mp3;
搜索網站內的文檔(一網打盡!):例如,filetype:ppt site:lib.nit.net.cn。
2、什麼情況下不混合使用
- 不混合使用有抵消的搜索:例如,知識管理site:edu.cn -inurl:edu;
- 不要重覆使用同一語法結構:例如,知識管理 site:cn site:com,但是這樣可以:知識管理 (site:cn | site:com);
- 在混合使用語法時,不要用別名:如allinurl、allintitle;
不要使用過多的語法將搜索結果限制得特別狹窄,採取逐步增加限制的方法,一般不要一步到位做很多限制。
四、Google提供的特色服務
- Google 學術搜索:學術文章搜索,可能會獲得全文。http://scholar.google.cn/
- Google 圖片搜索:搜索圖片,對做課件和藝術系同學很有幫助。https://www.google.com.hk/imghp?hl=zh-CN
- Google 圖書搜索:有可能獲得所需要圖書的全文。 http://books.google.cn/
- Google 地圖搜索:查詢地址、捜索周邊和規劃路線。http://ditu.google.cn/
- Google 地球:從遠、近等多個角度查看地球的各個角落。http://earth.google.com
Google 視頻:從遠、近等多個角度查看地球的各個角落。http://video.google.com
五、Google搜索時應註意的問題
- Google不區分英文字母的大小寫,所有字母均作小寫對待。例如:輸入“george washington”(喬治·華盛頓),或是“George Washington”, 再或是“gEoRgE wAsHiNgToN”,結果都是一樣的
- 通配符問題。Google對通配符的支持有限,只能用“”代替單個字元,而且必須將檢索詞用引號引起來,如“以治國”
搜索引擎忽略的字元與強制檢索。
Google對一些出現頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符號如“*”、“.”等,作忽略處理。如果檢索詞中包含這些字元,必須進行強制檢索,在這些字元前後用“+”,如“+www+的歷史”,或用英文的引號Baidu搜索技巧
一、Baidu常用功能
1、百度快照
每個被收錄的網頁,在百度上都存有一個純文本的備份,稱為“百度快照”。百度只保留文本內容,所以,那些圖片、音樂等非文本信息,快照頁面還是直接從原網頁調用。如果您無法連接原網頁,那麼快照上的圖片等非文本內容,會無法顯示。
技巧:如果有一些網站需要積分才能下載文章,這個時候用百度快照可以免費下載文章。
2、相關搜索
搜索結果不佳,有時候是因為選擇的查詢詞不是很妥當。您可以通過參考別人是怎麼搜的,來獲得一些啟發。百度的“相關搜索”,就是和您的搜索很相似的一系列查詢詞。百度相關搜索排布在搜索結果頁的下方,按搜索熱門度排序。
4、英漢互譯詞典
百度還有線上英漢互譯詞典?沒錯。您也可以通過百度詞典搜索界面(http://dict.baidu.com) ,直接使用英漢互譯功能。如,搜索“computer”,就可以得到高質量的翻譯結果。百度的線上詞典不但能翻譯普通的英語單詞、片語、漢字詞語,甚至還能翻譯常見的成語!
5、計算器和度量衡轉換
可以計算四則運算,如,35*82-(32+11);還可以進行公式計算。如,log((sin(5))^2)-3+pi;甚至可以進行單位換算,換算前單位=?換算後單位 ,如,1海裡=?公裡;等等。
6、股票、列車時刻表和飛機航班查詢
在百度搜索框中輸入股票代碼、列車車次或者飛機航班號,您就能直接獲得相關信息。例如,輸入深發展的股票代碼“000002”,搜索結果上方,顯示萬科A的股票行情。
二、高級搜索語法
1、把搜索範圍限定在特定站點中——site
有時候,您如果知道某個站點中有自己需要找的東西,就可以把搜索範圍限定在這個站點中,提高查詢效率。使用的方式,是在查詢內容的後面,加上“site:站點功能變數名稱”。
註意,“site:”後面跟的站點功能變數名稱,不要帶“http://”;另外,site:和站點名之間,不要帶空格。
2、書名號
有兩層特殊功能,一是書名號會出現在搜索結果中;二是被書名號擴起來的內容,不會被拆分。 書名號在某些情況下特別有效果。
3、把搜索範圍限定在網頁標題中——intitle
網頁標題通常是對網頁內容提綱挈領式的歸納。把查詢內容範圍限定在網頁標題中,有時能獲得良好的效果。使用的方式,是把查詢內容中,特別關鍵的部分,用“intitle:”領起來。
例如,找林青霞的寫真,就可以這樣查詢:寫真 intitle:林青霞
註意,intitle:和後面的關鍵詞之間,不要有空格。
4、把搜索範圍限定在url鏈接中——inurl
網頁url中的某些信息,常常有某種有價值的含義。於是,您如果對搜索結果的url做某種限定,就可以獲得良好的效果。實現的方式,是用“inurl:”,後跟需要在url中出現的關鍵詞。
例如,找關於photoshop的使用技巧,可以這樣查詢:photoshop inurl:jiqiao
上面這個查詢串中的“photoshop”,是可以出現在網頁的任何位置,而“jiqiao”則必須出現在網頁url中。註意,inurl:語法和後面所跟的關鍵詞,不要有空格。
5、精確匹配——雙引號
用法同Google
6、去除含有特定關鍵詞的網頁——減號(-)
如果您發現搜索結果中,有某一類網頁是您不希望看見的,而且,這些網頁都包含特定的關鍵詞,那麼用減號語法,就可以去除所有這些含有特定關鍵詞的網頁。
例如,搜 神雕俠侶,希望是關於武俠小說方面的內容,卻發現很多關於電視劇方面的網頁。那麼就可以這樣查詢:神雕俠侶 -電視劇
註意,前一個關鍵詞,和減號之間必須有空格,否則,減號會被當成連字元處理,而失去減號語法功能。減號和後一個關鍵詞之間,有無空格均可。
三、Baidu常用搜索技巧
1、選擇適當的查詢詞---準確的表述
百度會嚴格按照您提交的查詢詞去搜索,因此,查詢詞表述準確是獲得良好搜索結果的必要前提。 一類常見的表述不准確情況是,腦袋裡想著一回事,搜索框里輸入的是另一回事。 一種不准確的表述就是在查詢中出現錯別字。
2、查詢詞的主題關聯與簡練 :
目前的搜索引擎並不能很好的處理自然語言。因此,在提交搜索請求時,您最好把自己的想法,提煉成簡單的,而且與希望找到的信息內容主題關聯的查詢詞。還是用實際例子說明。某三年級小學生,想查一些關於時間的名人名言,他的查詢詞是“小學三年級關於時間的名人名言”。最好的查詢詞,應該是“時間名言”。
3、很多情況下,我們需要有權威性的,信息量大的專業報告或者論文。巧妙利用filetype:這個語法對搜索對象做限制。
百度支持對Office文檔(包括Word、Excel、Powerpoint)、Adobe PDF文檔、RTF文檔進行的全文搜索。要搜索這類文檔,很簡單,在普通的查詢詞後面,加一個“filetype:”文檔類型限定。Filetype:”後可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有這些文件類型。