搜索引擎的使用

来源:http://www.cnblogs.com/q735613050/archive/2017/07/27/7246907.html
-Advertisement-
Play Games

Google搜索技術 搜索引擎只是一個索引資料庫,一般沒有自己的信息資源,信息的可獲得性與搜索引擎無關。不過搜索引擎有時也會在資料庫中存儲某些信息的內容。 一、普通搜索技術 1、預設模糊搜索、預設拆分語句和過長的短語 排除常用詞規則: 在Google的檢索規則中,有些常用詞如“的”、“the”或者“ ...


Google搜索技術

搜索引擎只是一個索引資料庫,一般沒有自己的信息資源,信息的可獲得性與搜索引擎無關。不過搜索引擎有時也會在資料庫中存儲某些信息的內容。

一、普通搜索技術

1、預設模糊搜索、預設拆分語句和過長的短語

  • 排除常用詞規則:
    在Google的檢索規則中,有些常用詞如“的”、“the”或者“of”等這些詞是不被當作檢索詞的,而被忽略掉。
  • 不區分大小寫規則:
    Google對於檢索詞中的大小寫是完全不做區分的,這個規則的設置是為了改善檢索結果,因為利用這樣一個規則,就可以檢索到包含該詞的所有網頁,避免了因為大小寫不規範而造成的在查全率上的損失

  • 排除標點符號規則:
    Google並不認為標點符號具有與文字一的重要地位,因此Google會忽略檢索之間絕大多數的標點符號。但是對於單引號和連字元而言,它們是不被省略的。

  • 檢索詞的詞序和鄰近規則:
    在Google中,檢索詞的排序方式對於整個檢索式具有重要的影響,它將首先匹配按照檢索式給出的次序進行搜索。同時它也將優先匹配檢索詞相互鄰接的網頁。

    2、精確搜索:雙引號“”。(短語搜索。可以查到各個單詞按相同順序出現的網頁) 

    3、通配符*用法 

    4、點號匹配任意字元(也可不用引號)

    5、布爾邏輯

  • 邏輯與:空格、AND。
    (在Google的檢索規則中,最基本的一條是預設And規則,即當你輸入多個檢索詞之後,Google預設為要檢索所有的包含所有檢索詞的網頁,它們之間為And連接。)
  • 邏輯或:OR
    在檢索式中運算符OR必須以大寫的形式出現,否則會把它看成是普通的檢索詞。OR運算符告訴Google查找包含其中任何一個詞的網頁。
  • 邏輯非:-(減號)。
    運算符“-”表示不包含該運算符後面的詞。

    6、約束條件:+。(運算符“+”表示包含運算符後面的詞)

    7、同義詞:~(英文適用。運算符“~”讓Google檢索該詞及其同義詞)

    8、數字範圍:..

    二、高級搜索語法

    1、intitle、allintitle:搜索範圍限制在網頁的標題

    2、intext,allintext:搜索範圍限制在網頁中的正文中搜索,即忽略超鏈接文本、URL以及題目等。

    3、inurl、allinurl:搜索範圍限制在URL。

    4、inanchor、allinanchor :搜索範圍限制在頁面的鏈接錨點進行搜索,即在一個鏈接的描述文本內進行檢索。網頁中的代碼

    5、info:進入某URL更多信息的引導頁面。

    cache:搜索谷歌緩存的頁面
    related:檢索與某特定網頁類似的網頁。這在搜尋相關內容或者具有類似功能的網頁的時候,非常有幫助。
    link:搜索所有鏈接到某個特定 URL上的頁面列表
    site:搜索範圍限制在某網站或者頂級功能變數名稱中。

    6、filetype:根據文件尾碼搜索特定文件類型

    7、define:搜索定義

    8、谷歌高級搜索語法也可以通過“高級搜索”頁面來實現部分功能,不過,直接用高級搜索語法能更方便、更靈活、更高效。

    Daterange:查找在一定的日期或者一定的日期範圍內,Google索引的網頁(該語法只關註被Google收錄的時間,而不關註網頁創建的時間)。

    三、混合使用搜索技術

    1、混合使用技術

  • 縮小搜索範圍最好的選擇:混合使用intitle、site。例如,intitle:自動化site:edu.cn;
  • 限定搜索特定類別的信息:inurl限定。例如,等愛的玫瑰  inurl:mp3;
  • 搜索網站內的文檔(一網打盡!):例如,filetype:ppt  site:lib.nit.net.cn。

    2、什麼情況下不混合使用

  • 不混合使用有抵消的搜索:例如,知識管理site:edu.cn  -inurl:edu;
  • 不要重覆使用同一語法結構:例如,知識管理  site:cn site:com,但是這樣可以:知識管理  (site:cn  | site:com);
  • 在混合使用語法時,不要用別名:如allinurl、allintitle;
  • 不要使用過多的語法將搜索結果限制得特別狹窄,採取逐步增加限制的方法,一般不要一步到位做很多限制。 

四、Google提供的特色服務 

  1. Google 學術搜索:學術文章搜索,可能會獲得全文。http://scholar.google.cn/ 
  2. Google 圖片搜索:搜索圖片,對做課件和藝術系同學很有幫助。https://www.google.com.hk/imghp?hl=zh-CN
  3. Google 圖書搜索:有可能獲得所需要圖書的全文。 http://books.google.cn/ 
  4. Google 地圖搜索:查詢地址、捜索周邊和規劃路線。http://ditu.google.cn/
  5. Google 地球:從遠、近等多個角度查看地球的各個角落。http://earth.google.com 
  6. Google 視頻:從遠、近等多個角度查看地球的各個角落。http://video.google.com

    五、Google搜索時應註意的問題

  • Google不區分英文字母的大小寫,所有字母均作小寫對待。例如:輸入“george washington”(喬治·華盛頓),或是“George Washington”, 再或是“gEoRgE wAsHiNgToN”,結果都是一樣的 
  • 通配符問題。Google對通配符的支持有限,只能用“”代替單個字元,而且必須將檢索詞用引號引起來,如“以治國”
  • 搜索引擎忽略的字元與強制檢索。
    Google對一些出現頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符號如“*”、“.”等,作忽略處理。如果檢索詞中包含這些字元,必須進行強制檢索,在這些字元前後用“+”,如“+www+的歷史”,或用英文的引號

    Baidu搜索技巧

一、Baidu常用功能

1、百度快照

每個被收錄的網頁,在百度上都存有一個純文本的備份,稱為“百度快照”。百度只保留文本內容,所以,那些圖片、音樂等非文本信息,快照頁面還是直接從原網頁調用。如果您無法連接原網頁,那麼快照上的圖片等非文本內容,會無法顯示。
技巧:如果有一些網站需要積分才能下載文章,這個時候用百度快照可以免費下載文章。

2、相關搜索

搜索結果不佳,有時候是因為選擇的查詢詞不是很妥當。您可以通過參考別人是怎麼搜的,來獲得一些啟發。百度的“相關搜索”,就是和您的搜索很相似的一系列查詢詞。百度相關搜索排布在搜索結果頁的下方,按搜索熱門度排序。

4、英漢互譯詞典

百度還有線上英漢互譯詞典?沒錯。您也可以通過百度詞典搜索界面(http://dict.baidu.com) ,直接使用英漢互譯功能。如,搜索“computer”,就可以得到高質量的翻譯結果。百度的線上詞典不但能翻譯普通的英語單詞、片語、漢字詞語,甚至還能翻譯常見的成語!

5、計算器和度量衡轉換

可以計算四則運算,如,35*82-(32+11);還可以進行公式計算。如,log((sin(5))^2)-3+pi;甚至可以進行單位換算,換算前單位=?換算後單位 ,如,1海裡=?公裡;等等。

6、股票、列車時刻表和飛機航班查詢

在百度搜索框中輸入股票代碼、列車車次或者飛機航班號,您就能直接獲得相關信息。例如,輸入深發展的股票代碼“000002”,搜索結果上方,顯示萬科A的股票行情。

二、高級搜索語法

1、把搜索範圍限定在特定站點中——site

有時候,您如果知道某個站點中有自己需要找的東西,就可以把搜索範圍限定在這個站點中,提高查詢效率。使用的方式,是在查詢內容的後面,加上“site:站點功能變數名稱”。
註意,“site:”後面跟的站點功能變數名稱,不要帶“http://”;另外,site:和站點名之間,不要帶空格。

2、書名號

有兩層特殊功能,一是書名號會出現在搜索結果中;二是被書名號擴起來的內容,不會被拆分。 書名號在某些情況下特別有效果。

3、把搜索範圍限定在網頁標題中——intitle

網頁標題通常是對網頁內容提綱挈領式的歸納。把查詢內容範圍限定在網頁標題中,有時能獲得良好的效果。使用的方式,是把查詢內容中,特別關鍵的部分,用“intitle:”領起來。
例如,找林青霞的寫真,就可以這樣查詢:寫真 intitle:林青霞
註意,intitle:和後面的關鍵詞之間,不要有空格。

4、把搜索範圍限定在url鏈接中——inurl

網頁url中的某些信息,常常有某種有價值的含義。於是,您如果對搜索結果的url做某種限定,就可以獲得良好的效果。實現的方式,是用“inurl:”,後跟需要在url中出現的關鍵詞。
例如,找關於photoshop的使用技巧,可以這樣查詢:photoshop inurl:jiqiao
上面這個查詢串中的“photoshop”,是可以出現在網頁的任何位置,而“jiqiao”則必須出現在網頁url中。註意,inurl:語法和後面所跟的關鍵詞,不要有空格。

5、精確匹配——雙引號

用法同Google

6、去除含有特定關鍵詞的網頁——減號(-)

如果您發現搜索結果中,有某一類網頁是您不希望看見的,而且,這些網頁都包含特定的關鍵詞,那麼用減號語法,就可以去除所有這些含有特定關鍵詞的網頁。
例如,搜 神雕俠侶,希望是關於武俠小說方面的內容,卻發現很多關於電視劇方面的網頁。那麼就可以這樣查詢:神雕俠侶 -電視劇
註意,前一個關鍵詞,和減號之間必須有空格,否則,減號會被當成連字元處理,而失去減號語法功能。減號和後一個關鍵詞之間,有無空格均可。

三、Baidu常用搜索技巧

1、選擇適當的查詢詞---準確的表述

百度會嚴格按照您提交的查詢詞去搜索,因此,查詢詞表述準確是獲得良好搜索結果的必要前提。 一類常見的表述不准確情況是,腦袋裡想著一回事,搜索框里輸入的是另一回事。 一種不准確的表述就是在查詢中出現錯別字。

2、查詢詞的主題關聯與簡練 :

目前的搜索引擎並不能很好的處理自然語言。因此,在提交搜索請求時,您最好把自己的想法,提煉成簡單的,而且與希望找到的信息內容主題關聯的查詢詞。還是用實際例子說明。某三年級小學生,想查一些關於時間的名人名言,他的查詢詞是“小學三年級關於時間的名人名言”。最好的查詢詞,應該是“時間名言”。

3、很多情況下,我們需要有權威性的,信息量大的專業報告或者論文。巧妙利用filetype:這個語法對搜索對象做限制。

百度支持對Office文檔(包括Word、Excel、Powerpoint)、Adobe PDF文檔、RTF文檔進行的全文搜索。要搜索這類文檔,很簡單,在普通的查詢詞後面,加一個“filetype:”文檔類型限定。Filetype:”後可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有這些文件類型。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • SQL Server資料庫中,如果應用程式正在執行一個事務的時候突然遭遇了網路異常,例如網路掉包,網路中斷等,那麼這個事務會怎麼樣? SQL Server資料庫是通過什麼機制來判斷處理呢? 估計很多人跟我一樣都有不少疑問, 我們下麵構造一個測試實驗來測試驗證一下。如下所示: 步驟1:在客戶端連使用S ...
  • 使用hadoop mapreduce分析mongodb數據 (現在很多互聯網爬蟲將數據存入mongdb中,所以研究了一下,寫此文檔) 版權聲明:本文為yunshuxueyuan原創文章。如需轉載請標明出處: http://www.cnblogs.com/sxt-zkys/QQ技術交流群:299142 ...
  • 開啟mysql的遠程訪問許可權預設mysql的用戶是沒有遠程訪問的許可權的,因此當程式跟資料庫不在同一臺伺服器上時,我們需要開啟mysql的遠程訪問許可權。主流的有兩種方法,改表法和授權法。相對而言,改表法比較容易一點,個人也是比較傾向於使用這種方法,因此,這裡只貼出改表法1、登陸mysql mysql ...
  • 步驟: 1.輸入命令查詢系統中已安裝的mysql。 rpm -qa |grep -i mysql 2.逐個卸載mysql。 yum remove 系統顯示已安裝的mysql 比如:yum remove mysql-community-server-5.7.19-1.el7.x86_64 3.卸載完成 ...
  • 環境說明: 1 安裝LAMP 採用yum方式進行安裝httpd、MariaDB、php、php mysql,php mysql用來進行php和MariaDB資料庫的連接。 2 創建新的虛擬主機 (1)新增虛擬主機配置文件 (2)創建所需目錄 3 在虛擬主機主目錄/var/www/wordpress下 ...
  • 1.dos command, install pkg 2. cygwin64 command 通過setup-x86_64.exe安裝軟體包安裝lynx,然後通過lynx安裝apt-cyg。apt-cyg類似於ubuntu裡面的apt-get命令。 3. 另一種安裝apt-cyg的方式 ...
  • 點了一個釣魚鏈接,中招了,瀏覽器保存的密碼泄露了。現分析下,避免以後中招! ...
  • grep是一個文本過濾工具,它支持正則表達式,能把搜索匹配到的行列印出來。grep的全稱是Global Regular Expression Print(全局正則表達式)使用許可權是所有用戶。 一、grep 作用:按照用戶指定的模式對目標進行搜索後輸出 模式:正則表達式與文本字元 按照指定的字元搜索 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...