04 Apache Solr: 目錄結構

来源:http://www.cnblogs.com/chen108/archive/2016/12/21/6208458.html
-Advertisement-
Play Games

通過前面的介紹,我們已經能夠看到管理員界面並對Solr形成了一個感性的認識。本篇將在物理上深入瞭解Solr的安裝目錄結構和Solr示例的主目錄結構。 安裝目錄結構 Solr 6.3.0安裝文件夾裡面包含很多內容。這裡挑選一些重要的目錄進行說明。目錄結構如下: bin:大量的Solr控制台管理工具存在 ...


     通過前面的介紹,我們已經能夠看到管理員界面並對Solr形成了一個感性的認識。本篇將在物理上深入瞭解Solr的安裝目錄結構和Solr示例的主目錄結構。  

安裝目錄結構

  Solr 6.3.0安裝文件夾裡面包含很多內容。這裡挑選一些重要的目錄進行說明。目錄結構如下:

  • bin:大量的Solr控制台管理工具存在該目錄下。例如前面提到的solr\solr.cmd\post等。
    • contrib:該文件包含大量關於Solr的擴展。分別如下:
    • analysis-extras:該目錄下麵包含一些相互依賴的文本分析組件。
    • clustering:該目錄下有一個用於集群檢索結果的引擎。
    • dataimporthandler:DIH是Solr中一個重要的組件,該組件可以從資料庫或者其他數據源導入數據到Solr中。
    • dataimporthandler-extras:這裡麵包含了對DIH的擴展。
    • extraction:集成Apache Tika,用於從普通格式文件中提取文本。
    • langid:該組件使得Solr擁有在建索引之前識別和檢測文檔語言的能力。
    • map-reduce:提供一些和Hadoop Map-Reduce協同工作的工具。
    • morphlines-cell:為Solr Cell類型的功能提供Kite Morphlines的特性。
    • morphlines-core:為Solr提供Kite Morphlines的特性。
    • uima:該目錄包含用於集成Apache UIMA的庫。
    • velocity:包含一個基於Velocity模板語言簡單檢索UI框架。
  • dist:在這裡能找到Solr的核心JAR包和擴展JAR包。當我們試圖把Solr嵌入到某個應用程式的時候會用到核心JAR包。
    • solrj-lib:包含構建基於Solr的客戶端時會用到的JAR包。
    • test-framework:包含測試Solr時候會用到的JAR包。
  • docs:該文件夾裡面存放的是Solr文檔,離線的靜態HTML文件,還有API的描述。但是個人覺得不是太有用,使用Solr Reference Guide更好。
  • example:包含Solr的簡單示例。在其中的exampledocs子文件夾下存放著前面提到過的用於在Windows環境下發送文檔到Solr的工具post.jar程式。
  • licenses:各種許可和協議。
  • server:在本地把Solr作為服務運行的必要文件都存放在這裡。
    • contexts:啟動Solr的Jetty網頁的上下文配置。
    • etc:Jetty伺服器配置文件,在這裡可以把預設的8983埠改成其他的。
    • lib:Jetty伺服器程式對應的可執行JAR包和響應的依賴包。
    • logs:預設情況下,日誌將被輸出到這個文件夾。
    • modules:http\https\server\ssl等配置模塊。
    • resources:存放著Log4j的配置文件。這裡可以改變輸出日誌的級別和位置等設置。
    • scripts:Solr運行的必要腳本。
    • solr:運行Solr的配置文件都保存在這裡。solr.xml文件,提供全方位的配置;zoo.cfg文件,使用SolrCloud的時候有用。子文件夾/configsets存放著Solr的示例配置文件。
    • solr-webapp:前面已經提到過的管理界面的站點就存放在這裡。
    • tmp:存放臨時文件。

主目錄結構

     前面提到過,如果啟動的Solr實例不是示例中的一個,那麼我們需要創建Core,這樣才能順利的完成索引的創建和查詢過程。每創建一個Core,都會產生一個對應的文件夾,這個文件夾就是這裡要提到的主目錄,也是將來使用Solr的過程中會經常操作到的一類目錄。需要說明的是,在“獨立模式”和“雲模式”下,主目錄的結構是有些許差異的。      獨立模式下:
 1 <solr-home-directory>/
 2    solr.xml
 3    core_name1/
 4       core.properties
 5       conf/
 6          solrconfig.xml
 7          managed-schema
 8       data/
 9    core_name2/
10       core.properties
11       conf/
12          solrconfig.xml
13          managed-schema
14       data/

  雲模式下:

1 <solr-home-directory>/
2    solr.xml
3    core_name1/
4       core.properties
5       data/
6    core_name2/
7       core.properties
8       data/
其中,有些文件是非常重要的:
  • solr.xml 為Solr伺服器實例指定配置選項。具體如何配置,後面會專門講解。
  • 在每一個Core裡面:
    • core.properties為每一個Core指定了諸如名稱,所屬集合,schema的位置等等屬性。
    • conf/solrconfig.xml控制高級行為。比如,你可以在該文件中指定數據目錄的替代位置。
    • conf/managed-schema存放文檔的描述。第三篇的創建Core小節提到過的數據驅動的Schema,就是在這裡得到展現的,根據添加的不同的帶索引文件,managed-schema文件的內容會依據推導出的類型動態的調整。Schema定義一個欄位集合的文檔。在這裡既定義欄位類型,又定義欄位本身。欄位類型定義非常的強大甚至還包含了Solr是如何處理進入欄位的值和查詢值得描述的。
    • data/該目錄包含基礎的索引文件。

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 其實也沒啥好說的 用樹狀數組可以O(logn)的查詢 套一層整體二分就可以做到O(nlngn) 最後用樹鏈剖分讓序列上樹 ...
  • 這裡給大家詳細說一下Maven的運行機制,讓大家不僅知其然,更知其所以然。 1.插件保存在哪裡? 與我們所依賴的構件一樣,插件也是基於坐標保存在我們的Maven倉庫當中的。在用到插件的時候會先從本地倉庫查找插件,如果本地倉庫沒有則從遠程倉庫查找插件並下載到本地倉庫。 與普通的依賴構件不同的是,Mav ...
  • Java是一門面向對象的語言,那麼我們寫程式的時候最經常操作的便是對象了,為此,Java提供了一些專門用來處理對象的類庫,這些類庫的集合我們稱之為集合框架。Java集合工具包位於Java.util包下,包含了很多常用的數據結構,如數組、鏈表、棧、隊列、集合、哈希表等。學習Java集合框架下大致可以分 ...
  • 首先在頁面中我們直接寫一個標簽,然後給標簽定義一個id,這裡我們用什麼標簽都可以,我們就用<span></span>演示吧, 代碼如下: 上面我們實例化了一個Clock的對象,這裡我們就在外部定義一個Clock的類, 獲取當前時間併進行時間的格式化,代碼如下: 之後我們在頁面頭部中引入該js就好了: ...
  • Containers in Depth ___ Full container taxonomy You can usually ignore any class that begins with "Abstract." Filling containers This fill( ) just dup ...
  • HTML翻譯為超文本標記語言<標簽名>內容</標簽名>靜態網頁動態網頁的區別是看是否從數據中提取數據一般網頁由幾部分組分組成<html>開始標簽 <head>頭,即為網頁上的控制信息 <title>頁面上的標題</title> </head> <body,其屬性一般有bgcolor頁面背景色,tex ...
  • (1)首先要修改JDK中JMX服務的配置文件,以獲得相應的許可權: 進入$JAVA_HOME所在的根目錄的/jre/lib/management子目錄下, a. 將jmxremote.password.template文件複製為jmxremote.password b. 調整jmxremote.acc ...
  • 有想哪裡知道有做六合彩投註網站系統建設開發的嗎,我這邊可以做六合彩投註系統,如果需要的朋友可以私聊一下。 新版六合彩投註網站系統源碼 (測試完整可商業運行) 帶新開獎結果》》》》》 網站系統可以支持代理開設,股東發展,普通會用等常用的功能。 內附說明。資料庫文件 hs001 修改資料庫連接 文件夾 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...