通過前面的介紹,我們已經能夠看到管理員界面並對Solr形成了一個感性的認識。本篇將在物理上深入瞭解Solr的安裝目錄結構和Solr示例的主目錄結構。 安裝目錄結構 Solr 6.3.0安裝文件夾裡面包含很多內容。這裡挑選一些重要的目錄進行說明。目錄結構如下: bin:大量的Solr控制台管理工具存在 ...
通過前面的介紹,我們已經能夠看到管理員界面並對Solr形成了一個感性的認識。本篇將在物理上深入瞭解Solr的安裝目錄結構和Solr示例的主目錄結構。
安裝目錄結構
Solr 6.3.0安裝文件夾裡面包含很多內容。這裡挑選一些重要的目錄進行說明。目錄結構如下:
- bin:大量的Solr控制台管理工具存在該目錄下。例如前面提到的solr\solr.cmd\post等。
- contrib:該文件包含大量關於Solr的擴展。分別如下:
- analysis-extras:該目錄下麵包含一些相互依賴的文本分析組件。
- clustering:該目錄下有一個用於集群檢索結果的引擎。
- dataimporthandler:DIH是Solr中一個重要的組件,該組件可以從資料庫或者其他數據源導入數據到Solr中。
- dataimporthandler-extras:這裡麵包含了對DIH的擴展。
- extraction:集成Apache Tika,用於從普通格式文件中提取文本。
- langid:該組件使得Solr擁有在建索引之前識別和檢測文檔語言的能力。
- map-reduce:提供一些和Hadoop Map-Reduce協同工作的工具。
- morphlines-cell:為Solr Cell類型的功能提供Kite Morphlines的特性。
- morphlines-core:為Solr提供Kite Morphlines的特性。
- uima:該目錄包含用於集成Apache UIMA的庫。
- velocity:包含一個基於Velocity模板語言簡單檢索UI框架。
- dist:在這裡能找到Solr的核心JAR包和擴展JAR包。當我們試圖把Solr嵌入到某個應用程式的時候會用到核心JAR包。
- solrj-lib:包含構建基於Solr的客戶端時會用到的JAR包。
- test-framework:包含測試Solr時候會用到的JAR包。
- docs:該文件夾裡面存放的是Solr文檔,離線的靜態HTML文件,還有API的描述。但是個人覺得不是太有用,使用Solr Reference Guide更好。
- example:包含Solr的簡單示例。在其中的exampledocs子文件夾下存放著前面提到過的用於在Windows環境下發送文檔到Solr的工具post.jar程式。
- licenses:各種許可和協議。
- server:在本地把Solr作為服務運行的必要文件都存放在這裡。
- contexts:啟動Solr的Jetty網頁的上下文配置。
- etc:Jetty伺服器配置文件,在這裡可以把預設的8983埠改成其他的。
- lib:Jetty伺服器程式對應的可執行JAR包和響應的依賴包。
- logs:預設情況下,日誌將被輸出到這個文件夾。
- modules:http\https\server\ssl等配置模塊。
- resources:存放著Log4j的配置文件。這裡可以改變輸出日誌的級別和位置等設置。
- scripts:Solr運行的必要腳本。
- solr:運行Solr的配置文件都保存在這裡。solr.xml文件,提供全方位的配置;zoo.cfg文件,使用SolrCloud的時候有用。子文件夾/configsets存放著Solr的示例配置文件。
- solr-webapp:前面已經提到過的管理界面的站點就存放在這裡。
- tmp:存放臨時文件。
主目錄結構
前面提到過,如果啟動的Solr實例不是示例中的一個,那麼我們需要創建Core,這樣才能順利的完成索引的創建和查詢過程。每創建一個Core,都會產生一個對應的文件夾,這個文件夾就是這裡要提到的主目錄,也是將來使用Solr的過程中會經常操作到的一類目錄。需要說明的是,在“獨立模式”和“雲模式”下,主目錄的結構是有些許差異的。 獨立模式下:1 <solr-home-directory>/ 2 solr.xml 3 core_name1/ 4 core.properties 5 conf/ 6 solrconfig.xml 7 managed-schema 8 data/ 9 core_name2/ 10 core.properties 11 conf/ 12 solrconfig.xml 13 managed-schema 14 data/
雲模式下:
1 <solr-home-directory>/ 2 solr.xml 3 core_name1/ 4 core.properties 5 data/ 6 core_name2/ 7 core.properties 8 data/其中,有些文件是非常重要的:
- solr.xml 為Solr伺服器實例指定配置選項。具體如何配置,後面會專門講解。
- 在每一個Core裡面:
- core.properties為每一個Core指定了諸如名稱,所屬集合,schema的位置等等屬性。
- conf/solrconfig.xml控制高級行為。比如,你可以在該文件中指定數據目錄的替代位置。
- conf/managed-schema存放文檔的描述。第三篇的創建Core小節提到過的數據驅動的Schema,就是在這裡得到展現的,根據添加的不同的帶索引文件,managed-schema文件的內容會依據推導出的類型動態的調整。Schema定義一個欄位集合的文檔。在這裡既定義欄位類型,又定義欄位本身。欄位類型定義非常的強大甚至還包含了Solr是如何處理進入欄位的值和查詢值得描述的。
- data/該目錄包含基礎的索引文件。