sphinx,coreseek安裝

来源:http://www.cnblogs.com/biezaideng/archive/2016/07/15/5674003.html
-Advertisement-
Play Games

sphinx是國外的一款搜索軟體。 coreseek是在sphinx的基礎上,增加了中文分詞功能,換句話說,就是支持了中文。 Coreseek發佈了3.2.14版本和4.1版本,其中的3.2.14版本是2010年發佈的,它是基於Sphinx0.9.9搜索引擎的。而4.1版本是2011年發佈的,它是基 ...


sphinx是國外的一款搜索軟體。

coreseek是在sphinx的基礎上,增加了中文分詞功能,換句話說,就是支持了中文。

Coreseek發佈了3.2.14版本和4.1版本,其中的3.2.14版本是2010年發佈的,它是基於Sphinx0.9.9搜索引擎的。而4.1版本是2011年發佈的,它是基於Sphinx2.0.2的。Sphinx從0.9.9到2.0.2還是有改變了很多的,有很多功能,比如sql_attr_string等是在0.9.9上面不能使用的。

可以同時安裝sphinx,coreseek,不會互相衝突。

環境:centos6.5 + mysql5.6 + other。

首先安裝sphinx:

1. 下載安裝包 http://sphinxsearch.com/downloads/    (目前最新版本是2.2.10)

2  ./configure --prefix=/usr/local/sphinx --with-mysql=/usr/local/mysql        (mysql其實不用指定,預設已經支持)           make && make install

3.安裝完成後,在 /usr/local/sphinx目錄下會有4個目錄 

4.打開example.sql ,執行上面的sql.這是測試用例。

5.進入etc目錄,拷貝配置文件, cp  sphinx-min.conf.dist  sphinx.conf  (這裡不拷貝sphinx.conf.dist ,因為這文件只是比前者多了一堆註釋)

6.打開sphinx.conf  修改下配置文件,如果使用的是步驟4的用例,那在這裡只需要修改一下資料庫配置就行。

7. 生成索引 /usr/local/sphinx/bin/indexer --all

8.測試 /usr/local/sphinx/bin/search linux

 

沒錯,你會看到這行提示,我們根本就沒這個命令軟體。。。。。只有一個searchd,但是這個searchd的用途根本不是這個,所以這裡就先不測試了,我們去安裝coreseek吧!

 

安裝coreseek

1.首先下載軟體,打開 官網 coreseek.cn

 

沒錯,你會看到這個提示。

根據筆者觀察,該網站已經N久打不開了,該站長已經N久沒去備案了。

那隻能從別的地方下載安裝包咯。

2.解壓oreseek里有2個文件夾 一個是mmseg中文分詞包 還有一個是csft(其實就是sphinx)包 都要安裝

首先安裝mmseg中文分詞
./configure --prefix=/usr/local/mmseg
編譯時可能會報錯config.status: error: cannot find input file: src/Makefile.in
通過automake來解決
首先檢查是否安裝了libtool如果沒有
yum -y install libtool
automake
如果automake報錯 原因可能是下列
Libtool library used but `LIBTOOL' is undefined
The usual way to define `LIBTOOL' is to add `AC_PROG_LIBTOOL'
to `configure.ac' and run `aclocal' and `autoconf' again.
If `AC_PROG_LIBTOOL' is in `configure.ac', make sure
its definition is in aclocal's search path.

如果以上步驟都沒成功,那麼試下以下辦法(把下麵的命令都執行一遍,就好了)

 

3.然後繼續mmseg的安裝

./configure --prefix=/usr/local/mmseg
make && make install


4.安裝csft
./configure --prefix=/usr/local/coreseek --with-mysql=/usr/local/mysql --with-mmseg=/usr/local/mmseg --with-mmseg-includes=/usr/local/mmseg/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg/lib/
make && make install
安裝完畢後 註意 coreseek 中的配置文件也是csft.conf 而不是 sphinx.conf
cd /usr/local/coreseek/etc
cp sphinx.conf.dist csft.conf
vim csft.conf

 

5.修改配置csft.conf,增加對中文支持

打開csft.conf

在index test1 段下麵,增加

charset_type = zh_cn.utf-8
charset_dictpath =/usr/local/mmseg/etc/

6.配置完成,測試一下吧

保存配置
建立索引
cd /usr/local/coreseek/bin
./indexer --all
./search 別再等

看看是不是已經出來效果了呢 (備註,原始測試的sql,都是英文,需要自己添加一些中文的記錄哦)。


到這裡就結束了,下一篇,將介紹下php怎麼連接訪問sphinx,coreseek


 

 

 參考文章:

http://www.cnblogs.com/lost-1987/articles/2681643.html

http://www.cnblogs.com/yjf512/p/3581869.html

 

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這是本學期java課中實驗大綱里的第一個實驗,這裡簡單做了一個無用戶界面版本。 能看到判斷對錯的方法運用了直接運算符計算結果與函數定義後的運算結果相比較,相等得分,不相等則不得分。 編程中出現的問題:在計算結果為小數的除法時,一開始會出現結果怎麼算都不對的情況,他的正確答案也是一個向偶舍入的數值,那 ...
  • 直接插入排序 直接插入排序是一種簡單的插入排序法,其基本思想是:把待排序的紀錄按其關鍵碼值的大小逐個插入到一個已經排好序的有序序列中,直到所有的紀錄插入完為止,得到一個新的有序序列。[1] 例如,已知待排序的一組紀錄是: 60,71,49,11,24,3,66 假設在排序過程中,前3個紀錄已按關鍵碼 ...
  • 最近遇到的關於VS里編譯出現的“無法解析的外部符號”問題,在網上尋求解決辦=辦法時查到下麵的博客內容,作者講解的挺全面的,作為收藏以備將來查詢。 原文http://blog.csdn.net/shenyulv/article/details/6699836 VC++時經常會遇到鏈接錯誤LNK2001 ...
  • 從誕生至今,20多年過去,Java至今仍是使用最為廣泛的語言。這仰賴於Java提供的各種技術和特性,讓開發人員能優雅的編寫高效的程式。今天我們就來說說Java的一項基本但非常重要的技術記憶體管理 瞭解C語言的同學都知道,在C語言中記憶體的開闢和釋放都是由我們自己來管理的,每一個new操作都要對於一個de ...
  • scalaz-stream庫的主要設計目標是實現函數式的I/O編程(functional I/O)。這樣用戶就能使用功能單一的基礎I/O函數組合成為功能完整的I/O程式。還有一個目標就是保證資源的安全使用(resource safety):使用scalaz-stream編寫的I/O程式能確保資源的安 ...
  • 項目里有各種加密方法,但從來沒有仔細研究過。一般只是copy。這幾天遇到一些問題,看了一下加密代碼,覺得有些疑惑。 我們知道jdk已經為我們包裝好了很多的演算法。但究竟包裝了哪些演算法,怎麼去掉這些演算法我並沒有去查過。今天跟了一下源碼,大概知道了。 首先要從下麵這幾行代碼說起: 對於AES加密,我們用K ...
  • 最近正在系統學習OpenCV,將不定期發佈筆記,主要按照毛星雲的《OpenCV3編程入門》的順序學習,會參考官方教程和文檔。學習工具是Xcode+CMake,會對書中一部分內容更正,並加入cmakelist的內容。 書中大部分內容來自OpenCV文檔,其實比較推薦官方文檔和教程 OpenCV2.4. ...
  • 之前一直知道多態是什麼東西,平時敲代碼也經常用到多態,但一直沒有真正瞭解多態底層的運行機制到底是怎麼樣的,這兩天才研究明白點,特地寫下來,跟各位同學一起進步,同時也希望各位大神指導和指正。 多態的概念:同一操作作用於不同對象,可以有不同的解釋,有不同的執行結果,這就是多態,簡單來說就是:父類的引用指 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...