Hadoop技巧(04):簡易處理solr date 時區問題

来源:http://www.cnblogs.com/mephisto/archive/2017/02/16/6403722.html
-Advertisement-
Play Games

在cdh集成的solr cloud中,我們可以通過solr管理界面進行查詢,也可以通過java的api進行查詢,但查詢過程中,如果是時間類型的,可能會存在兩者在界面上看上去不一致的問題,兩者時間剛好相差本地的時區。 ...


閱讀目錄

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 

     在cdh集成的solr cloud中,我們可以通過solr管理界面進行查詢,也可以通過java的api進行查詢,但查詢過程中,如果是時間類型的,可能會存在兩者在界面上看上去不一致的問題,兩者時間剛好相差本地的時區。

創建collection

一:上傳配置文件

  為了模擬現象,我們設置如下solr文檔結構

solrctl instancedir --create date_demo /data/solr_s

二:創建collection

solrctl collection --create date_demo -s 2 -m 2 -r 2

創建完後solr的collection如下

模擬程式

一:編寫程式

  編寫模擬插入程式。為了容易查看,只插入2條數據。

  這裡我們使用的solr版本為4.10.3。

    private void insert() throws SolrServerException, IOException,
            ParseException {
        String zhHost = "master1/solr";

        CloudSolrServer cloudSolrServer = new CloudSolrServer(zhHost);

        cloudSolrServer.setDefaultCollection("date_demo");

        String id_1 = UUID.randomUUID().toString().replaceAll("-", "")
                .toUpperCase();
        String name_1 = "1點前+8";
        Date createDate_1 = sdfDate.parse("2016-12-30 00:11:12");
        String day_1 = sdfDay.format(createDate_1);

        String id_2 = UUID.randomUUID().toString().replaceAll("-", "")
                .toUpperCase();
        String name_2 = "1點後+8";
        Date createDate_2 = sdfDate.parse("2016-12-30 10:13:14");
        String day_2 = sdfDay.format(createDate_2);

        SolrInputDocument solrInputDocument1 = create(id_1, name_1, day_1,
                createDate_1);
        SolrInputDocument solrInputDocument2 = create(id_2, name_2, day_2,
                createDate_2);

        cloudSolrServer.add(solrInputDocument1);
        cloudSolrServer.add(solrInputDocument2);
        cloudSolrServer.commit();

        System.out.println("success");
    }
View Code

二:運行程式

  可以看到我們已經插入2條數據。

三:程式查詢

  在程式查詢的結果如下。

  可以看到solr自己的查詢界面使用的時間格式是UTC的,會有時差,我們這裡是8小時。
CREATEDAY和CREATEDATE有時候不一致。

四:處理

  所以為了3方的統一,要麼自己改solr界面查詢的。要麼自己改下時差,使得3方結果一致,方便使用。

  這裡我們採用自己修改時差來同步。

  但工具量挺大,得在solr插入的時候轉換下時間格式程utc。還的在每次查詢的時候轉換回來。
所以這裡就自己噁心下自己,改下solr源碼,在源碼中找到對應的位置,固定的修改成自己這裡的時差。
這樣就間接的使3方同步了。

  找到solr相關的處理代碼類

org.apache.solr.common.util.JavaBinCodec.java

  在readVal下

return new Date(dis.readLong()-28800000l);//因為存儲的時候solr的時間格式是utc的,所以這裡減掉當前時區的值

  在writePrimitive下

daos.writeLong(((Date) val).getTime()+28800000l);//存入的時候為了同day string同步 加8小時

  這樣就可以了。

  我們查看效果。
  為了對比 將數據的名稱加備註+8

  solr查詢頁面

 

--------------------------------------------------------------------

  到此,本章節的內容講述完畢。

示例下載

Github:https://github.com/sinodzh/HadoopExample/tree/master/2017/solr.demo/

系列索引

  Hadoop技巧系列索引

 

 

 

 

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。

文章是哥(mephisto)寫的,SourceLink


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 環境:REHL6.5 軟體:rpmbuild 使用到的文件:ALiSQL-Master 一、安裝所需要的軟體 [root@alisql ~]# yum install rpm* rpm-build rpmdev* –y[root@alisql ~]# rpmdev-setuptree[root@al... ...
  • 採用偽分佈模式安裝和設置CDH,前提是已經安裝了Java和SSH。 1. 下載hadoop-2.6.0-cdh5.9.0,複製到/opt/下,再解壓; 2. 進入/opt/hadoop-2.6.0-cdh5.9.0/etc/hadoop/,在hadoop-env.sh中添加: 修改配置文件core- ...
  • Hibernate對資料庫結構提供了較為完整的封裝,Hibernate的O/R Mapping實現了POJO 和資料庫表之間的映射,以及SQL 的自動生成和執行。程式員往往只需定義好了POJO 到資料庫表的映射關係,即可通過Hibernate 提供的方法完成持久層操作。程式員甚至不需要對SQL 的熟 ...
  • mysql的索引是通過B+tree的方式的。B+tree是平衡二叉樹的變種,所以查詢的速度是非常快的。(B+tree :https://zh.wikipedia.org/zh-hans/B%2B%E6%A0%91) 索引主要分為聚集索引和輔助索引: 聚集索引:mysql中的數據是通過主鍵的聚集索引儲 ...
  • SQL優化隨記(一)建表 關鍵字:多表OR單表,索引,分區分表 (1)多表OR單表(寫下個人經驗) 多表的優點(相對單表) 1. 規範,方便管理閱讀; 2. 可優化減少表記錄數量; 3. 可減輕對應表的查詢IO消耗。 多表的缺點(相對單表) 1. 查詢時,需經常使用統計函數,資源消耗較大; 2. 表 ...
  • 本文將為您描述SQL Server會話KILL不掉,一直處於KILLED /ROLLBACK狀態情形淺析,教程操作方法: 今天遇到一個很奇怪的情況,發現一個會話異常,這個會話只是在執行一個簡單的存儲過程,裡面使用了鏈接伺服器(Linked Server)查詢另外一臺伺服器數據(存儲過程裡面沒有任何顯 ...
  • 資料庫事物隔離級別有四種,按照隔離性,由低到高依次是:1.Read Uncommitted 2.Read Committed 3.Repeatable Read 4.Serializable 按照併發性則順序相反。 √: 可能出現 ×: 不會出現 1.Read uncommitted 讀未提交,即在 ...
  • --創建外部表 CREATE EXTERNAL TABLE my_report( last_update string, col_a string) PARTITIONED BY ( par_dt string)ROW FORMAT DELIMITED FIELDS TERMINATED BY ', ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...