[Spring cloud 一步步實現廣告系統] 14. 全量索引代碼實現

来源:https://www.cnblogs.com/zhangpan1244/archive/2019/08/08/11324363.html
-Advertisement-
Play Games

上一節我們實現了索引基本操作的類以及索引緩存工具類,本小節我們開始實現載入全量索引數據,在載入全量索引數據之前,我們需要先將資料庫中的表數據導出到一份文件中。Let's code. 1.首先定義一個常量類,用來存儲導出文件存儲的目錄和文件名稱 因為我們導出的文件需要在搜索服務中使用到,因此,我們將文 ...


上一節我們實現了索引基本操作的類以及索引緩存工具類,本小節我們開始實現載入全量索引數據,在載入全量索引數據之前,我們需要先將資料庫中的表數據導出到一份文件中。Let's code.

1.首先定義一個常量類,用來存儲導出文件存儲的目錄和文件名稱

因為我們導出的文件需要在搜索服務中使用到,因此,我們將文件名 & 目錄以及導出對象的信息編寫在mscx-ad-commom項目中。

public class FileConstant {
    public static final String DATA_ROOT_DIR = "/Users/xxx/Documents/promotion/data/mysql/";

    //各個表數據的存儲文件名
    public static final String AD_PLAN = "ad_plan.data";
    public static final String AD_UNIT = "ad_unit.data";
    public static final String AD_CREATIVE = "ad_creative.data";
    public static final String AD_CREATIVE_RELARION_UNIT = "ad_creative_relation_unit.data";
    public static final String AD_UNIT_HOBBY = "ad_unit_hobby.data";
    public static final String AD_UNIT_DISTRICT = "ad_unit_district.data";
    public static final String AD_UNIT_KEYWORD = "ad_unit_keyword.data";
}

2.定義索引對象導出的欄位信息,依然用Ad_Plan為例。

/**
 * AdPlanTable for 需要導出的表欄位信息 => 是搜索索引欄位一一對應
 *
 * @author <a href="mailto:[email protected]">Isaac.Zhang | 若初</a>
 */
@Data
@AllArgsConstructor
@NoArgsConstructor
public class AdPlanTable {
    private Long planId;
    private Long userId;
    private Integer planStatus;
    private Date startDate;
    private Date endDate;
}

3.導出文件服務實現

同樣,最好的實現方式就是將導出服務作為一個子工程來獨立運行,我這裡直接實現在了mscx-ad-db項目中

  • 定義一個空介面,為了符合我們的編碼規範
/**
 * IExportDataService for 導出資料庫廣告索引初始化數據
 *
 * @author <a href="mailto:[email protected]">Isaac.Zhang | 若初</a>
 */
public interface IExportDataService {
}
  • 實現service
@Slf4j
@Service
public class ExportDataServiceImpl implements IExportDataService {

    @Autowired
    private AdPlanRepository planRepository;

    /**
     * 導出 {@code AdPlan} from DB to File
     *
     * @param fileName 文件名稱
     */
    public void exportAdPlanTable(String fileName) {
        List<AdPlan> planList = planRepository.findAllByPlanStatus(CommonStatus.VALID.getStatus());
        if (CollectionUtils.isEmpty(planList)) {
            return;
        }

        List<AdPlanTable> planTables = new ArrayList<>();
        planList.forEach(item -> planTables.add(
                new AdPlanTable(
                        item.getPlanId(),
                        item.getUserId(),
                        item.getPlanStatus(),
                        item.getStartDate(),
                        item.getEndDate()
                )
        ));

        //將數據寫入文件
        Path path = Paths.get(fileName);
        try (BufferedWriter writer = Files.newBufferedWriter(path)) {
            for (AdPlanTable adPlanTable : planTables) {
                writer.write(JSON.toJSONString(adPlanTable));
                writer.newLine();
            }
            writer.close();
        } catch (IOException e) {
            e.printStackTrace();
            log.error("export AdPlanTable Exception!");
        }
    }
}
  • 實現Controller,提供操作入口
@Slf4j
@Controller
@RequestMapping("/export")
public class ExportDataController {
    private final ExportDataServiceImpl exportDataService;

    @Autowired
    public ExportDataController(ExportDataServiceImpl exportDataService) {
        this.exportDataService = exportDataService;
    }

    @GetMapping("/export-plan")
    public CommonResponse exportAdPlans() {

        exportDataService.exportAdPlanTable(String.format("%s%s", FileConstant.DATA_ROOT_DIR, FileConstant.AD_PLAN));
        return new CommonResponse();
    }
}
  • 結果文件內容如下,每一行都代表了一個推廣計劃
{"endDate":1561438800000,"planId":10,"planStatus":1,"startDate":1561438800000,"userId":10}
{"endDate":1561438800000,"planId":11,"planStatus":1,"startDate":1561438800000,"userId":10}
根據文件內容構建索引

我們在之前編寫索引服務的時候,創建了一些索引需要使用的實體對象類,比如構建推廣計劃索引的時候,需要使用到的實體對象com.sxzhongf.ad.index.adplan.AdPlanIndexObject,可是呢,我們在上一節實現索引導出的時候,實體對象又是common 包中的com.sxzhongf.ad.common.export.table.AdPlanTable,讀取出來文件中的數據只能反序列化為JSON.parseObject(p, AdPlanTable.class),我們需要將2個對象做相互映射才能創建索引信息。

1.首先我們定義一個操作類型枚舉,代表我們每一次的操作類型(也需要對應到後期binlog監聽的操作類型

public enum OperationTypeEnum {
    ADD,
    UPDATE,
    DELETE,
    OTHER;

    public static OperationTypeEnum convert(EventType type) {
        switch (type) {
            case EXT_WRITE_ROWS:
                return ADD;
            case EXT_UPDATE_ROWS:
                return UPDATE;
            case EXT_DELETE_ROWS:
                return DELETE;
            default:
                return OTHER;
        }
    }
}

2.因為全量索引的載入和增量索引載入的本質是一樣的,全量索引其實就是一種特殊的增量索引,為了代碼的可復用,我們創建統一的類來操作索引。

/**
 * AdLevelDataHandler for 通用處理索引類
 * 1. 索引之間存在層級劃分,也就是相互之間擁有依賴關係的劃分
 * 2. 載入全量索引其實是增量索引 "添加"的一種特殊實現
 *
 * @author <a href="mailto:[email protected]">Isaac.Zhang | 若初</a>
 */
@Slf4j
public class AdLevelDataHandler {

    /**
     * 實現廣告推廣計劃的第二層級索引實現。
     * (第一級為用戶層級,但是用戶層級不參與索引,所以從level 2開始)
     * 第二層級的索引是表示 不依賴於其他索引,但是可被其他索引所依賴
     */
    public static void handleLevel2Index(AdPlanTable adPlanTable, OperationTypeEnum type) {
        // 對象轉換
        AdPlanIndexObject planIndexObject = new AdPlanIndexObject(
                adPlanTable.getPlanId(),
                adPlanTable.getUserId(),
                adPlanTable.getPlanStatus(),
                adPlanTable.getStartDate(),
                adPlanTable.getEndDate()
        );

        //調用通用方法處理,使用IndexDataTableUtils#of來獲取索引的實現類bean
        handleBinlogEvent(
                    // 在前一節我們實現了一個索引工具類,來獲取註入的bean對象
                IndexDataTableUtils.of(AdPlanIndexAwareImpl.class),
                planIndexObject.getPlanId(),
                planIndexObject,
                type
        );
    }

    /**
     * 處理全量索引和增量索引的通用處理方式
     * K,V代表索引的鍵和值
     *
     * @param index 索引實現代理類父級
     * @param key   鍵
     * @param value 值
     * @param type  操作類型
     */
    private static <K, V> void handleBinlogEvent(IIndexAware<K, V> index, K key, V value, OperationTypeEnum type) {
        switch (type) {
            case ADD:
                index.add(key, value);
                break;
            case UPDATE:
                index.update(key, value);
                break;
            case DELETE:
                index.delete(key, value);
                break;
            default:
                break;
        }
    }
}

3.讀取文件實現全量索引載入。

因為我們文件載入之前需要依賴另一個組件,也就是我們的索引工具類,需要添加上@DependsOn("indexDataTableUtils"),全量索引在系統啟動的時候就需要載入,我們需要添加@PostConstruct來實現初始化載入,被@PostConstruct修飾的方法會在伺服器載入Servlet的時候運行,並且只會被伺服器調用一次。

@Component
@DependsOn("indexDataTableUtils")
public class IndexFileLoader {

    /**
     * 服務啟動時,執行全量索引載入
     */
    @PostConstruct
    public void init() {
        //載入 推廣計劃
        List<String> adPlanStrings = loadExportedData(String.format("%s%s",
                FileConstant.DATA_ROOT_DIR, FileConstant.AD_PLAN
        ));
        adPlanStrings.forEach(p -> AdLevelDataHandler.handleLevel2Index(
                JSON.parseObject(p, AdPlanTable.class), OperationTypeEnum.ADD
        ));
    }

    /**
     * <h3>讀取全量索引載入需要的文件</h3>
     *
     * @param fileName 文件名稱
     * @return 文件行數據
     */
    private List<String> loadExportedData(String fileName) {
        try (BufferedReader reader = Files.newBufferedReader(Paths.get(fileName))) {
            return reader.lines().collect(Collectors.toList());
        } catch (IOException e) {
            throw new RuntimeException(e.getMessage());
        }
    }
}

Tips

在實現初始化載入全量索引的過程中,一定要保證數據載入的順序問題,因為不同的數據有可能存在著相互依賴的關聯關係,一旦順序寫錯,會造成程式報錯問題。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前言: 本文一切觀點和測試代碼是在python3的基礎上。 Content: 1.什麼是魔法函數,魔法函數__getitem__在python中應用。 2.python的數據模型和數據模型這種設計對python的影響 3.python常用的魔法函數 4.從len()方法看魔法函數的特點 5.魔法函數 ...
  • 剛到大三時前面兩年荒廢了 什麼都沒學到所以打算自學個編程 自己對Java非常感興趣 就打算自學Java 但是一開始看書 有很多看不懂 非常苦惱 也打算過去培訓 但是培訓太貴了 最後打算還是先自學一段時間 不行再去培訓 最後買了一套教程 覺得這套教程非常不錯 老師講解非常細緻 通俗易懂 自學了幾個月 ...
  • 一、集成開發環境(Integrated Develop Environment,簡稱IDE) 1.什麼是集成開發環境 (1)集成開發環境可以使軟體開發變得更簡單 (2)沒有IDE工具: i.需要安裝JDK,需要配置環境變數;需要手動的將java源文件編譯生成class位元組碼文件; ii.java源程 ...
  • 結合 "Spring 後置處理器源碼" 和 "Spring Aware源碼" ,再來看下 Spring AOP 的源碼。 啟動 AOP 使用 @EnableAspectJAutoProxy 這個註解來啟用 AOP 的能力了。它使用 @Import 導入類 AspectJAutoProxyRegist ...
  • 概述 一些同學的Java課設有這樣一個問題,比較感興趣就做了一下 功能介紹: 1、可增加鬧鐘 2、可刪除鬧鐘 3、時間到了響鈴 4、關閉鬧鐘不會丟失鬧鐘(因為鬧鐘存儲在txt文件中,不會因程式關閉就終止) 缺點 1、沒有使用多線程,鬧鐘響起時只能等待1分鐘或者關閉程式 2、界面設計不夠美觀,後期有時 ...
  • 概述 電腦二級在近兩年新加了python的選擇,趁機考了一下,順便記錄一下學習的一些所獲 第一章 程式設計語言概述 考綱考點: 這一部分主要是介紹電腦語言的公共常識,一些嘗試我就按照自己的理解方式來記憶: 程式設計語言——電腦與人類之間的翻譯官,所以稱為交互體系,翻譯官用的語言稱為電腦程式, ...
  • 前言 本來想把《瘋狂工作流講義 activiti6.0》這本書裡面的實例拿過來,但是這本書我看完後,認為裡面編寫的activiti6的核心API代碼片段不是很清晰,有不少需要雕琢的地方纔好形成一篇博客。 所以我就把以前看過的黑馬activiti5的案例拿過來放到activiti6.0依賴中運行測試, ...
  • 概述 之前學習了一位半加器與一/四位全加器的相關知識,接著學習超前進位加法器加深認識 八位級聯進位加法器 設計文件 採用硬體行為方式描述八位全加器 模擬結構圖 模擬文件 模擬波形 說明:首先在設計文件中,由最開始的進位輸入ci逐級傳遞給c,最後傳遞給co,每位數據都需要傳遞一次上級數據,代碼運算次數 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...