使用EasyExcel對excel數據進行相似度判斷

来源:https://www.cnblogs.com/kxxz/archive/2023/06/20/17493823.html
-Advertisement-
Play Games

@Data public class ExeclDto { /** * execl表 */ private String filename; /** * 需要匹配的工作表名 */ private String name1; /** * 需要匹配的工作表名 */ private String name ...




@Data
public class ExeclDto {
    /**
     * execl表
     */
    private String filename;
    /**
     * 需要匹配的工作表名
     */
    private String name1;
    /**
     * 需要匹配的工作表名
     */
    private String name2;
}

 

@SpringBootTest
@Slf4j
class CmmcysApplicationTests {

    @Test
    public void testReadExcel() throws IOException, InvalidFormatException {
        // 讀取的excel文件路徑
        String filename = "src/main/resources/static/xlsx/車型名稱映射.xlsx";
        String filename_new = "src/main/resources/static/xlsx/結果表.xlsx";
        // 判斷filename是否為空
        if (!StringUtils.isEmpty(filename)) {
            //讀取excel
            ExeclDto execlDto = new ExeclDto();
            execlDto.setFilename(filename);
            execlDto.setName1("A");
            execlDto.setName2("B");
            Map<String, String> map = readExcel(execlDto);
            //如果map非空就寫入
            if (!map.isEmpty()) {
                List list = new ArrayList<>();
                for (Map.Entry<String, String> entry : map.entrySet()) {
                    CarDto carDto = new CarDto();
                    carDto.setName_a(entry.getKey());
                    carDto.setName_b(entry.getValue());
                    list.add(carDto);
                    log.info(entry.getKey() + " ;" + entry.getValue());
                }
                EasyExcel.write(filename_new, CarDto.class).sheet("結果表").doWrite(list);
            }else {
                System.out.println("文件沒有該工作表,請重新檢查上傳");
            }
        } else {
            System.out.println("文件為空,請重新上傳");
        }
    }


    public Map<String,String> readExcel(ExeclDto execlDto){
        // 讀取的excel文件路徑
        String filename = execlDto.getFilename();
        // 讀取excel
        File file = new File(filename);
        Workbook sheets = null;
        try {
            sheets = WorkbookFactory.create(file);
        } catch (IOException e) {
            e.printStackTrace();
        } catch (InvalidFormatException e) {
            e.printStackTrace();
        }
        Sheet sheetAt1 = sheets.getSheet(execlDto.getName1());
        Sheet sheetAt2 = sheets.getSheet(execlDto.getName2());
        //判斷excel表中是否有該工作表
        if (sheetAt1 !=null && sheetAt2 !=null) {
            //採用LinkedHashMap保證數據的順序性
            Map<String, Double> map1 = new LinkedHashMap<>();
            Map<String, String> map2 = new LinkedHashMap<>();
            //迴圈工作表行
            for (Row row1 : sheetAt1) {
                //獲取工作表列值
                String stringCellValue = row1.getCell(0).getStringCellValue();
                //設置string類型初始閾值
                map1.put("bz", 0.0);
                //迴圈需要比較的工作表列值
                for (Row row2 : sheetAt2) {
                    //獲取工作表列值
                    String stringCellValue1 = row2.getCell(0).getStringCellValue();
                    //判斷車輛款式,獲取字元串位置
                    if (stringCellValue.contains("款") && stringCellValue1.contains("款")) {
                        int i = stringCellValue.indexOf("款");
                        int b = stringCellValue1.indexOf("款");
                        //進行款式截取並比較款式是否一致
                        if (stringCellValue.substring(i - 4, i).equals(stringCellValue1.substring(b - 4, b))) {
                            //採用String裡面的方法進行相似度取值
                            double similarity = StringUtils.getJaroWinklerDistance(stringCellValue, stringCellValue1);
                            //進行相似度比較
                            if (similarity > map1.get("bz")) {
                                //相似度高的替換低的
                                map1.put("bz", similarity);
                                //存放進map集合
                                map2.put(stringCellValue, stringCellValue1);
                            }
                        }
                    }
                }
            }
            return map2;
        }else {
            return null;
        }
    }
}

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • CSS3引入了很多新特性,比如: 1. 選擇器:CSS3引入了新的選擇器,如偽類選擇器、偽元素選擇器等,使得選擇元素更加靈活和精確。 2. 邊框圓角:CSS3允許通過 border-radius 屬性為元素的邊框添加圓角,創建圓形、橢圓形或具有不同角度的矩形邊框。 3. 盒陰影:使用 box-sha ...
  • 在JavaScript中,數組本質上是一種特殊的對象,它的類型值會返回 `object`。 如果我們需要比較兩個數組是否相等,不能像比較基本類型(String、Number、Boolean等)一樣,使用 ` ` (或 `==`) 來判斷,所以如果要比較數組是否相等,需要使用一些特殊方法。關於JS類型 ...
  • 一、約定大於配置 泰思勒定律也被稱為複雜度守恆定律。該定律指出每一個過程都有其固有的複雜性,存在一個臨界點,超過了這個點過程就不能再簡化了,你只能將固有的複雜性從一個地方移動到另外一個地方。 根據這個定律,在做系統設計時,預設會給用戶一個“套餐”,這個套餐會滿足多數人的需求。實在不滿足需求再特殊配置 ...
  • 代理模式是23種設計模式中結構型模式的一種,它的核心是通過代理類來完成其他對象的訪問,降低訪問者和被訪問者的耦合度,也對功能進行了增強。 ...
  • 在日常開發中會經常遇到一些需要非同步定時執行的業務訴求,典型的使用場景如:超時未支付訂單關單、每隔 2h 更新好友排行榜、3.22 日 17 點《xx》劇上線等。目前業務側多基於以下思路來快速搭建一個調度系統,mysql 或者 redis 隊列存儲待執行任務,通過 crontab 定時觸發應用完成“撈... ...
  • # 第01章-準備工作 ## 1、微信支付產品介紹 參考資料:[產品中心 - 微信支付商戶平臺 (qq.com)](https://pay.weixin.qq.com/static/product/product_index.shtml#payment_product) 付款碼支付、JSAPI支付、 ...
  • 某日二師兄參加XXX科技公司的C++工程師開發崗位第20面: > 面試官:C++中支持哪些類型轉換? > > 二師兄:C++支持C風格的類型轉換,併在C++11引入新的關鍵字規範了類型轉換。 > > 二師兄:C++11引入四種新的類型轉換,分別是`static_cast`、`dynamic_cast ...
  • 隨著AI大模型的浪潮席卷全球,如今的AI技術已經顛覆了大家對傳統AI的認識,微軟更是用瀏覽器與搜索引擎上的實踐,證明瞭當今的AI技術具備打破行業格局的能力。 對於我們應用開發者來說,AI基建的建設與競爭是無法參與的,但在AI的應用領域依然大有可為!目前,國內各大科技公司已經陸續推出了各自的AI大模型 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...