Oracle和達夢:相似度函數:UTL

来源:https://www.cnblogs.com/kakarotto-chen/archive/2023/10/09/17752256.html
-Advertisement-
Play Games

Oracle和達夢的:相似度函數:UTL 函數:UTL_MATCH.edit_distance_similarity UTL_MATCH.edit_distance_similarity是Oracle資料庫中的一個函數,用於計算兩個字元串之間的相似度。它基於編輯距離演算法,該演算法用於衡量兩個字元串之間 ...


Oracle和達夢的:相似度函數:UTL

函數:UTL_MATCH.edit_distance_similarity

  • UTL_MATCH.edit_distance_similarity是Oracle資料庫中的一個函數,用於計算兩個字元串之間的相似度。它基於編輯距離演算法,該演算法用於衡量兩個字元串之間的相似程度。

  • 編輯距離是通過計算將一個字元串轉換為另一個字元串所需的最少編輯操作次數來衡量的。這些編輯操作可以是插入、刪除或替換字元。

  • 函數UTL_MATCH.edit_distance_similarity返回一個介於0和100之間的相似度分數,表示兩個字元串之間的相似程度,其中0表示完全不相似100表示完全相似。

  • 通過使用UTL_MATCH.edit_distance_similarity函數,您可以比較兩個字元串的相似程度,並根據需要進行進一步的處理或決策。例如,您可以在搜索引擎中使用它來提供與用戶查詢相關的最佳匹配結果,或者在數據清洗過程中使用它來查找相似的字元串併進行合併或去重操作。

使用

1、第一個參數是要匹配的字元串,第二個參數是要與之進行匹配的字元串

SELECT UTL_MATCH.edit_distance_similarity ('param1', 'param2') AS similarity 
  • 返回:84

☆2、第一個參數可以是查詢表的列,您可以將表的列名作為第一個參數傳遞給該函數,以計算該列中每個值與指定字元串之間的相似度。

SELECT UTL_MATCH.edit_distance_similarity (列名, '6') AS similarity
SELECT UTL_MATCH.edit_distance_similarity ("列名", '6') AS similarity

實踐

  • 查詢表TABLE_1的C2_VARCHAR2欄位的值和6匹配的相似度,並且取相似度大於2的值
SELECT
  *
FROM
  (
  SELECT
    UTL_MATCH.edit_distance_similarity (C2_VARCHAR2, '6') AS similarity
  FROM
    TABLE_1
  ORDER BY similarity DESC) AS a
WHERE
  similarity >= 2

返回:
image


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一起學習下架構的視角。 架構的視角 在筆者的知識體系中,實際上將架構分為業務架構、應用架構、雲基礎架構這幾大類,業務架構主要著眼於控制業務的複雜性,基礎架構著眼於解決分散式系統中存在的一系列問題。無論何種架構,都希望能實現系統的可變的同時保障業務的高可用。 很多時候架構的視角/分類沒有明顯的邊界,通 ...
  • 一、項目地址 https://github.com/LinFeng-BingYi/DailyAccountBook 二、新增 1. 在表格中設置選項列表,讓用戶更快地編輯動賬記錄 1.1 功能詳述 為表格中以下欄位設置選項列表: 1. 需求強度(由"基本需求"更名) 溫飽:基本維持生存且不鋪張浪費的 ...
  • Python裝飾器是一種語法糖,用於在不改變原有函數代碼的情況下,為函數添加額外的功能。裝飾器本質上是一個函數,它接收一個函數作為參數,並返回一個新的函數,通常使用@語法糖來應用裝飾器。 1.裝飾器本質是一個函數,可稱之為函數裝飾器; 2.裝飾器也是一個閉包,即在非全局範圍內定義的函數可以引用其外圍... ...
  • Java網路編程基於TCP/UDP協議的基礎之上,TCP/IP協議是一個協議簇。裡面包括很多協議的,UDP只是其中的一個, 之所以命名為TCP/IP協議,因為TCP、IP協議是兩個很重要的協議,就用他兩命名了。那麼首先我們先介紹一下TCP和UDP的特點: 1.TCP(Transmission Con ...
  • 目錄前言介紹舉例: 前言 不錯麼 內容參考 https://zh.cppreference.com/w/cpp/ranges Chatjpt 總結註意點: 確保你的C++編譯器支持C++20標準 包含 ranges 頭文件 views的操作是惰性的,它們不會立即執行,而是在需要時計算。這意味著你可以 ...
  • 一、安裝python 官網 下載python3.9及以上版本 二、安裝playwright playwright是微軟公司2020年初發佈的新一代自動化測試工具,相較於目前最常用的Selenium,它僅用一個API即可自動執行Chromium、Firefox、WebKit等主流瀏覽器自動化操作。 ( ...
  • Oracle和達夢:LISTAGG連接查詢結果 LISTAGG介紹 使用LISTAGG函數,您可以將多行數據連接成一個字元串,並指定分隔符進行分隔。這在需要將多行數據合併為單個字元串的情況下非常有用,例如將多個值合併為逗號分隔的列表。 函數介紹 LISTAGG(column, delimiter) ...
  • 基於java藥品藥店藥房信息系統設計與實現,可適用於藥店管理系統,藥店系統,藥品管理系統,藥店出入庫管理系統,藥店買藥,線上購買藥品系統,線上藥店管理系統,線上藥店系統,藥品信息管理系統,藥品入庫管理、藥品出庫管理,醫療管理系統,醫療系統等等 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...