ThinkSNS+ 是如何計算字元顯示長度的

来源:https://www.cnblogs.com/thinkSNS/archive/2019/06/17/11039482.html
-Advertisement-
Play Games

什麼是ThinkSNS+ ThinkSNS(簡稱TS),一款全平臺綜合性社交系統,目前最新版本為ThinkSNS+、ThinkSNS V4 ThinkSNS【簡】。 今天我們來聊一下可能很多人都會頭疼的東西:顯示長度。 需求是這樣的,在字元的顯示上,兩個英文單詞才占一個中文或者其他語言的顯示長度。如 ...


什麼是ThinkSNS+

  ThinkSNS(簡稱TS),一款全平臺綜合性社交系統,目前最新版本為ThinkSNS+、ThinkSNS V4 ThinkSNS【簡】。

今天我們來聊一下可能很多人都會頭疼的東西:顯示長度。

 

需求是這樣的,在字元的顯示上,兩個英文單詞才占一個中文或者其他語言的顯示長度。如下:

ab
哈
?

上面排的是兩個英文字母,一個漢字,一個Emoji。你會發現,在顯示上占的寬度是一致的。一些設計上為了好看也要求有這樣的處理。

例如,我們的用戶名需求是最多12個非單位元組字元或者24個單位元組字元的需求也可以混合排的需求,我們寫後端不得不處理這樣的驗證了。

需求規則是  /^[a-zA-Z_\x7f-\xff][a-zA-Z0-9_\x7f-\xff]*$/

在ThinkSNS+中,為了能把這部分驗證公用,所以選擇使用自定義驗證規則。我們先說下計算的實現思路吧!

首先,就算是mb_strlen也沒法準確的獲取多位元組字元和單子節字元混合在一起的長度,網上有個說法,漢字占三個位元組,英文數組半形符號占一個位元組,所以:

(mb_strlen($str) + strleng($str)) / 2

用這個方法可以得到單位元組占0.5多位元組占1的計算。但是以中文為例,只有兩萬個漢字才是這種情況,還有六萬多漢字是四個,其次,emoji也是四個位元組。根本無法準確的計算。

好在在無意間發現一個奇怪的東西str_word_count 這個函數計算非英文單詞外是除了符號例如中文就是按照漢字個數算的,emoji也是同理。

發現這個以後,咱們就好辦了。我們吧用戶名中的 [a-aA-Z0-9_] 剔除掉,單獨計算不就是我們要的驗證長度了嗎?

所以,首先我們用:

preg_match_all('/[a-zA-Z0-9_]/', $value, $single);
$single = count($single[0]) / 2;

方式單獨計算出單位元組字元的顯示長度,再用:

$double = str_word_count(preg_replace('([a-zA-Z0-9_])', '', $value));

方式計算出多位元組的長度,最後:

$length = $single + $double;

就得出了顯示長度,實現了,最後封裝成驗證規則:

Validator::extend('display_length', function ($attribute, $value, array $parameters) {
                        if (empty($parameters)) {
                throw new \InvalidArgumentException('Parameters must be passed');
            }

            $min = 0;
            if (count($parameters) === 1) {
                list($max) = $parameters;
            } elseif (count($parameters) >= 2) {
                list($min, $max) = $parameters;
            }

            if (! isset($max) || $max < $min) {
                throw new \InvalidArgumentException('The parameters passed are incorrect');
            }

            // 計算單位元組.
            preg_match_all('/[a-zA-Z0-9_]/', $value, $single);
            $single = count($single[0]) / 2;

            // 多子節長度.
            $double = str_word_count(preg_replace('([a-zA-Z0-9_])', '', $value));

                        // 得出最終計算字元的長度
            $length = $single + $double;

            return $length >= $min && $length <= $max;
});

代碼是原型代碼,還沒有進行優化,之後我們只要按照下麵的方式用:

$rules = [
    'inputKey' => 'display_length:5', // 表示 0 - 5 顯示長度
    ‘inputkey2’ => 'display_length:4,12' // 表示顯示長度為 4 - 12
];

現在就很好的解決了這個需求。

我們很樂意,將基於 Laravel 的 ThinkSNS+ 產品開發中的技術解決方案分享給大家,也希望喜歡的朋友能給國內開源產品一點點的支持。

往期研發日記回顧:

《ThinkSNS+基於 Laravel master 分支【研發日記一】》

《ThinkSNS+研發中前端的抉擇(webpack/Vue)踩坑日記【研發日記二】》

《基於 Laravel Route 的 ThinkSNS+ Component【研發日記三】》

《如何做到 Laravel 配置可以網站後臺配置【研發日記四】》

 

開源代碼倉庫:

GitHub:https://github.com/zhiyicx/thinksns-plus(點擊star,每日關註開發動態。)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Spring 團隊開源 nohttp 項目,用以查找、替換和阻止 http:// 的使用。 項目是為了在可能使用 https:// 的情況下不使用到 http://,確保不會發生中間人攻擊。Spring Security、Session 和 LDAP 項目負責人 ROB WINCH 指出,Sprin ...
  • ​ (我是封面) 題外話 最近半個月陸續寫了一些研發的文章,有spring boot,docker,zookeeper等示例,感興趣的可以點菜單去看看。雖然一直對技術手癢癢,但是這個月迫於工作回歸主業產品了,文章也會全部和產品相關。 上周末去參加了一個產品總監的培訓(主要原因:一方面是在家帶娃真的太 ...
  • 繼https://www.cnblogs.com/tk55/p/11043541.html server.xml 裡面保持不變,具體參數參考文檔 rule.xml 可以分區演算法,可以暫且不要,或改為下麵都。 schema.xml 運行結果 查詢一次 查詢第二次 寫入數據 ...
  • 在上次的文章中,我們通過層層引導,已經知道了迭代器模式的由來。現在我們再好好總結下。 關於 迭代器模式 ,你所需要知道的第一件事情,就是它依賴於一個名為迭代器的介面。這是一個可能的迭代器的介面: 現在,我們一旦有了這個介面,就可以為各種對象集合實現迭代器:數組、列表、散列表...如果我麽想要為數組實 ...
  • 報錯: Error starting ApplicationContext. To display the conditions report re-run your application with 'debug' enabled. 2019-06-18 08:39:28.643 ERROR 23 ...
  • 在開發web應用中,有兩種模式: 1、前後端分離。 2、前後端不分離。 一、前後端不分離 在前後端不分離的應用模式中,前端頁面看到的效果是有後端控制的,由後端渲染頁面或重定向,也就是後端需要控制前端的展示,前端與後端的耦合度很高 這種應用模式比較適合純網頁應用,但是當後端對接app時,app可能不需 ...
  • 01 前言 在互聯網飛速發展的時代,各大互聯網公司正在進行激烈的競爭,業務模式也在不斷的擴張,這種現狀使得目前各大公司的架構系統面臨著極大的挑戰,而對於我們普通的軟體開發者而言,如果你僅僅瞭解過一些關於SSH、SSM這些框架組合的知識,熟悉幾種簡單的單機系統、業務系統,而沒有實踐過dubbo、red ...
  • ThinkSNS是什麼? ThinkSNS(簡稱TS),一款全平臺綜合性社交系統,目前最新版本為ThinkSNS+、ThinkSNS V4 ThinkSNS【簡】。 看了Taylor Otwell發表的Package Auto-Discovery In Laravel 5.5第一反應是 為啥。。。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...