前不久做了一個優惠劵的分享功能,其中一個功能就是生成一個優惠劵分享短鏈接。生成的短鏈接要求每個鏈接都是唯一的,並且長度儘可能短。在網上查了一下相關的思路,發現了一個不錯的演算法。這個演算法的思路就是用[a-zA-Z0-9]建立一個長度為62的矩陣,然後把矩陣打亂,再生成一個全局唯一的數字,再把這個數字用 ...
前不久做了一個優惠劵的分享功能,其中一個功能就是生成一個優惠劵分享短鏈接。生成的短鏈接要求每個鏈接都是唯一的,並且長度儘可能短。在網上查了一下相關的思路,發現了一個不錯的演算法。這個演算法的思路就是用[a-zA-Z0-9]建立一個長度為62的矩陣,然後把矩陣打亂,再生成一個全局唯一的數字,再把這個數字用矩陣內的元素表示轉換成62進位,生成的鏈接長度最大才11位。所以短鏈接的生成關鍵點就變成瞭如何生成一個全局唯一的數字和實現進位的轉換。
1、生成全局唯一的數字
這本質是一個分散式ID的問題。如果簡單處理的話可以借用redis的incr操作這樣每次取到的ID都是單調遞增且唯一的。另外一種方式是借用mysql,這裡不是借用mysql的主鍵的auto_incr特性。而是每一臺應用來請求時分配一個範圍比如 s1 [100-200], s2 來請求的時候就分配 [201-301],本質是利用樂觀鎖進行一個cas操作。
如果不想藉助外部去生成ID的話,可以用UUID演算法。UUID長度12個位元組組成由,以下幾個部分組成。
- 4個位元組表示的Unix timestamp,
- 3個位元組表示的機器的ID
- 2個位元組表示的進程ID
- 3個位元組表示的計數器
UUID是一類演算法的統稱,具體有不同的實現。優點是每台機器可以獨立產生ID,理論上保證不會重覆,所以天然是分散式的,缺點是生成的ID太長,不僅占用記憶體,而且索引查詢效率低。
還有一個叫Twitter Snowflake演算法,本質上看起來與UUID有些類似。
總的來說redis,mysql解決方案就比較簡單直接可以滿足大部分的場景,如果要保證高性能和高可用的話UUID和Twitter Snowflake演算法就更合適,實現起來相對複雜一些。
2、進位轉換
這個操作就相對簡單了。直接上代碼 ~
/** * 短鏈接生成 */ public class TinyURL { public static final char[] array = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'q', 'w', 'e', 'r', 't', 'y', 'u', 'i', 'o', 'p', 'a', 's', 'd', 'f', 'g', 'h', 'j', 'k', 'l', 'z', 'x', 'c', 'v', 'b', 'n', 'm', 'Q', 'W', 'E', 'R', 'T', 'Y', 'U', 'I', 'O', 'P', 'A', 'S', 'D', 'F', 'G', 'H', 'J', 'K', 'L', 'Z', 'X', 'C', 'V', 'B', 'N', 'M'}; public static Map<Character, Integer> charValueMap = new HashMap<Character, Integer>(); //初始化map static { for (int i = 0; i < array.length; i++) charValueMap.put(array[i], i); } public static void main(String[] args) { for (int i = 0; i < 100; i++) { long number = Long.MAX_VALUE - i; String decimalStr = numberConvertToDecimal(number, 62); System.out.println(number + " 轉換成 " + decimalStr); long toNumber = decimalConvertToNumber(decimalStr, 62); System.out.println(decimalStr + " 轉換成 " + toNumber); } } /** * 把數字轉換成相對應的進位,目前支持(2-62)進位 * * @param number * @param decimal * @return */ public static String numberConvertToDecimal(long number, int decimal) { StringBuilder builder = new StringBuilder(); while (number != 0) { builder.append(array[(int) (number - (number / decimal) * decimal)]); number /= decimal; } return builder.reverse().toString(); } /** * 把進位字元串轉換成相應的數字 * @param decimalStr * @param decimal * @return */ public static long decimalConvertToNumber(String decimalStr, int decimal) { long sum = 0; long multiple = 1; char[] chars = decimalStr.toCharArray(); for (int i = chars.length - 1; i >= 0; i--) { char c = chars[i]; sum += charValueMap.get(c) * multiple; multiple *= decimal; } return sum; } }
這裡面有個小優化就是用charValueMap記錄每個字元對應的數值,這是一個用空間換時間的策略優化,把O(n)的時間降為O(1)。
另外通常我們要記錄短網址與長網址的對應的關係,相對於直接存儲短網址的而言,存儲對應的數值ID會更省空間。