摘要: 高效使用Set! 作者:前端小智 原文: "如何使用 Set 來提高代碼的性能" "Fundebug" 經授權轉載,版權歸原作者所有。 為了保證的可讀性,本文采用意譯而非直譯。 我確信有很多開發人員堅持使用基本的全局對象:數字,字元串,對象,數組和布爾值。對於許多用例,這些都是需要的。 但是 ...
摘要: 高效使用Set!
- 作者:前端小智
- 原文:如何使用 Set 來提高代碼的性能
Fundebug經授權轉載,版權歸原作者所有。
為了保證的可讀性,本文采用意譯而非直譯。
我確信有很多開發人員堅持使用基本的全局對象:數字,字元串,對象,數組和布爾值。對於許多用例,這些都是需要的。 但是如果想讓你的代碼儘可能快速和可擴展,那麼這些基本類型並不總是足夠好。
在本文中,我們將討論JS 中Set
對象如何讓代碼更快— 特別擴展性方便。 Array
和Set
工作方式存在大量的交叉。但是使用Set
會比Array
在代碼運行速度更有優勢。
Set 有何不同
最根本的區別是數組是一個索引集合,這說明數組中的數據值按索引排序。
const arr = [A, B, C, D];
console.log(arr.indexOf(A)); // Result: 0
console.log(arr.indexOf(C)); // Result: 2
相比之下,set
是一個鍵的集合。set
不使用索引,而是使用鍵對數據排序。set
中的元素按插入順序是可迭代的,它不能包含任何重覆的數據。換句話說,set
中的每一項都必須是惟一的。
主要的好處是什麼
set
相對於數組有幾個優勢,特別是在運行時間方面:
- 查看元素:使用
indexOf()
或includes()
檢查數組中的項是否存在是比較慢的。 - 刪除元素:在
Set
中,可以根據每項的的value
來刪除該項。在數組中,等價的方法是使用基於元素的索引的splice()
。與前一點一樣,依賴於索引的速度很慢。 - 保存 NaN:不能使用
indexOf()
或includes()
來查找值NaN
,而Set
可以保存此值。 - 刪除重覆項:
Set
對象只存儲惟一的值,如果不想有重覆項存在,相對於數組的一個顯著優勢,因為數組需要額外的代碼來處理重覆。
時間複雜度?
數組用來搜索元素的方法時間複雜度為0(N)
。換句話說,運行時間的增長速度與數據大小的增長速度相同。
相比之下,Set
用於搜索、刪除和插入元素的方法的時間複雜度都只有O(1)
,這意味著數據的大小實際上與這些方法的運行時間無關。
Set 究竟有多快?
雖然運行時間可能會有很大差異,具體取決於所使用的系統,所提供數據的大小以及其他變數,但我希望我的測試結果能夠讓你真實地瞭解Set
的速度。 我將分享三個簡單的測試和我得到的結果。
準備測試
在運行任何測試之前,創建一個數組和一個 Set,每個數組和 Set 都有100萬個元素。為了簡單起見,我從0
開始,一直數到999999
。
let arr = [], set = new Set(), n = 1000000;
for (let i = 0; i < n; i++) {
arr.push(i);
set.add(i);
}
測試1:查找元素
我們搜索數字123123
let result;
console.time('Array');
result = arr.indexOf(123123) !== -1;
console.timeEnd('Array');
console.time('Set');
result = set.has(123123);
console.timeEnd('Set');
- Array: 0.173ms
- Set: 0.023ms
Set
速度快了7.54
倍
代碼部署後可能存在的BUG沒法實時知道,事後為瞭解決這些BUG,花了大量的時間進行log 調試,這邊順便給大家推薦一個好用的BUG監控工具 Fundebug。
測試2:添加元素
console.time('Array');
arr.push(n);
console.timeEnd('Array');
console.time('Set');
set.add(n);
console.timeEnd('Set');
- Array: 0.018ms
- Set: 0.003ms
Set
速度快了6.73
倍
測試3:刪除元素
最後,刪除一個元素,由於數組沒有內置方法,首先先創建一個輔助函數:
const deleteFromArr = (arr, item) => {
let index = arr.indexOf(item);
return index !== -1 && arr.splice(index, 1);
};
這是測試的代碼:
console.time('Array');
deleteFromArr(arr, n);
console.timeEnd('Array');
console.time('Set');
set.delete(n);
console.timeEnd('Set');
- Array: 1.122ms
- Set: 0.015ms
Set
速度快了74.13
倍
總的來說,我們可以看到,使用Set
極大地改善運行時間。再來看看一些Set
有用的實際例子。
案例1:從數組中刪除重覆的值
如果想快速地從數組中刪除重覆的值,可以將其轉換為一個 Set
。這是迄今為止過濾惟一值最簡潔的方法:
const duplicateCollection = ['A', 'B', 'B', 'C', 'D', 'B', 'C'];
// 將數組轉換為 Set
let uniqueCollection = new Set(duplicateCollection);
console.log(uniqueCollection) // Result: Set(4) {"A", "B", "C", "D"}
// 值保存在數組中
let uniqueCollection = [...new Set(duplicateCollection)];
console.log(uniqueCollection) // Result: ["A", "B", "C", "D"]
案例2:谷歌面試問題
問題:
給定一個整數無序數組和變數 sum
,如果存在數組中任意兩項和使等於 sum
的值,則返回true
。否則,返回false
。例如,數組[3,5,1,4]
和 sum = 9
,函數應該返回true
,因為4 + 5 = 9
。
解答
解決這個問題的一個很好的方法是遍曆數組,創建 Set
保存相對差值。
當我們遇到3
時,我們可以把6
加到Set
中, 因為我們知道我們需要找到9
的和。然後,每當我們接觸到數組中的新值時,我們可以檢查它是否在 Set
中。當遇到5
時,在 Set 加上4。最後,當我們最終遇到4
時,可以在Set
中找到它,就返回true
。
const findSum = (arr, val) => {
let searchValues = new Set();
searchValues.add(val - arr[0]);
for (let i = 1, length = arr.length; i < length; i++) {
let searchVal = val - arr[i];
if (searchValues.has(arr[i])) {
return true;
} else {
searchValues.add(searchVal);
}
};
return false;
};
簡潔的版本:
const findSum = (arr, sum) =>
arr.some((set => n => set.has(n) || !set.add(sum - n))(new Set));
因為Set.prototype.has()
的時間複雜度僅為O(1)
,所以使用 Set 來代替數組,最終使整個解決方案的線性運行時為O(N)
。
如果使用 Array.prototype.indexOf()
或Array.prototype.includes()
,它們的時間複雜度都為 O(N),則總運行時間將為O(N²)
,慢得多!
參考
關於Fundebug
Fundebug專註於JavaScript、微信小程式、微信小游戲、支付寶小程式、React Native、Node.js和Java線上應用實時BUG監控。 自從2016年雙十一正式上線,Fundebug累計處理了10億+錯誤事件,付費客戶有陽光保險、核桃編程、荔枝FM、掌門1對1、微脈、青團社等眾多品牌企業。歡迎大家免費試用!