Javascript混淆與解混淆的那些事兒

像軟體加密與解密一樣，javascript的混淆與解混淆同屬於同一個範疇。道高一尺，魔高一丈。沒有永恆的黑，也沒有永恆的白。一切都是資本市場驅動行為，現在都流行你能為人解決什麼問題，這個概念。那麼市場究竟能容納多少個能解決這種問題的利益者。JS沒有秘密。其實本人不贊成javascript進行ha... ...

像軟體加密與解密一樣，javascript的混淆與解混淆同屬於同一個範疇。道高一尺，魔高一丈。沒有永恆的黑，也沒有永恆的白。一切都是資本市場驅動行為，現在都流行你能為人解決什麼問題，這個概念。那麼市場究竟能容納多少個能解決這種問題的利益者。JS沒有秘密。

其實本人不贊成javascript進行hash混淆處理，一拖慢運行時速度，二體積大。JS代碼前端可獲取，天生賦予“開源”屬性，都可以在chrome devTools下查看。JS非壓縮性混淆完全違法前端優化準則。

目前網路上可以搜索的JS混淆工具不外乎以下幾種：

eval混淆，也是最早JS出現的混淆加密，據說第一天就被破解，修改一下代碼，alert一下就可以破解了。這種方法從出生的那天就失去了意義。其實JS加密（混淆）是相對於可讀性而言的，其實真正有意義的就是壓縮型混淆uglify這一類，即可減少體重，也可減少可讀性。

但是，也不能排除部分商業源代碼使用hash類型混淆源代碼，比如 miniui 使用的JSA加密, fundebug使用的javascript-obfuscator。

下麵通過代碼來說明 JSA加密和 javascript-obfuscator 的區別：

要混淆的代碼：

function logG(message) {
  console.log('\x1b[32m%s\x1b[0m', message); 
}
function logR(message) {
  console.log('\x1b[41m%s\x1b[0m', message); 
}
logG('logR');
logR('logG');

通過JSA加密混淆後生成的代碼

function o00($){console.log("\x1b[32m%s\x1b[0m",$)}function o01($){console.log("\x1b[41m%s\x1b[0m",$)}o00("logR");o01("logG")

然後再beautifier一下：

function o00($) {
  console.log("\x1b[32m%s\x1b[0m", $)
}

function o01($) {
  console.log("\x1b[41m%s\x1b[0m", $)
}
o00("logR");
o01("logG")

可以發現，其實沒有做什麼什麼修改，只是做了一些變數替換。想還原也比較簡單的。這裡就不拿它來做代表，也沒有什麼人用。

通過javascript-obfuscator混淆後生成的代碼

var _0xd6ac=['[41m%s[0m','logG','log'];(function(_0x203a66,_0x6dd4f4){var _0x3c5c81=function(_0x4f427c){while(--_0x4f427c){_0x203a66['push'](_0x203a66['shift']());}};_0x3c5c81(++_0x6dd4f4);}(_0xd6ac,0x6e));var _0x5b26=function(_0x2d8f05,_0x4b81bb){_0x2d8f05=_0x2d8f05-0x0;var _0x4d74cb=_0xd6ac[_0x2d8f05];return _0x4d74cb;};function logG(_0x4f1daa){console[_0x5b26('0x0')]('[32m%s[0m',_0x4f1daa);}function logR(_0x38b325){console[_0x5b26('0x0')](_0x5b26('0x1'),_0x38b325);}logG('logR');logR(_0x5b26('0x2'));

再beautifier一下：

var _0xd6ac = ['[41m%s[0m', 'logG', 'log'];
(function(_0x203a66, _0x6dd4f4) {
  var _0x3c5c81 = function(_0x4f427c) {
    while (--_0x4f427c) {
      _0x203a66['push'](_0x203a66['shift']());
    }
  };
  _0x3c5c81(++_0x6dd4f4);
}(_0xd6ac, 0x6e));
var _0x5b26 = function(_0x2d8f05, _0x4b81bb) {
  _0x2d8f05 = _0x2d8f05 - 0x0;
  var _0x4d74cb = _0xd6ac[_0x2d8f05];
  return _0x4d74cb;
};

function logG(_0x4f1daa) {
  console[_0x5b26('0x0')]('[32m%s[0m', _0x4f1daa);
}

function logR(_0x38b325) {
  console[_0x5b26('0x0')](_0x5b26('0x1'), _0x38b325);
}
logG('logR');
logR(_0x5b26('0x2'));

這個複雜得多，但是分析一下你會發現，其實多了一個字典，所有方法變數，都有可能存在字典中，調用時先調用字典還原方法名變數再執行。
其實入口都是變數的規則。

字典函數：

var _0xd6ac = ['[41m%s[0m', 'logG', 'log'];
(function(_0x203a66, _0x6dd4f4) {
  var _0x3c5c81 = function(_0x4f427c) {
    while (--_0x4f427c) {
      _0x203a66['push'](_0x203a66['shift']());
    }
  };
  _0x3c5c81(++_0x6dd4f4);
}(_0xd6ac, 0x6e));
var _0x5b26 = function(_0x2d8f05, _0x4b81bb) {
  _0x2d8f05 = _0x2d8f05 - 0x0;
  var _0x4d74cb = _0xd6ac[_0x2d8f05];
  return _0x4d74cb;
};

通過以上發現，我們可以把JS混淆歸結為三類，分別是 eval類型，hash類型，壓縮類型。而壓縮類型，是目前前端性能優化的常用工具，以uglify為代表。

常用的前端壓縮優化工具：

JavaScript:
* babel-minify
* terser
* uglify-js
* uglify-es
* Google Closure Compiler
* YUI Compressor

CSS:
* PostCSS
* clean-css
* CSSO
* YUI Compressor

HTML:
* html-minifier

從工具流(workflow) 來看，不論是 webpack 還是 gulp ，目前javascript最流行工具還是uglify。

相應的解混淆工具：

eval對應的解混淆工具, 隨便百度都可以搜索到，如jspacker
JSA對應的解混淆工具unjsa
javascript-obfuscator對應的解混淆工具crack.js
壓縮類型uglify對應的工具UnuglifyJS，線上版jsnice

解混淆策略其實是依據生成代碼規律編寫，不外乎觀察特征分析，再觀察特征分析，不斷調整。都是手辦眼見功夫。

都沒有什麼難度可言，有的就是耐性。比如javascript-obfuscator對應的解混淆工具可以
分解為N因數問題：

如何查詢function的作用域？
預執行變數替換可能存在類型？
…

如：

var _0xd6ac = ['[41m%s[0m', 'logG', 'log'];
(function(_0x203a66, _0x6dd4f4) {
  var _0x3c5c81 = function(_0x4f427c) {
    while (--_0x4f427c) {
      _0x203a66['push'](_0x203a66['shift']());
    }
  };
  _0x3c5c81(++_0x6dd4f4);
}(_0xd6ac, 0x6e));
var _0x5b26 = function(_0x2d8f05, _0x4b81bb) {
  _0x2d8f05 = _0x2d8f05 - 0x0;
  var _0x4d74cb = _0xd6ac[_0x2d8f05];
  return _0x4d74cb;
};

function logG(_0x4f1daa) {
  console[_0x5b26('0x0')]('[32m%s[0m', _0x4f1daa);
}

function logR(_0x38b325) {
  console[_0x5b26('0x0')](_0x5b26('0x1'), _0x38b325);
}
logG('logR');
logR(_0x5b26('0x2'));

要還原成

function logG(message) {
  console.log('\x1b[32m%s\x1b[0m', message); 
}
function logR(message) {
  console.log('\x1b[41m%s\x1b[0m', message); 
}
logG('logR');
logR('logG');

第一步你總得知道字典函數，然後執行字典函數 _0x5b26('0x0') 還原成 log.

那麼就好辦了，寫代碼的事。
如 https://github.com/jscck/crack.js/blob/master/crack.js

還原後，如何重構代碼，那麼你還得知道代碼生成之前是通過什麼工具打包的webpack? 還是？

如webpack 的各種封裝頭和尾
https://webpack.js.org/configuration/output/#expose-a-variable

(function webpackUniversalModuleDefinition(root, factory) {
  if(typeof exports === 'object' && typeof module === 'object')
    module.exports = factory();
  else if(typeof define === 'function' && define.amd)
    define([], factory);
  else if(typeof exports === 'object')
    exports['MyLibrary'] = factory();
  else
    root['MyLibrary'] = factory();
})(typeof self !== 'undefined' ? self : this, function() {
  return _entry_return_;
});