Javascript混淆與解混淆的那些事兒

来源:https://www.cnblogs.com/icai/archive/2019/04/03/10648282.html
-Advertisement-
Play Games

像軟體加密與解密一樣,javascript的混淆與解混淆同屬於同一個範疇。道高一尺,魔高一丈。沒有永恆的黑,也沒有永恆的白。一切都是資本市場驅動行為,現在都流行你能為人解決什麼問題,這個概念。那麼市場究竟能容納多少個能解決這種問題的利益者。JS沒有秘密。 其實本人不贊成javascript進行ha... ...


像軟體加密與解密一樣,javascript的混淆與解混淆同屬於同一個範疇。道高一尺,魔高一丈。沒有永恆的黑,也沒有永恆的白。一切都是資本市場驅動行為,現在都流行你能為人解決什麼問題,這個概念。那麼市場究竟能容納多少個能解決這種問題的利益者。JS沒有秘密。

其實本人不贊成javascript進行hash混淆處理,一拖慢運行時速度,二體積大。JS代碼前端可獲取,天生賦予“開源”屬性,都可以在chrome devTools下查看。JS非壓縮性混淆完全違法前端優化準則。

目前網路上可以搜索的JS混淆工具不外乎以下幾種:

eval混淆,也是最早JS出現的混淆加密,據說第一天就被破解,修改一下代碼,alert一下就可以破解了。這種方法從出生的那天就失去了意義。其實JS加密(混淆)是相對於可讀性而言的,其實真正有意義的就是壓縮型混淆uglify這一類,即可減少體重,也可減少可讀性。

但是,也不能排除部分商業源代碼使用hash類型混淆源代碼,比如 miniui 使用的JSA加密, fundebug使用的javascript-obfuscator

下麵通過代碼來說明 JSA加密 和 javascript-obfuscator 的區別:

要混淆的代碼:

function logG(message) {
  console.log('\x1b[32m%s\x1b[0m', message); 
}
function logR(message) {
  console.log('\x1b[41m%s\x1b[0m', message); 
}
logG('logR');
logR('logG');

通過JSA加密混淆後生成的代碼

function o00($){console.log("\x1b[32m%s\x1b[0m",$)}function o01($){console.log("\x1b[41m%s\x1b[0m",$)}o00("logR");o01("logG")

然後再beautifier一下:

function o00($) {
  console.log("\x1b[32m%s\x1b[0m", $)
}

function o01($) {
  console.log("\x1b[41m%s\x1b[0m", $)
}
o00("logR");
o01("logG")

可以發現,其實沒有做什麼什麼修改,只是做了一些變數替換。想還原也比較簡單的。這裡就不拿它來做代表,也沒有什麼人用。

通過javascript-obfuscator混淆後生成的代碼

var _0xd6ac=['%s','logG','log'];(function(_0x203a66,_0x6dd4f4){var _0x3c5c81=function(_0x4f427c){while(--_0x4f427c){_0x203a66['push'](_0x203a66['shift']());}};_0x3c5c81(++_0x6dd4f4);}(_0xd6ac,0x6e));var _0x5b26=function(_0x2d8f05,_0x4b81bb){_0x2d8f05=_0x2d8f05-0x0;var _0x4d74cb=_0xd6ac[_0x2d8f05];return _0x4d74cb;};function logG(_0x4f1daa){console[_0x5b26('0x0')]('%s',_0x4f1daa);}function logR(_0x38b325){console[_0x5b26('0x0')](_0x5b26('0x1'),_0x38b325);}logG('logR');logR(_0x5b26('0x2'));

beautifier一下:

var _0xd6ac = ['%s', 'logG', 'log'];
(function(_0x203a66, _0x6dd4f4) {
  var _0x3c5c81 = function(_0x4f427c) {
    while (--_0x4f427c) {
      _0x203a66['push'](_0x203a66['shift']());
    }
  };
  _0x3c5c81(++_0x6dd4f4);
}(_0xd6ac, 0x6e));
var _0x5b26 = function(_0x2d8f05, _0x4b81bb) {
  _0x2d8f05 = _0x2d8f05 - 0x0;
  var _0x4d74cb = _0xd6ac[_0x2d8f05];
  return _0x4d74cb;
};

function logG(_0x4f1daa) {
  console[_0x5b26('0x0')]('%s', _0x4f1daa);
}

function logR(_0x38b325) {
  console[_0x5b26('0x0')](_0x5b26('0x1'), _0x38b325);
}
logG('logR');
logR(_0x5b26('0x2'));

這個複雜得多,但是分析一下你會發現,其實多了一個字典,所有方法變數,都有可能存在字典中,調用時先調用字典還原方法名變數再執行。 
其實入口都是變數的規則。

字典函數:

var _0xd6ac = ['%s', 'logG', 'log'];
(function(_0x203a66, _0x6dd4f4) {
  var _0x3c5c81 = function(_0x4f427c) {
    while (--_0x4f427c) {
      _0x203a66['push'](_0x203a66['shift']());
    }
  };
  _0x3c5c81(++_0x6dd4f4);
}(_0xd6ac, 0x6e));
var _0x5b26 = function(_0x2d8f05, _0x4b81bb) {
  _0x2d8f05 = _0x2d8f05 - 0x0;
  var _0x4d74cb = _0xd6ac[_0x2d8f05];
  return _0x4d74cb;
};

通過以上發現,我們可以把JS混淆歸結為三類,分別是 eval類型,hash類型,壓縮類型。而壓縮類型,是目前前端性能優化的常用工具,以uglify為代表。

常用的前端壓縮優化工具:

JavaScript: 
babel-minify 
terser 
uglify-js 
uglify-es 
Google Closure Compiler 
YUI Compressor

CSS: 
PostCSS 
clean-css 
CSSO 
YUI Compressor

HTML: 
html-minifier

從工具流(workflow) 來看,不論是 webpack 還是 gulp ,目前javascript最流行工具還是uglify。

相應的解混淆工具:

解混淆策略其實是依據生成代碼規律編寫,不外乎觀察特征分析,再觀察特征分析,不斷調整。都是手辦眼見功夫。

都沒有什麼難度可言,有的就是耐性。比如javascript-obfuscator對應的解混淆工具可以 
分解為N因數問題:

如何查詢function的作用域? 
預執行變數替換可能存在類型? 

如:

var _0xd6ac = ['%s', 'logG', 'log'];
(function(_0x203a66, _0x6dd4f4) {
  var _0x3c5c81 = function(_0x4f427c) {
    while (--_0x4f427c) {
      _0x203a66['push'](_0x203a66['shift']());
    }
  };
  _0x3c5c81(++_0x6dd4f4);
}(_0xd6ac, 0x6e));
var _0x5b26 = function(_0x2d8f05, _0x4b81bb) {
  _0x2d8f05 = _0x2d8f05 - 0x0;
  var _0x4d74cb = _0xd6ac[_0x2d8f05];
  return _0x4d74cb;
};

function logG(_0x4f1daa) {
  console[_0x5b26('0x0')]('%s', _0x4f1daa);
}

function logR(_0x38b325) {
  console[_0x5b26('0x0')](_0x5b26('0x1'), _0x38b325);
}
logG('logR');
logR(_0x5b26('0x2'));

要還原成

function logG(message) {
  console.log('\x1b[32m%s\x1b[0m', message); 
}
function logR(message) {
  console.log('\x1b[41m%s\x1b[0m', message); 
}
logG('logR');
logR('logG');

第一步你總得知道字典函數,然後執行字典函數 _0x5b26('0x0') 還原成 log.

那麼就好辦了,寫代碼的事。 
如 https://github.com/jscck/crack.js/blob/master/crack.js

還原後,如何重構代碼,那麼你還得知道代碼生成之前是通過什麼工具打包的webpack? 還是?

如webpack 的各種封裝頭和尾 
https://webpack.js.org/configuration/output/#expose-a-variable

(function webpackUniversalModuleDefinition(root, factory) {
  if(typeof exports === 'object' && typeof module === 'object')
    module.exports = factory();
  else if(typeof define === 'function' && define.amd)
    define([], factory);
  else if(typeof exports === 'object')
    exports['MyLibrary'] = factory();
  else
    root['MyLibrary'] = factory();
})(typeof self !== 'undefined' ? self : this, function() {
  return _entry_return_;
});

假如再深入一點,可能會涉及到JS語法解釋器, AST抽象語法樹

目前涉及到 JS語法解釋器, AST抽象語法樹的功能如下:

prepackesprimababel

或者可以閱讀《編程語言實現模式》,涉及到 antlr4

當然也可以通過esprima等工具來做解混淆,只是工作量大一點,值不值的問題。

對於未來,JS商業源碼加密的方向可能webassembly,先在服務端編譯成wasm,源碼就能真正的閉源。

有人的地方就有路,有混淆的地方就有解混淆,目前機器學習編程響應的解混淆工具也做的相當出色,比如

Secure, Reliable, and Intelligent Systems Lab

Machine Learning for Programming 產品 
nice2predictjsnice … 
查看 https://www.sri.inf.ethz.ch/research/plml

拓展參考

AST抽象語法樹

為什麼額外說一下AST抽象語法樹,因為你可以 input-> ast -> output Anything。

比如你jsx轉換小程式模版語法,這樣你就可以用react語法來寫小程式,如Taro。 
mpvue, wepy, postcss …… 這些都是通過AST進行構建轉換的工具,es6 -> es5, babel 都是使用AST。

AST抽象語法樹大致流程:

Input 生成 AST tree

然後通過AST類型斷言進行相應的轉換

http://esprima.org/demo/parse.html

反編譯工具全集

小程式

https://github.com/qwerty472123/wxappUnpacker

推薦.Net、C# 逆向反編譯四大工具利器

https://www.cnblogs.com/ldc218/p/8945892.html

2018年支持java8的Java反編譯工具彙總 
https://blog.csdn.net/yannqi/article/details/80847354

原文:http://blog.w3cub.com/blog/2019/04/01/js-confusion/


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、CSS是什麼? 它是一種用來表現HTML(標準通用標記語言的一個應用)或XML(標準通用標記語言的一個子集)等文件樣式的電腦語言。CSS為HTML標記語言提供了一種樣式描述,定義了其中元素的顯示方式。CSS在Web設計領域是一個突破。利用它可以實現修改一個小的樣式更新與之相關的所有頁面元素。 ...
  • 我們在寫webpack配置文件的時候,應該有註意到經常用到loader這個配置項,那麼loader是用來做什麼的呢? loader其實是用來將源文件經過轉化處理之後再輸出新文件。 如果是數組形式的話,它的執行順序是相反的,最後一個loader最早被調用,下一個loader傳入的是上一個loader的 ...
  • 什麼是正則表達式: 1、正則表達式是由一個字元序列形成的搜索模式。 2、當你在文本中搜索數據時,你可以用搜索模式來描述你要查詢的內容。 3、正則表達式可以是一個簡單的字元,或一個更複雜的模式。 4、正則表達式可用於所有文本搜索和文本替換的操作。 5、JavaScript 中的正則表達式用 RegEx ...
  • 今天在這篇文章里,會對 vue-cli 的功能做個詳細的整理,把 vue-cli 所有的功能都列出來。註:這個是官網連接:https://cli.vuejs.org/zh/guide/ ,建議多看細看不但要看還要多想,這裡的介紹才是最全最準確的。①.vue-cli 是什麼?vue-cli 又稱為vu ...
  • 一,前言 我是剛學Vue的菜鳥,在使用過程中需要用到日曆控制項,由於項目中原來是用jQuery寫的,因此用了bootstarp的日曆控制項,但是配合Vue實在有點蛋疼,不夠優雅…… 於是網上搜了好久找到了Vue2-Calendar,不用說,挺好用的,但是同時也發現這個組件有些問題,有些功能挺不符合我們的 ...
  • (本篇博客沒有什麼參考價值,只用於自己未來複習.) 說白了就是通過“父親”實現非同步 代碼: <!DOCTYPE html> <html> <head> <script src="/jquery/jquery-1.11.1.min.js"></script> <script type="text/ja ...
  • 1.什麼是token token的意思是“令牌”,是服務端生成的一串字元串,作為客戶端進行請求的一個標識。 token是在服務端產生的。如果前端使用用戶名和密碼向服務端發送請求認證,服務端認證成功,那麼在服務端會返回token給前端。 前端可以在每次請求的時候帶上token證明自己的合法地位。如果t ...
  • 最近再做項目的時候(移動端),遇到了兩個小問題,一個是ios端鍵盤不回彈的問題(微信瀏覽器),另一個是ios輸入游標位置問題。首先看第二個問題: 就是點擊一個按鈕,要把輸入框裡面原來的內容加上一些固定的內容,然後一起輸出到輸入框。本來這個需求是很簡單的,但是遇到一個問題,就是點擊玩這個按鈕之後,io ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...