帶你揭開神秘的Javascript AST面紗之Babel AST 四件套的使用方法

来源:https://www.cnblogs.com/Jcloud/archive/2023/04/12/17308807.html
-Advertisement-
Play Games

作者:京東零售 周明亮 寫在前面 這裡我們初步提到了一些基礎概念和應用: 分析器 抽象語法樹 AST AST 在 JS 中的用途 AST 的應用實踐 有了初步的認識,還有常規的代碼改造應用實踐,現在我們來詳細說說使用 AST, 如何進行代碼改造? Babel AST 四件套的使用方法 其實在解析 A ...


作者:京東零售 周明亮

寫在前面

這裡我們初步提到了一些基礎概念和應用:

  • 分析器
  • 抽象語法樹 AST
  • AST 在 JS 中的用途
  • AST 的應用實踐

有了初步的認識,還有常規的代碼改造應用實踐,現在我們來詳細說說使用 AST, 如何進行代碼改造?

Babel AST 四件套的使用方法

其實在解析 AST 這個工具上,有很多可以使用,上文我們已經提到過了。對於 JS 的 AST 大家已經形成了統一的規範命名,唯一不同的可能是,不同工具提供的詳細程度不一樣,有的可能會額外提供額外方法或者屬性。

所以,在選擇工具上,大家按照各自喜歡選擇即可,這裡我們選擇了babel這個老朋友。

初識 Babel

我相信在這個前端框架頻出的時代,應該都知道babel的存在。 如果你還沒聽說過babel,那麼我們通過它的相關文檔,繼續深入學習一下。

因為,它在任何框架裡面,我們都能看到它的影子。

  • Babel JS 官網
  • Babel JS Github

作為使用最廣泛的 JS 編譯器,他可以用於將採用 ECMAScript 2015+ 語法編寫的代碼轉換為向後相容的 JavaScript 語法,以便能夠運行在當前和舊版本的瀏覽器或其他環境中。

而它能夠做到向下相容或者代碼轉換,就是基於代碼解析和改造。接下來,我們來說說:如何使用@babel/core裡面的核心四件套:@babel/parser、@babel/traverse、@babel/types及@babel/generator。

1. @babel/parser

@babel/parser 核心代碼解析器,通過它進行詞法分析及語法分析過程,最終轉換為我們提到的 AST 形式。

假設我們需要讀取React中index.tsx文件中代碼內容,我們可以使用如下代碼:

const { parse } = require("@babel/parser")

// 讀取文件內容
const fileBuffer = fs.readFileSync('./code/app/index.tsx', 'utf8');
// 轉換位元組 Buffer
const fileCode = fileBuffer.toString();
// 解析內容轉換為 AST 對象
const codeAST = parse(fileCode, {
  // parse in strict mode and allow module declarations
  sourceType: "module",
  plugins: [
    // enable jsx and typescript syntax
    "jsx",
    "typescript",
  ],
});

當然我不僅僅只讀取React代碼,我們甚至可以讀取Vue語法。它也有對應的語法分析器,比如:@vue/compiler-dom。

此外,通過不同的參數傳入 options,我們可以解析各種各樣的代碼。如果,我們只是讀取普通的.js文件,我們可以不使用任何插件屬性即可。

const codeAST = parse(fileCode, {
  // parse in strict mode and allow module declarations
  sourceType: "module"
});

通過上述的代碼轉換,我們就可以得到一個標準的 AST 對象。在上一篇文章中,已做詳細分析,在這裡不在展開。比如:

// 原代碼
const me = "我"
function write() {
  console.log("文章")
}

// 轉換後的 AST 對象
const codeAST = {
  "type": "File",
  "errors": [],
  "program": {
    "type": "Program",
    "sourceType": "module",
    "interpreter": null,
    "body": [
      {
        "type": "VariableDeclaration",
        "declarations": [
          {
            "type": "VariableDeclarator",
            "id": {
              "type": "Identifier",
              "name": "me"
            },
            "init": {
              "type": "StringLiteral",
              "extra": {
                "rawValue": "我",
                "raw": "\"我\""
              },
              "value": "我"
            }
          }
        ],
        "kind": "const"
      },
      {
        "type": "FunctionDeclaration",
        "id": {
          "type": "Identifier",
          "name": "write"
        },
        "generator": false,
        "async": false,
        "params": [],
        "body": {
          "type": "BlockStatement",
          "body": [
            {
              "type": "ExpressionStatement",
              "expression": {
                "type": "CallExpression",
                "callee": {
                  "type": "MemberExpression",
                  "object": {
                    "type": "Identifier",
                    "computed": false,
                    "property": {
                      "type": "Identifier",
                      "name": "log"
                    }
                  },
                  "arguments": [
                    {
                      "type": "StringLiteral",
                      "extra": {
                        "rawValue": "文章",
                        "raw": "\"文章\""
                      },
                      "value": "文章"
                    }
                  ]
                }
              }
            }
          ]
        }
      }
    ]
  }
}

2. @babel/traverse

當我們拿到一個標準的 AST 對象後,我們要操作它,那肯定是需要進行樹結構遍歷。這時候,我們就會用到 @babel/traverse 。

比如我們得到 AST 後,我們可以進行遍歷操作:

const { default: traverse } = require('@babel/traverse');

// 進入結點
const onEnter = pt => {
   // 進入當前結點操作
   console.log(pt)
}
// 退出結點
const onExit = pe => {
  // 退出當前結點操作
}
traverse(codeAST, { enter: onEnter, exit: onExit })

那麼我們訪問的第一個結點,列印出pt的值,是怎樣的呢?

// 已省略部分無效值
<ref *1> NodePath {
  contexts: [
    TraversalContext {
      queue: [Array],
      priorityQueue: [],
      ...
    }
  ],
  state: undefined,
  opts: {
    enter: [ [Function: onStartVist] ],
    exit: [ [Function: onEndVist] ],
    _exploded: true,
    _verified: true
  },
  _traverseFlags: 0,
  skipKeys: null,
  parentPath: null,
  container: Node {
    type: 'File',
    errors: [],
    program: Node {
      type: 'Program',
      sourceType: 'module',
      interpreter: null,
      body: [Array],
      directives: []
    },
    comments: []
  },
  listKey: undefined,
  key: 'program',
  node: Node {
    type: 'Program',
    sourceType: 'module',
    interpreter: null,
    body: [ [Node], [Node] ],
    directives: []
  },
  type: 'Program',
  parent: Node {
    type: 'File',
    errors: [],
    program: Node {
      type: 'Program',
      sourceType: 'module',
      interpreter: null,
      body: [Array],
      directives: []
    },
    comments: []
  },
  hub: undefined,
  data: null,
  context: TraversalContext {
    queue: [ [Circular *1] ],
    priorityQueue: [],
    ...
  },
  scope: Scope {
    uid: 0,
    path: [Circular *1],
    block: Node {
      type: 'Program',
      sourceType: 'module',
      interpreter: null,
      body: [Array],
      directives: []
    },
    ...
  }
}

是不是發現,這一個遍歷怎麼這麼多東西?太長了,那麼我們進行省略,只看關鍵部分:

// 第1次
<ref *1> NodePath {
  listKey: undefined,
  key: 'program',
  node: Node {
    type: 'Program',
    sourceType: 'module',
    interpreter: null,
    body: [ [Node], [Node] ],
    directives: []
  },
  type: 'Program',
}

我們可以看出是直接進入到了程式program結點。 對應的 AST 結點信息:

  program: {
    type: 'Program',
    sourceType: 'module',
    interpreter: null,
    body: [
      [Node]
      [Node]
    ],
  },

接下來,我們繼續列印輸出的結點信息,我們可以看出它訪問的是program.body結點。

// 第2次
<ref *2> NodePath {
  listKey: 'body',
  key: 0,
  node: Node {
    type: 'VariableDeclaration',
    declarations: [ [Node] ],
    kind: 'const'
  },
  type: 'VariableDeclaration',
}

// 第3次
<ref *1> NodePath {
  listKey: 'declarations',
  key: 0,
  node: Node {
    type: 'VariableDeclarator',
    id: Node {
      type: 'Identifier',
      name: 'me'
    },
    init: Node {
      type: 'StringLiteral',
      extra: [Object],
      value: '我'
    }
  },
  type: 'VariableDeclarator',
}

// 第4次
<ref *1> NodePath {
  listKey: undefined,
  key: 'id',
  node: Node {
    type: 'Identifier',
    name: 'me'
  },
  type: 'Identifier',
}

// 第5次
<ref *1> NodePath {
  listKey: undefined,
  key: 'init',
  node: Node {
    type: 'StringLiteral',
    extra: { rawValue: '我', raw: "'我'" },
    value: '我'
  },
  type: 'StringLiteral',
}

  • node當前結點
  • parentPath父結點路徑
  • scope作用域
  • parent父結點
  • type當前結點類型

現在我們可以看出這個訪問的規律了,他會一直找當前結點node屬性,然後進行層層訪問其內容,直到將 AST 的所有結點遍歷完成。

這裡一定要區分NodePath和Node兩種類型,比如上面:pt是屬於NodePath類型,pt.node才是Node類型。

其次,我們看到提供的方法除了進入 [enter]還有退出 [exit]方法,這也就意味著,每次遍歷一次結點信息,也會退出當前結點。這樣,我們就有兩次機會獲得所有的結點信息。

當我們遍歷結束,如果找不到對應的結點信息,我們還可以進行額外的操作,進行代碼結點補充操作。結點完整訪問流程如下:

  • 進入>Program
    • 進入>node.body[0]
      • 進入>node.declarations[0]
        • 進入>node.id
        • 退出<node.id
        • 進入>node.init
        • 退出<node.init
      • 退出<node.declarations[0]
    • 退出<node.body[0]
    • 進入>node.body[1]
      • ...
      • ...
    • 退出<node.body[1]
  • 退出<Program

3. @babel/types

有了前面的鋪墊,我們通過解析,獲得了相關的 AST 對象。通過不斷遍歷,我們拿到了相關的結點,這時候我們就可以開始改造了。@babel/types 就提供了一系列的判斷方法,以及將普通對象轉換為 AST 結點的方法。

比如,我們想把代碼轉換為:

// 改造前代碼
const me = "我"
function write() {
  console.log("文章")
}

// 改造後的代碼
let you = "你"
function write() {
  console.log("文章")
}

首先,我們要分析下,這個代碼改了哪些內容?

  1. 變數聲明從const改為let
  2. 變數名從me改為you
  3. 變數值從"我"改為"你"

那麼我們有兩種替換方式:

  • 方案一:整體替換,相當於把program.body[0]整個結點進行替換為新的結點。
  • 方案二:局部替換,相當於逐個結點替換結點內容,即:program.body.kind,program.body[0].declarations[0].id,program.body[0].declarations[0].init。

藉助@babel/types我們可以這麼操作,一起看看區別:

const bbt = require('@babel/types');
const { default: traverse } = require('@babel/traverse');

// 進入結點
const onEnter = p => {
  // 方案一,全結點替換
  if (bbt.isVariableDeclaration(p.node) && p.listKey == 'body') {
    // 直接替換為新的結點
    p.replaceWith(
      bbt.variableDeclaration('let', [
        bbt.variableDeclarator(bbt.identifier('you'),           
        bbt.stringLiteral('你')),
      ]),
    );
  }
  // 方案二,單結點逐一替換
  if (bbt.isVariableDeclaration(p.node) && p.listKey == 'body') {
    // 替換聲明變數方式
    p.node.kind = 'let';
  }
  if (bbt.isIdentifier(p.node) && p.node.name == 'me') {
    // 替換變數名
    p.node.name = 'you';
  }
  if (bbt.isStringLiteral(p.node) && p.node.value == '我') {
    // 替換字元串內容
    p.node.value = '你';
  }  
};
traverse(codeAST, { enter: onEnter });

我們發現,不僅可以進行整體結點替換,也可以替換屬性的值,都能達到預期效果。

當然 我們不僅僅可以全部遍歷,我們也可以只遍歷某些屬性,比如VariableDeclaration,我們就可以這樣進行定義:

traverse(codeAST, { 
  VariableDeclaration: function(p) {
    // 只操作類型為 VariableDeclaration 的結點
    p.node.kind = 'let';
  }
});

@babel/types提供大量的方法供使用,可以通過官網查看。對於@babel/traverse返回的可用方法,可以查看 ts 定義:
babel__traverse/index.d.ts 文件。

常用的方法:p.stop()可以提前終止內容遍歷, 還有其他的增刪改查方法,可以自己慢慢摸索使用!它就是一個樹結構,我們可以操作它的兄弟結點,父節點,子結點。

4. @babel/generator

完成改造以後,我們需要把 AST 再轉換回去,這時候我們就需要用到 @babel/generator 工具。只拆不組裝,那是二哈【狗頭】。能裝能組,才是一個完整工程師該乾的事情。

廢話不多說,上代碼:

const fs = require('fs-extra');
const { default: generate } = require('@babel/generator');

// 生成代碼實例
const codeIns = generate(codeAST, { retainLines: true, jsescOption: { minimal: true } });

// 寫入文件內容
fs.writeFileSync('./code/app/index.js', codeIns.code);

配置項比較多,大家可以參考具體的說明,按照實際需求進行配置。

這裡特別提一下:jsescOption: { minimal: true }這個屬性,主要是用來保留中文內容,防止被轉為unicode形式。

Babel AST 實踐

嘿嘿~ 都到這裡了,大家應該已經能夠上手操作了吧!

什麼?還不會,那再把 1 ~ 4 的步驟再看一遍。慢慢嘗試,慢慢修改,當你發現其中的樂趣時,這個 AST 的改造也就簡單了,並不是什麼難事。

留個課後練習:

// 改造前代碼
const me = "我"
function write() {
  console.log("文章")
}

// 改造後的代碼
const you = "你"
function write() {
  console.log("文章")
}
console.log(you, write())

大家可以去嘗試下,怎麼操作簡單的 AST 實現代碼改造!寫文章不易,大家記得一鍵三連哈~

AST 應用是非常廣泛,再來回憶下,這個 AST 可以幹嘛?

  1. 代碼轉換領域,如:ES6 轉 ES5, typescript 轉 js,Taro 轉多端編譯,CSS預處理器等等。
  2. 模版編譯領域,如:React JSX 語法,Vue 模版語法 等等。
  3. 代碼預處理領域,如:代碼語法檢查(ESLint),代碼格式化(Prettier),代碼混淆/壓縮(uglifyjs) 等等
  4. 低代碼搭建平臺,拖拽組件,直接通過 AST 改造生成後的代碼進行運行。

下一期預告

《帶你揭開神秘的Javascript AST面紗之手寫一個簡單的 Javascript 編譯器》


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ☞ 商品介面的定義 價格、庫存量、發貨地點等。此外,它還可以提供商品的詳細信息,包括商品的圖片、詳細描述、規格參數、售後服務等。這些信息可以幫助用戶更好地瞭解商品,從而更好地選擇商品。 其次,電商平臺商品詳情介面的實現原理是基於RESTful API。RESTful API是一種基於HTTP協議的A ...
  • 回顧大數據的發展歷程,一句話概括就是海量數據的高效處理。在當今快節奏、不斷變化的市場環境下,優秀的開發效率已經成為企業數字化轉型的必備條件。 數棧離線開發BatchWorks 是一款專註離線數據ELT開發的產品,採用先進的大數據生態底層技術,具備高性能且功能豐富的大數據處理能力,對大數據離線計算、數 ...
  • 4月7-8日,年度資料庫行業盛會——2023數據技術嘉年華(DTC 2023)如期而至。 此次盛會匯聚了全國各地數千名數據領域學術精英、領袖人物、技術專家、從業者和技術愛好者,共同見證行業蓬勃發展、生態融合共贏、技術迭代升級及市場風雲變遷。 GreatSQL作為萬里資料庫主導成立的開源資料庫社區,首 ...
  • 在Oracle資料庫中,如果我們使用用戶管理備份與恢復(User-Managed Backup and Recovery)方式去備份還原資料庫的話,如何獲取用戶管理備份與恢復的記錄信息呢?例如,我要查看某個資料庫實例做用戶管理備份的記錄。一般使用下麵腳本。似乎用戶管理備份比較“簡單”,目前我查了相關 ...
  • Redis 構造了多種底層數據結構供使用,不同的數據類型有可能使用到多種底層數據結構存儲,因此,需要理解為何 Redis 會有這樣的設計,理解每個底層數據結構的概念之後,就能知曉在極端性能上如何做取捨。 ...
  • 蘋果在iOS16.1系統對第三方開放了靈動島的API,並允許開發者基於靈動島開發相應軟體,越來越多的APP開始基於靈動島的交互進行設計和開發,本文將簡單介紹靈動島開發的流程和將其與業務場景相結合的思考。 ...
  • 首先說明簡易版是只有一個 倒計時 和一個 進度條,頁面載入後自動開始計時,下次計時需要手動刷新頁面。 後續會更新實現完整的倒計時功能的文章 前期準備 前端框架 你需要準備一些前端框架:Bootstrap4 和 jQuery 安裝方法請自行查閱官方文檔或教程 Bootstrap4:https://v4 ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 前言: 梳理了一下項目中的PWA的相關用法,下麵我會正對vue2和vue3的用法進行一些教程示例,引入離線緩存機制,即使你斷網,也能訪問頁面。一旦用戶訪問了我們的網頁,我們就像牛皮糖一樣粘連著他,他永遠都可以訪問,即使斷網也能訪問。有一天 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...