深入V8引擎-AST(3)

来源:https://www.cnblogs.com/QH-Jimmy/archive/2019/07/03/11125607.html
-Advertisement-
Play Games

上篇簡單介紹了入口方法的流程以及scanner類相關的部分內容,這一篇主要講scanner的初始化,即 註意,這不是調用靜態方法。實際上Parser實例生成的時候也把scanner屬性初始化了,所以這裡可以直接用。 實際上,就是初始化了scanner上的source_屬性與模塊的flag,以便調用I ...


上篇簡單介紹了入口方法的流程以及scanner類相關的部分內容,這一篇主要講scanner的初始化,即

scanner_.Initialize();

註意,這不是調用靜態方法。實際上Parser實例生成的時候也把scanner屬性初始化了,所以這裡可以直接用。

Parser::Parser(ParseInfo* info) : ParserBase<Parser>(/* 初始化父類的屬性 */)
scanner_(info->character_stream(), info->is_module()),/* 初始化其他屬性 */

實際上,就是初始化了scanner上的source_屬性與模塊的flag,以便調用Initialize方法。

這個方法有點類似於libuv的非同步操作,不過當然完全不是一個東西,源碼如下。

/**
 * 註意 這裡不做AST的全面轉換
 */
void Scanner::Initialize() {
  Init();
  next().after_line_terminator = true;
  Scan();
}

第二步我也不曉得是幹啥的,暫時不理解那個變數的意義,所以只講第一和第三步,首先是Init。

void Init() {
  Advance();
  /**
   * TokenDesc token_storage_[3];
   * 這裡做一個映射 相當於alias
   */
  current_ = &token_storage_[0];
  next_ = &token_storage_[1];
  next_next_ = &token_storage_[2];

  found_html_comment_ = false;
  scanner_error_ = MessageTemplate::kNone;
}

/**
 * source_在Parser的構造函數中初始化
 * 類型為Utf16CharacterStream 需要去那邊看實現
 */
void Advance() {
  c0_ = source_->Advance();
}

從scanner層級來看,其Advance方法的作用僅僅是對私有屬性c0_(當前字元的Unicode編碼)進行賦值,做實際操作是source_屬性上的Advance方法,而這個屬性類型為前面轉換後的Stream類(全稱是xxxCharacterStream,因為太長了,後面全部簡稱Stream類),所以具體實現需要跳到那邊去,源碼如下。

/**
 * 從這裡開始方法域跳到了Utf16CharacterStream、BufferedCharacterStreams
 * 即Utf16CharacterStream::Advance、Utf16CharacterStream::Peek、Utf16CharacterStream::ReadBlockChecked
 */
inline uc32 Advance() {
  uc32 result = Peek();
  buffer_cursor_++;
  return result;
}

/**
 * 返回游標所在位置的值
 * 1、已初始化
 * 2、未初始化
 * 3、已到結尾
 */
inline uc32 Peek() {
  if (V8_LIKELY(buffer_cursor_ < buffer_end_)) {
    return static_cast<uc32>(*buffer_cursor_);
  } else if (ReadBlockChecked()) {
    return static_cast<uc32>(*buffer_cursor_);
  } else {
    return kEndOfInput;
  }
}

這裡有一些東西需要解釋,首先是關於Stream類的3個游標屬性(這個名字是我自己取的,看AST的解析總讓我想到高中的游標卡尺),分別是buffer_start_、buffer_cursor_、buffer_end_,分別代表字元解析中的開始、當前、結束位置,在Stream類初始化時這三個屬性沒有處理,預設置0。註意,這裡的屬性指向字元,跟詞法是不同的概念,在scanner層級的三個屬性是詞法。比如說if從詞法角度講是一個,但是從字元角度來說是兩個。

下麵的3個判斷註釋中給出了意義,比較有意思的是V8_LIKELY巨集,對於開發者來說算是一個無意義的巨集,但是這個巨集是給編譯器看的,表明這個分支比較有可能發生,推薦進行優化。由於初始化只會走一遍,在解析未結束前大部分情況都是走第一個分支直接返回當前游標指向的值。不過目前是第一次調用這個方法,我們走第二個分支。

/**
 * 這裡是做一個合法性檢測
 * 實際上只有ReadBlock做事
 */
bool ReadBlockChecked() { 
  size_t position = pos();
  USE(position);
  bool success = !has_parser_error() && ReadBlock();

  // Post-conditions: 1, We should always be at the right position.
  //                  2, Cursor should be inside the buffer.
  //                  3, We should have more characters available iff success.
  DCHECK_EQ(pos(), position);
  DCHECK_LE(buffer_cursor_, buffer_end_);
  DCHECK_LE(buffer_start_, buffer_cursor_);
  DCHECK_EQ(success, buffer_cursor_ < buffer_end_);
  return success;
}

/**
 * buffer_pos_代表當前進度位置 類型為整形
 * cursor、start作為指針指向buffer_數組的當前、初始地址
 * 而數組在記憶體中地址連續 且unsigned short類型占1
 * 所以可以直接通過計算得到當前位置
 */
inline size_t pos() const {
  return buffer_pos_ + (buffer_cursor_ - buffer_start_);
}

/**
 * 1、buffer_是一個unsigned short數組 存儲編碼處理後的單個字元
 * 2、指針start、end分別初始化為數組的頭尾
 * 3、cursor是游標 初始指向start
 * 例如"(function)"在buffer_表示為[40, 102, ...]
 */
bool ReadBlock() final {
  size_t position = pos();
  buffer_pos_ = position;
  buffer_start_ = &buffer_[0];
  buffer_cursor_ = buffer_start_;

  DisallowHeapAllocation no_gc;
  Range<uint8_t> range = byte_stream_.GetDataAt(position, runtime_call_stats(), &no_gc);
  if (range.length() == 0) {
    buffer_end_ = buffer_start_;
    return false;
  }

  size_t length = Min(kBufferSize, range.length());
  i::CopyCharsUnsigned(buffer_, range.start, length);
  buffer_end_ = &buffer_[length];
  return true;
}

這一塊的內容較多,實際上說多也不多。第一個方法只是純粹的檢查,保證游標屬性的合法,pos方法則是直接通過地址計算來得到當前解析位置,原理寫在註釋里了。

ReadBlock方法負責對Stream屬性的初始化,這個類前面沒有給出聲明,buffer_是其一個私有屬性,長度為512的short數組。DisallowHeapAllocation不要去管,v8裡面有很多奇奇怪怪的東西,目前理解不了,當然與AST本身也毫無關係。GetDataAt比較麻煩,不想講,從結果上來講,最後返回的是字元串每個字元的Unicode編碼,通過CopyCharsUnsigned方法複製到了buffer_上面,並將buffer_end_指向了最後結尾的部分。

比如說待編譯字元串為"'Hello' + ' World'",經過GetDataAt處理後,會變成39, 72, ...。

這裡給一個調試結果,buffer_初始化後,會有一堆臟數據,內容如下(長度512,只截取了前面一部分)。

經過該方法的一系列處理,變成了

加上空格,整個字元串共有18位,所以0-17的值全部被重置,後面還是老的臟數據。這些數字手動轉換一下,可以得到

剛好是待編譯的字元串(先假設字元串長度小於512,複雜情況後面再搞)。

至此,整個Init方法才完事,沒想到這麼長,Scan下一篇講,要幹活了。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 傳統diff 通過迴圈遞歸對節點的依次對比,複雜度是O(n3) react diff react對傳統diff進行了優化,將複雜度降為O(n) react基於這幾個前提對diff進行了優化: 忽略跨層級操作,因為DOM節點跨層級操作很少。 不同類的組件,則會生成不同的樹形結構,相同類的組件,會生成相 ...
  • 一、包的查找規則: 1、在項目根目錄中找有沒有 node_modules 的文件夾; 2、在 node_modules 中根據包名,找對應的vue 文件夾; 3、在vue 文件夾中,找 一個叫做 package.json的包配置文件; 4、在package.json文件中,查找一個main 屬性【m ...
  • 一、Babel: (官網:https://www.babeljs.cn/docs/) 1、Babel 是一個 JavaScript 編譯器; 2、Babel 是一個工具鏈,主要用於將 ECMAScript 2015+ 版本的代碼轉換為向後相容的 JavaScript 語法,以便能夠運行在當前和舊版本 ...
  • v-if 指令用於條件性地渲染一塊內容。這塊內容只會在指令的表達式返回 truthy 值的時候被渲染。 v-else-if,顧名思義,充當 v-if 的“else-if 塊”,可以連續使用: 也可以使用 v-else 指令來表示 v-if 的“else 塊”: 挺好理解的,就和大多數的語言的if() ...
  • 今日頭條APP頂部點擊可居中導航 首頁 熱點 汽車 視頻 社會 娛發 科技 生活 敲門 ... ...
  • 你也許會覺得前端開發是一個很簡單的工作,對呀,你就是剛剛從網頁設計轉型過來的。但當你深入其中時,一定會發現好像前端開發不是那麼簡單,光網站性能優化、響應式、框架就讓你焦頭爛額。確實,做前端開發就是先易後難,想成為一個優秀的前端開發,沒有那麼簡單。 不過,天下事難則不會,會則不難,你只需要掌握11項技 ...
  • 一、javaWeb 1.概念:利用java語言進行基於互聯網的開發 2.軟體架構 (1)C/S Client/Server 客戶端/伺服器端 在用戶本地有一個客戶端程式,在遠程有一個伺服器程式 比如:QQ、微信、迅雷等 優點: 1.用戶體驗好 缺點: 1.開發、安裝、部署、維護麻煩 (2)B/S B ...
  • 從輸入URL到渲染出整個頁面的過程包括三個部分: 1、DNS解析URL的過程 2、瀏覽器發送請求與伺服器交互的過程 3、瀏覽器對接收到的html頁面渲染的過程 一、DNS解析URL的過程 DNS解析的過程就是尋找哪個伺服器上有請求的資源。因為ip地址不容易記憶,一般會使用URL功能變數名稱(如www.bai ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...