深入V8引擎-AST(3)_ZenDei技術網路在線

深入V8引擎-AST(3)

-Advertisement-

上篇簡單介紹了入口方法的流程以及scanner類相關的部分內容，這一篇主要講scanner的初始化，即註意，這不是調用靜態方法。實際上Parser實例生成的時候也把scanner屬性初始化了，所以這裡可以直接用。實際上，就是初始化了scanner上的source_屬性與模塊的flag，以便調用I ...

上篇簡單介紹了入口方法的流程以及scanner類相關的部分內容，這一篇主要講scanner的初始化，即

scanner_.Initialize();

註意，這不是調用靜態方法。實際上Parser實例生成的時候也把scanner屬性初始化了，所以這裡可以直接用。

Parser::Parser(ParseInfo* info) : ParserBase<Parser>(/* 初始化父類的屬性 */)
scanner_(info->character_stream(), info->is_module()),/* 初始化其他屬性 */

實際上，就是初始化了scanner上的source_屬性與模塊的flag，以便調用Initialize方法。

這個方法有點類似於libuv的非同步操作，不過當然完全不是一個東西，源碼如下。

/**
 * 註意 這裡不做AST的全面轉換
 */
void Scanner::Initialize() {
  Init();
  next().after_line_terminator = true;
  Scan();
}

第二步我也不曉得是幹啥的，暫時不理解那個變數的意義，所以只講第一和第三步，首先是Init。

void Init() {
  Advance();
  /**
   * TokenDesc token_storage_[3];
   * 這裡做一個映射 相當於alias
   */
  current_ = &token_storage_[0];
  next_ = &token_storage_[1];
  next_next_ = &token_storage_[2];

  found_html_comment_ = false;
  scanner_error_ = MessageTemplate::kNone;
}

/**
 * source_在Parser的構造函數中初始化
 * 類型為Utf16CharacterStream 需要去那邊看實現
 */
void Advance() {
  c0_ = source_->Advance();
}

從scanner層級來看，其Advance方法的作用僅僅是對私有屬性c0_(當前字元的Unicode編碼)進行賦值，做實際操作是source_屬性上的Advance方法，而這個屬性類型為前面轉換後的Stream類(全稱是xxxCharacterStream，因為太長了，後面全部簡稱Stream類)，所以具體實現需要跳到那邊去，源碼如下。

/**
 * 從這裡開始方法域跳到了Utf16CharacterStream、BufferedCharacterStreams
 * 即Utf16CharacterStream::Advance、Utf16CharacterStream::Peek、Utf16CharacterStream::ReadBlockChecked
 */
inline uc32 Advance() {
  uc32 result = Peek();
  buffer_cursor_++;
  return result;
}

/**
 * 返回游標所在位置的值
 * 1、已初始化
 * 2、未初始化
 * 3、已到結尾
 */
inline uc32 Peek() {
  if (V8_LIKELY(buffer_cursor_ < buffer_end_)) {
    return static_cast<uc32>(*buffer_cursor_);
  } else if (ReadBlockChecked()) {
    return static_cast<uc32>(*buffer_cursor_);
  } else {
    return kEndOfInput;
  }
}

這裡有一些東西需要解釋，首先是關於Stream類的3個游標屬性(這個名字是我自己取的，看AST的解析總讓我想到高中的游標卡尺)，分別是buffer_start_、buffer_cursor_、buffer_end_，分別代表字元解析中的開始、當前、結束位置，在Stream類初始化時這三個屬性沒有處理，預設置0。註意，這裡的屬性指向字元，跟詞法是不同的概念，在scanner層級的三個屬性是詞法。比如說if從詞法角度講是一個，但是從字元角度來說是兩個。

下麵的3個判斷註釋中給出了意義，比較有意思的是V8_LIKELY巨集，對於開發者來說算是一個無意義的巨集，但是這個巨集是給編譯器看的，表明這個分支比較有可能發生，推薦進行優化。由於初始化只會走一遍，在解析未結束前大部分情況都是走第一個分支直接返回當前游標指向的值。不過目前是第一次調用這個方法，我們走第二個分支。

/**
 * 這裡是做一個合法性檢測
 * 實際上只有ReadBlock做事
 */
bool ReadBlockChecked() { 
  size_t position = pos();
  USE(position);
  bool success = !has_parser_error() && ReadBlock();

  // Post-conditions: 1, We should always be at the right position.
  //                  2, Cursor should be inside the buffer.
  //                  3, We should have more characters available iff success.
  DCHECK_EQ(pos(), position);
  DCHECK_LE(buffer_cursor_, buffer_end_);
  DCHECK_LE(buffer_start_, buffer_cursor_);
  DCHECK_EQ(success, buffer_cursor_ < buffer_end_);
  return success;
}

/**
 * buffer_pos_代表當前進度位置 類型為整形
 * cursor、start作為指針指向buffer_數組的當前、初始地址
 * 而數組在記憶體中地址連續 且unsigned short類型占1
 * 所以可以直接通過計算得到當前位置
 */
inline size_t pos() const {
  return buffer_pos_ + (buffer_cursor_ - buffer_start_);
}

/**
 * 1、buffer_是一個unsigned short數組 存儲編碼處理後的單個字元
 * 2、指針start、end分別初始化為數組的頭尾
 * 3、cursor是游標 初始指向start
 * 例如"(function)"在buffer_表示為[40, 102, ...]
 */
bool ReadBlock() final {
  size_t position = pos();
  buffer_pos_ = position;
  buffer_start_ = &buffer_[0];
  buffer_cursor_ = buffer_start_;

  DisallowHeapAllocation no_gc;
  Range<uint8_t> range = byte_stream_.GetDataAt(position, runtime_call_stats(), &no_gc);
  if (range.length() == 0) {
    buffer_end_ = buffer_start_;
    return false;
  }

  size_t length = Min(kBufferSize, range.length());
  i::CopyCharsUnsigned(buffer_, range.start, length);
  buffer_end_ = &buffer_[length];
  return true;
}

這一塊的內容較多，實際上說多也不多。第一個方法只是純粹的檢查，保證游標屬性的合法，pos方法則是直接通過地址計算來得到當前解析位置，原理寫在註釋里了。

ReadBlock方法負責對Stream屬性的初始化，這個類前面沒有給出聲明，buffer_是其一個私有屬性，長度為512的short數組。DisallowHeapAllocation不要去管，v8裡面有很多奇奇怪怪的東西，目前理解不了，當然與AST本身也毫無關係。GetDataAt比較麻煩，不想講，從結果上來講，最後返回的是字元串每個字元的Unicode編碼，通過CopyCharsUnsigned方法複製到了buffer_上面，並將buffer_end_指向了最後結尾的部分。

比如說待編譯字元串為"'Hello' + ' World'"，經過GetDataAt處理後，會變成39, 72, ...。

這裡給一個調試結果，buffer_初始化後，會有一堆臟數據，內容如下(長度512，只截取了前面一部分)。

經過該方法的一系列處理，變成了

加上空格，整個字元串共有18位，所以0-17的值全部被重置，後面還是老的臟數據。這些數字手動轉換一下，可以得到

剛好是待編譯的字元串（先假設字元串長度小於512，複雜情況後面再搞）。

至此，整個Init方法才完事，沒想到這麼長，Scan下一篇講，要幹活了。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

react diff

傳統diff 通過迴圈遞歸對節點的依次對比，複雜度是O(n3) react diff react對傳統diff進行了優化，將複雜度降為O(n) react基於這幾個前提對diff進行了優化：忽略跨層級操作，因為DOM節點跨層級操作很少。不同類的組件，則會生成不同的樹形結構，相同類的組件，會生成相 ...
Vue學習之webpack中使用vue(十七）

一、包的查找規則： 1、在項目根目錄中找有沒有 node_modules 的文件夾； 2、在 node_modules 中根據包名，找對應的vue 文件夾； 3、在vue 文件夾中，找一個叫做 package.json的包配置文件； 4、在package.json文件中，查找一個main 屬性【m ...
Vue學習之Babel配置(十六）

一、Babel：（官網：https://www.babeljs.cn/docs/） 1、Babel 是一個 JavaScript 編譯器； 2、Babel 是一個工具鏈，主要用於將 ECMAScript 2015+ 版本的代碼轉換為向後相容的 JavaScript 語法，以便能夠運行在當前和舊版本 ...
Vue.js 源碼分析(十七) 指令篇 v-if、v-else-if和v-else 指令詳解

v-if 指令用於條件性地渲染一塊內容。這塊內容只會在指令的表達式返回 truthy 值的時候被渲染。 v-else-if，顧名思義，充當 v-if 的“else-if 塊”，可以連續使用：也可以使用 v-else 指令來表示 v-if 的“else 塊”：挺好理解的，就和大多數的語言的if() ...
jq+swiper 實現今日頭條App的選項卡效果

今日頭條APP頂部點擊可居中導航首頁熱點汽車視頻社會娛發科技生活敲門 ... ...
掌握11項技能，你就是優秀的前端開發工程師

你也許會覺得前端開發是一個很簡單的工作，對呀，你就是剛剛從網頁設計轉型過來的。但當你深入其中時，一定會發現好像前端開發不是那麼簡單，光網站性能優化、響應式、框架就讓你焦頭爛額。確實，做前端開發就是先易後難，想成為一個優秀的前端開發，沒有那麼簡單。不過，天下事難則不會，會則不難，你只需要掌握11項技 ...
javaWeb 概念介紹

一、javaWeb 1.概念：利用java語言進行基於互聯網的開發 2.軟體架構（1）C/S Client/Server 客戶端/伺服器端在用戶本地有一個客戶端程式，在遠程有一個伺服器程式比如：QQ、微信、迅雷等優點： 1.用戶體驗好缺點： 1.開發、安裝、部署、維護麻煩（2）B/S B ...
瀏覽器從輸入URL到渲染完頁面的整個過程

從輸入URL到渲染出整個頁面的過程包括三個部分： 1、DNS解析URL的過程 2、瀏覽器發送請求與伺服器交互的過程 3、瀏覽器對接收到的html頁面渲染的過程一、DNS解析URL的過程 DNS解析的過程就是尋找哪個伺服器上有請求的資源。因為ip地址不容易記憶，一般會使用URL功能變數名稱（如www.bai ...