2018-01-15 Antlr4: 修改語法規則更接近普通BNF格式

来源:https://www.cnblogs.com/program-in-chinese/archive/2019/03/07/10487359.html
-Advertisement-
Play Games

經 @沈默 在上文 "Antlr4添加中文變數賦求值,括弧,各種問題" 評論中指出, 語法規則描述依賴於Antlr4生成的語法分析器的預設分析方法, 比如運算符的左聯繫, 以及優先順序處理等等. 於是將語法修改為下麵(源碼版本號: "program in chinese/quan5" ): 這樣做的結 ...


經 @沈默 在上文Antlr4添加中文變數賦求值,括弧,各種問題評論中指出, 語法規則描述依賴於Antlr4生成的語法分析器的預設分析方法, 比如運算符的左聯繫, 以及優先順序處理等等. 於是將語法修改為下麵(源碼版本號: program-in-chinese/quan5):

表達式: 求積表達式 (('+'|'-') 求積表達式)*;

求積表達式: 最小表達式 (('*'|'/'|'×'|'÷') 最小表達式)*;

最小表達式
  : 字面量
  | '(' 表達式 ')'
  ;

字面量
  : T數
  | T變數名
  ;

這樣做的結果是, Antlr4會分析生成一個多叉樹. 比如 1+2-3, 生成樹如下:
2018-01-14-antlr_quan2_bnf

於是在生成抽象語法樹時手動轉換為二叉樹. 代碼如下:

private 節點 構建二叉樹(List<ParseTree> 子節點) {
    if (子節點.isEmpty()) {
      return null;
    } else if (子節點.size() == 1) {
      return visit(子節點.get(0));
    } else {
      ParseTree 最後運算符節點 = 子節點.get(子節點.size() - 2);
      運算符號 運算符 = ((TerminalNodeImpl)最後運算符節點).symbol.getType() == 圈5Parser.T加 ? 運算符號.加 : 運算符號.減;
      運算式節點 節點 = new 運算式節點();
      節點.運算符 = 運算符;
      節點.左子節點 = 構建二叉樹(子節點.subList(0, 子節點.size() - 2));
      節點.右子節點 = visit(子節點.get(子節點.size() - 1));
      return 節點;
    }
  }

開發過程中發現一些坑(如果是小白錯誤請指出). 一個比較費解的是, 不能省去"字面量"規則如下:

最小表達式
  : T數
  | T變數名
  | '(' 表達式 ')'
  ;

不然生成的分析器會有編譯錯誤:

com/中文編程/圈5/分析器/圈5Parser.java:403: error: unreachable statement
                enterOuterAlt(_localctx, 3);

Antlr4有個github庫彙集了社區維護的各種語言的語法規則文件, 其中有Java8, 根據註釋說明它的語法規則描述"極度"接近Java標準, 於是參考了它的實現. 其中看到這樣的模式(已轉成中文):

求和表達式
    :   求積表達式
    |   求和表達式 '+' 求積表達式
    |   求和表達式 '-' 求積表達式
    ;

求積表達式
    :   最小表達式
    |   求積表達式 '*' 最小表達式
    |   求積表達式 '/' 最小表達式
    ;

感覺這樣會讓語法樹轉換這一步的實現更加方便(應該可以省去多叉樹轉換成二叉樹的那個遞歸演算法). 在添加新功能之前, 打算嘗試修改成這樣.

已完成:

表達式
  : 求積表達式
  | 表達式 '+' 求積表達式
  | 表達式 '-' 求積表達式;

求積表達式
  : 最小表達式
  | 求積表達式 '*' 最小表達式
  | 求積表達式 '/' 最小表達式
  | 求積表達式 '×' 最小表達式
  | 求積表達式 '÷' 最小表達式;

的確省去了多叉樹轉換. 代碼整理完畢(program-in-chinese/quan5). 接下去, 是條件判斷還是函數定義?

補記

Antlr4自帶的語法分析可視化工具, 以antlr/grammars-v4為例:

$ alias grun='java -cp "{PATH_TO_antlr-4.7-complete.jar}:$CLASSPATH" org.antlr.v4.runtime.misc.TestRig'
$ java -cp "{PATH_TO_antlr-4.7-complete.jar}:$CLASSPATH" org.antlr.v4.Tool -visitor  -no-listener Java8.g4 
$ javac -cp "{PATH_TO_antlr-4.7-complete.jar}:$CLASSPATH" Java8*.java
$ grun Java8 expression -tree <--- 將輸入字元串進行語法解析, 生成樹結構
Warning: TestRig moved to org.antlr.v4.gui.TestRig; calling automatically
a>1
(expression (assignmentExpression (conditionalExpression (conditionalOrExpression (conditionalAndExpression (inclusiveOrExpression (exclusiveOrExpression (andExpression (equalityExpression (relationalExpression (relationalExpression (shiftExpression (additiveExpression (multiplicativeExpression (unaryExpression (unaryExpressionNotPlusMinus (postfixExpression (expressionName a)))))))) > (shiftExpression (additiveExpression (multiplicativeExpression (unaryExpression (unaryExpressionNotPlusMinus (postfixExpression (primary (primaryNoNewArray_lfno_primary (literal 1)))))))))))))))))))
$ grun Java8 expression -gui <--- 圖形化
Warning: TestRig moved to org.antlr.v4.gui.TestRig; calling automatically
2>1
^D

2018-01-15-antlr_quan2_bnf_test


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、新的變數聲明方式 let/cons 與var不同,新的變數聲明方式帶來了一些不一樣的特性,其中最重要的兩個特性就是提供了塊級作用域與不再具備變數提升。 若是對變數提升不怎麼瞭解的話可以去參考我的其他文章 javascript預編譯的過程 。 什麼是塊級作用域膩? 寫在 “{}” 內的內容 都是塊 ...
  • 前言 這一章主要講2個模式,一個是,適配器模式(負責將一個類的介面適配成用戶所期待的),另外一個是外觀模式(為子系統提供一個共同的對外介面),看完的第一反應是,為什麼要把它們兩放在同一章,難道它們有什麼不可告人的秘密? 難道是因為他們倆都很簡單嗎?不會不會,畢竟是大名鼎鼎的headfirst,怎麼可 ...
  • 官網 http://www.fhadmin.org/D 集成安全許可權框架shiro Shiro 是一個用 Java 語言實現的框架,通過一個簡單易用的 API 提供身份驗證和授權,更安全,更可靠E 集成ehcache分散式緩存 是一個純Java的進程內緩存框架,具有快速、精幹等特點,廣泛使用的開源J ...
  • 俗話說磨刀不誤砍柴工,確實,一早上花一個小時去磨刀一天下來肯定能多砍很多柴。我們做軟體開發也是同樣的道理,有套好開發框架在手裡,開發也是事半功倍。 那麼一套MVC快速開發框架至少得具有哪些功能才能幫我們做到高效率、高品質的開發呢?下麵我以力軟後臺管理系統開發框架為例談一談快速開發框架的幾個主要功能。 ...
  • Adapter(適配器模式) 加個“適配器”以便於復用 將一個類的介面轉換成客戶希望的另一個介面。Adapter模式使得原本由於介面不相容而不能一起工作的那些類可以一起工作。 應用場景 如果我們的代碼依賴一些外部的API,或者依賴一些可能會經常更改的類,那麼應該考慮用適配器模式。 你想使用一個已經存 ...
  • 參考鏈接:1. PS流的格式和解析總結 http://www.cnblogs.com/lihaiping/p/4181607.html 2. TS科普5 PES包解析 https://blog.csdn.net/cabbage2008/article/details/49612011 PES包的解析 ...
  • Java就是用來做項目的!Java的主要應用領域就是企業級的項目開發!要想從事企業級的項目開發,你必須掌握如下要點:1、掌握項目開發的基本步驟2、具備極強的面向對象的分析與設計技巧3、掌握用例驅動、以架構為核心的主流開發方法沒有人願意自己一輩子就滿足於掌握了一些代碼實現的技巧,別人告訴你要實現什麼, ...
  • 前言 開心一刻 本人幼教老師,冬天戴帽子進教室,被小朋友看到,這時候,有個小家伙對我說:老師你的帽子太醜,趕緊摘了吧。我逗他:那你好好學習,以後給老師買個漂亮的?這孩子想都沒想立刻回答:等我賺錢了,帶你去南韓整形 簡單示例 我們先來看一個純粹的mybatis示例(不集成spring等其他框架),代碼 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...