冷知識：預處理字元串操作符

-Advertisement-

當年學習C語言的第一門課就提到過標記(Token)的概念，不過，相信在多年之後你再次聽到這個術語時會一臉懵逼，比如我。那麼就來聊聊比較冷門的預處理字元串操作符吧。 ...

以下內容為本人的學習筆記，如需要轉載，請聲明原文鏈接微信公眾號「englyf」https://mp.weixin.qq.com/s/Xr2pFCJ4j0DZYo2PO6-KQg

當年學習C語言的第一門課就提到過標記(Token)的概念，不過，相信在多年之後你再次聽到這個術語時會一臉懵逼，比如我。

因此特地翻了翻資料，整理下來這些筆記。

在C語言中什麼是標記？

標記是編程語言處理的基本單元，也叫最小劃分元素，比如關鍵字、操作符、變數名、函數名、字元串、數值等等。
下麵舉例說明一下：

printf("hello world!");

對上面的語句進行標記劃分，可分為5個標記，如下：

printf              // 函數名
(                   // 左小括弧操作符
"hello world!"      // 字元串
)                   // 右小括弧操作符
;                   // 分號

預處理字元串操作符

在C語言中，預處理字元串操作符有兩個，#和##。

`#` 字元串化操作符

用途是，將標記(Token)轉成字元串。

Syntax:

#define TOKEN_NAME(param) #param

Basic Usage:

#include <stdio.h>

#define MACRO_NAME(param)  #param

int main()
{
    printf(MACRO_NAME(hello world));

    return 0;
}

Output:

hello world

在項目實踐中，用巨集定義的值的同時也需要將巨集名轉成字元串使用，對日誌的輸出尤其管用。

Best Practice:

#include <stdio.h>

#define NAME(param)  #param

#define LEN_MAX     10

int main()
{
    int array[LEN_MAX] = {0};
    int index = 10;
    if (index >= LEN_MAX) {
        printf("error: %s:%d is over %s:%d\n", NAME(index), index, NAME(LEN_MAX), LEN_MAX);
    } else {
        printf("read %s[%d]=%d\n", NAME(array), index, array[index]);
    }

    return 0;
}

Output:

error: index:15 is over LEN_MAX:10

如果修改如下：

int index = 9;

Output:

read array[9]=0

`##` 標記(Token)連接操作符

用途是，將##前後的標記(Token)串接成新的單一標記。

syntax：

#define TOKEN_CONCATENATE(param1, param2) param1##param

Basic Usage:

#include <stdio.h>

#define TOKEN_CONCATENATE(param1, param2) param1##param2

int main()
{
    printf("%d\n", TOKEN_CONCATENATE(12, 34));

    return 0;
}

Output:

通常，編碼實踐中，代碼中會出現一些書寫看上去雷同的片段，極其啰嗦冗餘。為了壓縮源碼篇幅，可以參考代碼生成器的思想，在預編譯階段用巨集定義代碼片段展開替換，同時根據輸入的參數用##組合各種標記。

假設有個需求是聲明定義一組同一類型的結構體的變數，並初始化其內部成員。既然聲明定義的這些變數屬於同一類型的結構體，那麼按照直接編碼的方式，就會有多次重覆的代碼片段出現，裡邊包括了聲明定義語句，以及初始化各個成員的語句，不同的只是變數名或者參數而已。

舉個慄子，下麵基於同一類型的結構體，聲明定義兩個變數，並初始化，看代碼

#include <stdio.h>
#include <string.h>

#define NAME(param)     #param

typedef struct {
    char *data;
    int   data_size;  /* number of byte real */
    int   max_size;   /* maximnm data size.*/
} my_type;

#define my_type_create(name, size) \
    char name ## _ ## data[size] = {0}; \
    my_type name; \
    memset(&name, 0x00, sizeof(name)); \
    name.data = name ## _ ## data; \
    name.max_size = size; \
    printf("variable name=%s\nmember data=%s, data_size=%d, max_size=%d\n", \
            NAME(name), NAME(name ## _ ## data), name.data_size, name.max_size); \

int main() {
    my_type_create(var1, 10)
    my_type_create(var2, 20)
}

上面的代碼中，定義了巨集my_type_create，內部實現了結構體變數的聲明定義，以及內部成員的初始化。如果按照直接編碼的方式，代碼量相對於上面的代碼量會虛增n-1倍，n=變數的個數。

在main函數中，調用巨集的時候輸入參數var和10，那麼在編譯預處理階段，根據輸入的參數，巨集my_type_create會展開為以下的代碼段。

char var_data[10] = {0}; \
my_type var; \
memset(&var, 0x00, sizeof(var)); \
var.data = var_data; \
var.max_size = 10; \
printf("variable name=%s\nmember data=%s, data_size=%d, max_size=%d", \
        “var”, var_data, var.data_size, var.max_size); \

Output:

variable name=var1
member data=var1_data, data_size=0, max_size=10
variable name=var2
member data=var2_data, data_size=0, max_size=20

`##` 還有個特殊的用途

在巨集定義中，也支持用...代表可變參數。

#define MY_PRINT(fmt, ...) printf(fmt, __VA_ARGS__)

由於可變參數數目不確定，所以沒有具體的標記。於是為了引用可變參數，語言層面提供了可變巨集(Variadic macros)__VA_ARGS__來引用它。

但是，在巨集定義時，如果直接使用__VA_ARGS__來引用可變參數，一旦可變參數為空就會引起編譯器報錯，看看下麵的例子

#include <stdio.h>

#define LOG_INFO(fmt, ...) printf("[I]" fmt "\n", __VA_ARGS__)

int main() {
  LOG_INFO("info...");
  LOG_INFO("%s, %s", "Hello", "world");
}

Output:

main.c: In function ‘main’:
main.c:3:62: error: expected expression before ‘)’ token
    3 | #define LOG_INFO(fmt, ...) printf("[I]" fmt "\n", __VA_ARGS__)
      |                                                              ^
main.c:6:3: note: in expansion of macro ‘LOG_INFO’
    6 |   LOG_INFO("info...");
      |   ^~~~~~~~

為瞭解決上面的問題，在__VA_ARGS__前面添加上##，這樣的目的是告訴預處理器，如果可變參數為空，那麼前面緊跟者的逗號,在巨集定義展開時會被清理掉。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

ASF掛卡

ASF掛卡部署，非搬運且親測有效。一、如何下載ASF 1.下載ASF對應版本首先你需要確定自己的系統環境，這裡我採用的是centos7.6，即linux64位系統作為演示。第一步進入github查看最新的ASF版本，鏈接如下：https://github.com/JustArchiNET/Arc ...
樹莓派2b無屏裝centos

無屏幕、無網線、根目錄wpa_supplicant失效，甚至沒電腦也可以實現。以前跑樹莓派一直是用的ubuntu和raspbian，突然想試試centos。因為我沒有單獨的顯示屏，往常格式化寫鏡像之後，都是根目錄寫入ssh和wpa_supplicant，開機自動聯網獲得樹莓派ip就能ssh命令行登 ...
PostgreSQL 實時位置跟蹤+軌跡分析系統實踐 - 單機頂千億軌跡/天

背景隨著移動設備的普及，越來越多的業務具備了時空屬性，例如快遞，試試跟蹤包裹、快遞員位置。例如實體，具備了空間屬性。例如餐飲配送，送貨員位置屬性。例如車輛，實時位置。等等。其中兩大需求包括： 1、對象位置實時跟蹤，例如實時查詢某個位點附近、或某個多邊形區域內的送貨員。 2、對象位置軌跡記錄和分 ...
第七章-概念結構設計

7.1 資料庫設計概述：資料庫設計一般定義：資料庫設計是指對於一個給定的應用環境，構造（設計）優化的資料庫邏輯模式和物理結構，並據此建立資料庫及其應用系統，使之能夠有效地存儲和管理數據，滿足各種用戶的應用需求，包括信息管理要求和數據操作要求定的應用環境：一個資料庫不可能什麼數據都接收，如在學校或 ...
PostgreSQL 電子圍欄的應用場景和性能

PostgreSQL , 電子圍欄 , 共用自行車 , 共用充電寶 , 共用xxx , 菜鳥 , 航空管制 , 無人飛行器 , pipelinedb , 流式計算 ...
ES6中的解構賦值（數組，對象，嵌套，預設值）

解構賦值通過解構賦值，可以快速從對象或者數組中取出屬性或者數值。解構賦值可以通過定位到數組或者對象的某一個位置，將值直接賦給一個或多個變數。 const arr = ['dasha', 'ersha', 'gangdan'] let [a, b, c] = arr //a='dasha' b= ...
Angular--父子組件生命周期鉤子(lifecycle hooks)執行過程

俗話說，人靠衣裝，馬靠鞍。官網首頁是產品或公司的臉面，必須要大氣。原來舊版的支付寶首頁，有個大視頻作為頁面背景一直播放展示，效果很贊，所以實現了下先看看效果：亮點部分大視頻是絕對定位，定在最下麵，上面的文字是絕對定位，定在最上面。還加了一層半透明的div藍色調。文案的居中是使用的 disp ...
電腦等級考試二級C語言程式設計專項訓練題——文件操作

ArrayList 概述 ArrayList 是一種變長的集合類，底層是基於數組來實現的，所以 ArrayList 查詢效率高、增刪效率低 ArrayList 集合中的元素是有序、可重覆的，且可以存儲 null 空值當每次向 ArrayList 容器中添加元素時，會進行容量檢查：當往 ArrayL ...

冷知識：預處理字元串操作符

在C語言中什麼是標記？

預處理字元串操作符

# 字元串化操作符

## 標記(Token)連接操作符

## 還有個特殊的用途

`#` 字元串化操作符

`##` 標記(Token)連接操作符

`##` 還有個特殊的用途