既然有HTTP協議，為什麼還要有RPC？

我想起了我剛工作的時候，第一次接觸RPC協議，當時就很懵，我HTTP協議用得好好的，為什麼還要用RPC協議？於是就到網上去搜。不少解釋顯得非常官方，我相信大家在各種平臺上也都看到過，解釋了又好像沒解釋，都在用一個我們不認識的概念去解釋另外一個我們不認識的概念，懂的人不需要看，不懂的人看了還是不懂 ...

我想起了我剛工作的時候，第一次接觸RPC協議，當時就很懵，我HTTP協議用得好好的，為什麼還要用RPC協議？

於是就到網上去搜。

不少解釋顯得非常官方，我相信大家在各種平臺上也都看到過，解釋了又好像沒解釋，都在用一個我們不認識的概念去解釋另外一個我們不認識的概念，懂的人不需要看，不懂的人看了還是不懂。

這種看了，又好像沒看的感覺，雲里霧裡很難受，我懂。

為了避免大家有強烈的審醜疲勞，今天我們來嘗試重新換個方式講一講。

一、從TCP聊起

作為一個程式員，假設我們需要在A電腦的進程發一段數據到B電腦的進程，我們一般會在代碼里使用socket進行編程。

這時候，我們可選項一般也就TCP和UDP二選一。TCP可靠，UDP不可靠。除非是馬總這種神級程式員（早期QQ大量使用UDP），否則，只要稍微對可靠性有些要求，普通人一般無腦選TCP就對了。

類似下麵這樣。

fd = socket(AF_INET,SOCK_STREAM,0);

其中SOCK_STREAM，是指使用位元組流傳輸數據，說白了就是TCP協議。

在定義了socket之後，我們就可以愉快地對這個socket進行操作，比如用bind()綁定IP埠，用connect()發起建連。

握手建立連接流程

在連接建立之後，我們就可以使用send()發送數據，recv()接收數據。

光這樣一個純裸的TCP連接，就可以做到收發數據了，那是不是就夠了？

不行，這麼用會有問題。

二、使用純裸TCP會有什麼問題

八股文常背，TCP是有三個特點，面向連接、可靠、基於位元組流。

TCP是什麼

這三個特點真的概括得非常精辟，這個八股文我們沒白背。

每個特點展開都能聊一篇文章，而今天我們需要關註的是基於位元組流這一點。

位元組流可以理解為一個雙向的通道里流淌的數據，這個數據其實就是我們常說的二進位數據，簡單來說就是一大堆 01 串。純裸TCP收發的這些 01 串之間是沒有任何邊界的，你根本不知道到哪個地方纔算一條完整消息。

01二進位位元組流

正因為這個沒有任何邊界的特點，所以當我們選擇使用TCP發送"夏洛"和"特煩惱"的時候，接收端收到的就是"夏洛特煩惱"，這時候接收端沒法區分你是想要表達"夏洛"+"特煩惱"還是"夏洛特"+"煩惱"。

消息對比

這就是所謂的粘包問題，之前也寫過一篇專門的文章聊過這個問題。

說這個的目的是為了告訴大家，純裸TCP是不能直接拿來用的，你需要在這個基礎上加入一些自定義的規則，用於區分消息邊界。

於是我們會把每條要發送的數據都包裝一下，比如加入消息頭，消息頭裡寫清楚一個完整的包長度是多少，根據這個長度可以繼續接收數據，截取出來後它們就是我們真正要傳輸的消息體。

消息邊界長度標誌

而這裡頭提到的消息頭，還可以放各種東西，比如消息體是否被壓縮過和消息體格式之類的，只要上下游都約定好了，互相都認就可以了，這就是所謂的協議。

每個使用TCP的項目都可能會定義一套類似這樣的協議解析標準，他們可能有區別，但原理都類似。

於是基於TCP，就衍生了非常多的協議，比如HTTP和RPC。

三、HTTP和RPC

我們回過頭來看網路的分層圖。

四層網路協議

TCP是傳輸層的協議，而基於TCP造出來的HTTP和各類RPC協議，它們都只是定義了不同消息格式的應用層協議而已。

HTTP協議（Hyper Text Transfer Protocol），又叫做超文本傳輸協議。我們用的比較多，平時上網在瀏覽器上敲個網址就能訪問網頁，這裡用到的就是HTTP協議。

HTTP調用

而RPC（Remote Procedure Call），又叫做遠程過程調用。它本身並不是一個具體的協議，而是一種調用方式。

舉個例子，我們平時調用一個本地方法就像下麵這樣。

 res = localFunc(req)

如果現在這不是個本地方法，而是個遠端伺服器暴露出來的一個方法remoteFunc，如果我們還能像調用本地方法那樣去調用它，這樣就可以屏蔽掉一些網路細節，用起來更方便，豈不美哉？

 res = remoteFunc(req)

RPC可以像調用本地方法那樣調用遠端方法

基於這個思路，大佬們造出了非常多款式的RPC協議，比如比較有名的gRPC，thrift。