揭秘String類型背後的故事——帶你領略彙編語言魅力

来源:https://www.cnblogs.com/chenmo2580/archive/2019/11/08/11823356.html
-Advertisement-
Play Games

字元串或串(String)是由數字、字母、下劃線組成的一串字元。一般記為 s=“a1a2···an”(n>=0)。它是編程語言中表示文本的數據類型。在程式設計中,字元串(string)為符號或數值的一個連續序列,如符號串(一串字元)或二進位數字串(一串二進位數字)。 String類型你一定不陌生,畢 ...


字元串或串(String)是由數字、字母、下劃線組成的一串字元。一般記為 s=“a1a2···an”(n>=0)。它是編程語言中表示文本的數據類型。在程式設計中,字元串(string)為符號或數值的一個連續序列,如符號串(一串字元)或二進位數字串(一串二進位數字)。

String類型你一定不陌生,畢竟每一位coder都是從var str1 = “Hello World”過來的。

但它真的就只是如此嗎?聽我娓娓道來。

一、思考

 

在 Swift 開發使用字元串的過程中,你是否有思考過以下問題?

 

- 1 個字元串變數占用多少記憶體?

- 字元串 str1、str2 的底層存儲有什麼不同?

 

- 如果對 str1、str2 進行拼接操作,str1、str2 的底層存儲又會發生什麼變化?

 

 

如果你能準確地回答以上問題,那說明對 Swift 字元串的底層存儲機制還是比較瞭解的。

 二、1 個字元串變數占用多少記憶體?

 

方法 1:MemoryLayout

 

首先,可以藉助 Swift 自帶的 MemoryLayout 來測試一下

 

 

 方法 2:彙編

 

另外,我們也可以藉助一個強有力的底層分析助手—彙編語言,來窺探一下 String 的底層存儲

 

- 實際上分析其他語法、系統庫的底層,都可以藉助彙編語言

  - 比如多態的原理、泛型的原理、Array 的底層、枚舉的底層等等

  另外,不僅僅是 Swift,C、C++、OC 的底層分析,依然可以藉助彙編語言

  - 畢竟你寫的每一行有效代碼,最終都是要轉成機器指令(0 和 1)

  - 而機器指令是跟彙編指令一一對應的,每一條機器指令都能翻譯成與之對應的彙編指令

  - 能讀懂彙編指令,就相當於能讀懂機器指令,知道 CPU 具體在幹嘛(操作了什麼寄存器,操作了哪塊記憶體)

 

- 本教程的代碼是直接跑在 Mac 的命令行(CommandLineTools)項目上

  - 因此展示的彙編代碼是基於 X64 的 AT&T 格式彙編,並非 iOS 真機設備的 ARM 彙編

  - 其實不同種類的彙編之間有極大的相似性,只是有些指令的叫法不一樣

 

跟微軟的 Visual Studio 一樣,Xcode 也內置了非常方便的反彙編功能,可以輕鬆查看每一句代碼對應的彙編指令,打開反彙編界面的步驟如下

 

- 在某一行需要調試的代碼打上斷點(反彙編界面會在斷點調試狀態下顯示出來)

 

- 菜單:`Debug` > `Debug Workflow` > `Always Show Disassembly`

  - `Assembly` 譯為彙編, `Disassembly` 譯為反彙編

 

-   運行程式,看到反彙編界面

 

如果你的反彙編經驗十足,根據第 16、17 行的彙編就可以推敲出來,String 是占用 16 個位元組

 

- 因為它用了 rax、rdx 寄存器存放字元串 str 的內容,而 rax、rdx 都是 8 位元組的

彙編的內容太多了,因為時間和篇幅關係,文章里並不會對每一句彙編指令進行詳細地講解,更多的是想說明彙編的重要性。

 三、字元串的底層存儲

 

窺探記憶體

 

此前我寫了個可以窺探 Swift 變數記憶體的小工具:https://github.com/CoderMJLee/Mems

 

- 現在用它來窺探下字元串的 16 位元組裡面,究竟存儲著什麼數據

 

- `Mems.memStr(ofVal:)` 預設情況下按照 8 個位元組一組來顯示記憶體數據

 

- 傳遞參數 `alignment: .one` 是按照 1 個位元組一組來顯示記憶體數據

 

 

 

 

字元 '0'~'9' 的 ASCII 值是 0x30~0x39,認真觀察最初 str1 的 16 個位元組數據,你發現了什麼?

 

- 它直接將所有字元的 ASCII 值存儲在 str1 的 16 位元組中

 

- 最後 1 個位元組 0xea 中的 0xa 就是字元的數量,也是共 10 個字元

拼接

 

 

可以發現,當對 str1 進行拼接 "ABCDE" 的時候

- 它最終是將 "0123456789ABCDE"十五個字元的 ASCII 值都存儲在了 str1 的 16 位元組中

- 最後 1 個位元組 0xef 中的 0xf 就是字元的數量,也是共 15 個字元

- 可以看得出來,目前 16 個位元組已經存滿了,那如果再拼接 1 個字元呢?

 

 

 

 

可以看到,str1 裡面存儲的數據發生了非常大的變化,每一個字元的 ASCII 值不見了,

- 那裡面的 16 位元組具體是什麼含義呢?

- 所有字元('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?

其他情況

如果一開始初始化的時候(未拼接之前),字元串的內容就是超過 15 個字元呢?

 

 

相信你能猜到是這個結果

- 這 16 個位元組裡面並沒有出現任何一個字元的 ASCII 值

- 而且這 16 個位元組跟 `第27行的str1` 還是有所區別

  - 雖然它們的字元串內容都是"0123456789ABCDEF"

 

如果對 str2 進行拼接操作

 

 

 

不難發現:這時 str2 的 16 位元組又發生了變化,跟 `第27行的str1` 是有點相似的

如何解決上述疑問?

上述的種種疑問,光看列印出來的記憶體數據是無法解決的,但是都可以利用【!!!彙編!!!】來解決,分析彙編指令,立馬就得出結論,因為文章的篇幅有限,平時工作也比較忙,我把上述問題的詳細剖析過程錄製成了長達 2 個多小時的視頻,有興趣的朋友可以用 1.5~2 倍速度觀看

- 鏈接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA

- 提取碼:kzrk

- 視頻對於沒有彙編基礎的朋友來說,可能會有點難度,最好挑一個頭腦清醒的時間去觀看

- 看完視頻後,希望大家能夠確切地感受到彙編語言的重要性,不要永遠只停留在編寫高級語言代碼、沉迷於語法糖的層面。

 四、最後

最後想多說一句:彙編能給你帶來的價值遠遠不止這篇文章所說的窺探字元串的底層,對你的程式生涯影響絕對是終生受益的(數據結構與演算法功底也是如此),比如你還能玩轉軟體破解、游戲外掛等,這是我此前用【彙編\C++】編寫的一個游戲外掛:https://github.com/CoderMJLee/SeemygoPVZCheater

 

彙編語言是最接近於機器語言的編程語言。如果說機器語言是電腦操作的本質,那麼彙編語言就是最最接近本質的語言。彙編語言能夠讓你更好的理解高級語言,學會彙編後,你可以通過修改高級語言的代碼來提高演算法所不能提高的效率。

在編程領域,字元串雖然是所有編程語言中最重要的部分之一,但它也僅僅是這片領域的一隅。對程式員而言,唯有不斷的探索學習更多技術,才能在這片領域中縱橫遨游。

以上就是我的技術分享,感覺意猶未盡還想學的朋友,送福利了!!想獲取更多技術提升秘籍,歡迎加微信:19950277730,我在這裡為你隨時解答。這裡有很多如 iOS、數據結構與演算法等編程技巧的免費視頻和學習資料。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • (手機橫屏看源碼更方便) 註:java源碼分析部分如無特殊說明均基於 java8 版本。 註:本文基於ForkJoinPool分治線程池類。 簡介 隨著在硬體上多核處理器的發展和廣泛使用,併發編程成為程式員必須掌握的一門技術,在面試中也經常考查面試者併發相關的知識。 今天,我們就來看一道面試題: 如 ...
  • 題目: 鏈接:https://www.nowcoder.com/questionTerminal/6736cc3ffd1444a4a0057dee89be789b?orderByHotValue來源:牛客網牛牛舉辦了一次編程比賽,參加比賽的有3*n個選手,每個選手都有一個水平值a_i.現在要將這些選 ...
  • 1 先談Finalize() finalize()能做的所有工作,使用try-finally或者其他方式都可以做得更好、更及時,所以筆者建議大家完全可以忘掉Java語言中有這個方法的存在。 ——《深入理解JVM》 finalize()方法確實可以實現一次對象的自救,但是其不確定性和昂貴的運行代價都表 ...
  • 通過前面2篇文章我們搭建了SW的基礎環境,監控了微服務,能瞭解所有服務的運行情況。但是當出現服務響應慢,介面耗時嚴重時我們需要立即定位到問題,這就需要我們今天的主角 監控告警,同時此篇也是SW系列的最後一篇。 UI參數 首先我們認識一下SW DashBoard上的幾個關鍵參數,如下圖所示 告警配置 ...
  • 一.docker簡介 1、docker定義:docker是一個用來裝應用的容器,就像杯子可以裝水,筆筒可以裝筆,書包可以放書一樣。你可以把“Hello World!”放到docker中,也可以把網站放到docker中,你可以把任何你想到的程式放到docker中。 2、docker思想: (1)集裝箱 ...
  • 智力題目有三個容積分別為3升、5升、8升的水桶,其中容積為8升的水桶中裝滿了水,容積為3升和容積為5升的水桶都是空的。三個水桶都沒有刻度,現在需要將大水桶中的8升水等分成兩份,每份都是4升水,附加條件是只能這三個水桶,不能藉助其他輔助容器。“恩,是的,這是一個很經典的問題。”“然而,我們並不能想全, ...
  • 今天,在Anaconda prompt啟動python遇到瞭如下錯誤: UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xaf in position 553: illegal multibyte sequence 看了看出錯跟蹤,查看瞭如下位置 ...
  • 許多小伙伴對於java中的三種初始化塊的執行順序一直感到頭疼,接下來我們就來分析一下這三種初始化塊到底是怎麼運行的。有些公司也會將這個問題作為筆試題目。 下麵通過一段代碼來看看創建對象時這麼初始化塊是如何運行的 package com.hxy; public class CodeBlock{ pub ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...