Python 源代碼縮進格式化工具

来源:https://www.cnblogs.com/123456feng/archive/2022/05/06/16210262.html
-Advertisement-
Play Games

前言 昨天在跟小伙伴聊天,當他談起自己正在做的項目時,一臉愁容。 他吐槽道:“該項目的 Python 代碼庫由多個人共同維護。由於每個人使用的編輯器不同,每個人的編碼風格也不同,最終導致了 代碼的縮進千奇百怪:有縮進 2 個空格的,有縮進 4 個空格的,有縮進 8 個空格,有縮進一個 Tab 的,更 ...


前言

昨天在跟小伙伴聊天,當他談起自己正在做的項目時,一臉愁容。

他吐槽道:“該項目的 Python 代碼庫由多個人共同維護。由於每個人使用的編輯器不同,每個人的編碼風格也不同,最終導致了

代碼的縮進千奇百怪:有縮進 2 個空格的,有縮進 4 個空格的,有縮進 8 個空格,有縮進一個 Tab 的,更有縮進隨機數量空

的。導致代碼的可讀性非常差。“

在這裡插入圖片描述

小伙伴還說:“這種長短不一的代碼看著非常難受,我就手動將它們全部改成標準四空格縮進了。也考慮過使用自動化腳本,但一

時間沒什麼思路,就擱置了。”

這反映出一個問題:不同長度的縮進,雖不影響代碼解釋,但可讀性非常差,一律使用標準的四空格縮進是個不錯的主意。於

是,我便嘗試寫一個簡單的腳本工具,來解決這個實際問題。

經過簡單分析,確定如下思路:

•由於 Python 的縮進是按照層級進行的,只要下一層縮進比上一層更深,且同一層級的所有代碼縮進相同即可;

•可以逐行對源文件進行處理,對每一行源代碼,統計行前空格字元數量,確定該行代碼的縮進層級;

•每嵌套一層縮進,將空格數量增加四位,並記錄當前縮進層級;

•當發現當前行的縮進層級小於上一行代碼,則表示當前行已跳出一層或所層嵌套,對記錄層級的列表由後至前進行搜索,找到當

前行代碼對應的縮進層級;

在這裡插入圖片描述

•對於當前行代碼,根據其縮進層級,對其行首添加相應數量的空格。

為了統計每一行源代碼前的空格數量,我們使用 行的原始長度 - 刪除行左側空白後的長度 表示。

示例代碼如下:

Python學習交流Q群:903971231####
 1file_input = 'source.py'  # file to format
 2file_output = 'dest.py'   # formated file
 3
 4fin = open(file_input, 'r')
 5fout = open(file_output, 'w')
 6
 7space = 0
 8indent_lists = [0]
 9
10for line in fin:
11    # blank line just output
12    if len(line.lstrip()) == 0:
13        fout.write(line)
14        continue
15    # calc curret indent
16    indent = len(line) - len(line.lstrip())
17    # inc space when bigger indent
18    if indent > indent_lists[-1]:
19        indent_lists.append(indent)
20        space = space + 4
21    # dec space when smaller indent
22    while indent < indent_lists[-1]:
23        indent_lists.pop()
24        space = space - 4
25    # format the line
26    line = ' ' * space + line.lstrip()
27    fout.write(line)
28
29fin.close()
30fout.close()
下麵我們進行簡單的測試。

待格式化的源文件:
1#!/usr/bin/python
2# -*- coding: UTF-8 -*-
3
4for num in range(1, 10):
5  if num % 2 == 0:
6          print(str(num) + ' is even')
7  else:
8      print(str(num) + ' is odd')

 

在這裡插入圖片描述

可以看到:line5 縮進了 2 個空格,line6 縮進了 8 個空格,line8縮進了 4 個空格。看起來非常雜亂。

使用本腳本格式化後的源文件:

1#!/usr/bin/python
2# -*- coding: UTF-8 -*-
3
4for num in range(1, 10):
5    if num % 2 == 0:
6        print(str(num) + ' is even')
7    else:
8        print(str(num) + ' is odd')

 

可以看到,執行腳本後,所有的縮進都變成了 4 個空格。舒服了…

隨後小伙伴又提出:這個腳本每次只能處理一個文件,能不能批量處理呢?當然可以啦!只要對本腳本進行簡單的封裝,即可實

現多文件、多目錄處理啦:

 1def format_file(file_input, file_output):
 2    fin = open(file_input, 'r')
 3    fout = open(file_output, 'w')
 4
 5    space = 0
 6    indent_lists = [0]
 7
 8    for line in fin:
 9        # blank line just output
10        if len(line.lstrip()) == 0:
11            fout.write(line)
12            continue
13        # calc curret indent
14        indent = len(line) - len(line.lstrip())
15        # inc space when bigger indent
16        if indent > indent_lists[-1]:
17            indent_lists.append(indent)
18            space = space + 4
19        # dec space when smaller indent
20        while indent < indent_lists[-1]:
21            indent_lists.pop()
22            space = space - 4
23        # format the line
24        line = ' ' * space + line.lstrip()
25        fout.write(line)
26
27    fin.close()
28    fout.close()
29
30files_to_format = 3
31file_input_lists = ['1.py', '2.py', '3.py']       # file lists to format
32file_output_lists = ['11.py', '22.py', '33.py']   # formated file lists
33
34for i in range(files_to_format):
35    format_file(file_input_lists[i], file_output_lists[i])

 

上面代碼只是一個簡單的做法,當然我們可以根據目錄或者更多規則進行文件格式化,本例僅做拋磚引玉之意。

今天的分享到這裡就結束了,下一章見啦!!!

在這裡插入圖片描述


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • package com.oop.demo05;//在java中所有的類都直接或者間接預設繼承object//人 父類public class Person { //public 公有的 //protected 受保護的 //default 預設的 //private 私有的 //private in ...
  • Resources 類,顧名思義就是資源,用於讀取資源文件。其有很多方法通過載入並解析資源文件,返回不同類型的 IO 流對象 ...
  • 前言 在學習python的過程中,很多人會說,需要我的英語基礎特別好嘛? 是不需要的,它所常用的單詞其實就那麼多,只要你用心和常去敲敲代碼,其實是非常容易的。 下麵我整理了一些python常用單詞,你可以看一看,希望對你帶來幫助~ 由於不太好打出來,我就用圖片來代替啦~ 好啦~就到這裡啦~辭彙還是很 ...
  • ReentrantLock ReentrantLock功能 ReentrantLock和synchronized一樣是可重入的 可重入即當線程擁有了鎖時,當該線程再次請求鎖資源的時候,線程是可以再次成功獲得的。 static ReentrantLock lock = new ReentrantLoc ...
  • Spring Ioc源碼分析系列--Ioc的基礎知識準備 本系列文章代碼基於Spring Framework 5.2.x Ioc的概念 在Spring里,Ioc的定義為The IoC Container,翻譯過來也就是Ioc容器。為什麼會被叫做容器呢?我們來比對一下日常生活中的容器,也就是那些瓶瓶罐 ...
  • 上一篇文章https://www.cnblogs.com/redwinter/p/16198942.html介紹了Spring的註解的解析過程以及Spring Boot自動裝配的原理,大概回顧下:Spring 解析註解是通過BeanFactoryPostProcessor的子介面BeanDefini ...
  • 大家好,我是二哥! 很早之前,就有小伙伴給我反饋說《Java 程式員進階之路》經常有圖片不顯示或者載入緩慢。 但由於白嫖(GitHub圖床+jsdelivr CDN)的力量實在是太過強大了(狗頭),再加上我本人沒有遇到過這個問題,所以就一直拖延著,遲遲沒有行動。 直到某一天,我神秘的流量用光了,上不 ...
  • 一個工作七年的小伙伴,竟然不知道”wait”和“notify”為什麼要在Synchronized代碼塊裡面。 好吧,如果屏幕前的你也不知道,請在評論區打上”不知道“。 對於這個問題,我們來看看普通人和高手的回答。 普通人: 額。。。。。。。。。。。。 高手: wait和notify用來實現多線程之間 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...