Python將表格文件中某些列的數據整體向上移動一行

-Advertisement-

本文介紹基於Python語言，針對一個文件夾下大量的Excel表格文件，對其中的每一個文件加以操作——將其中指定的若幹列的數據部分都向上移動一行，並將所有操作完畢的Excel表格文件中的數據加以合併，生成一個新的Excel文件的方法~ ...

本文介紹基於Python語言，針對一個文件夾下大量的Excel表格文件，對其中的每一個文件加以操作——將其中指定的若幹列的數據部分都向上移動一行，並將所有操作完畢的Excel表格文件中的數據加以合併，生成一個新的Excel文件的方法。

首先，我們明確一下本文的需求。在一個文件夾內，有大量的Excel表格文件（以.csv格式文件為例），其中每一個文件都有著類似如下圖所示的數據特征；我們希望，對於下圖中紫色框內的列，其中的數據部分（每一列都有一個列名，這個列名不算數據部分）都向上提升一行（比如原本數據部分的第2行變到第1行，原本第3行變到第2行，以此類推）。

由上圖也可以看到，需要加以數據操作的列，有的在原本數據部分的第1行就沒有數據，而有的在原本的數據部分中第1行也有數據；對於後者，我們在數據向上提升一行之後，相當於原本第1行的數據就被覆蓋掉了。此外，很顯然在每一個文件的操作結束後，加以處理的列的數據部分的最後一行肯定是沒有數據的，因此在合併全部操作後的文件之前，還希望將每一個操作後文件的最後一行刪除。

知道了需求，我們就可以開始代碼的撰寫；具體代碼如下。

# -*- coding: utf-8 -*-
"""
Created on Fri May 19 01:47:06 2023

@author: fkxxgis
"""

import os
import pandas as pd

original_path = "E:/01_Reflectivity/25_2022Data_New"
result_path = "E:/01_Reflectivity/99_Model/02_Extract_Data/26_Train_Model_New"

result_df = pd.DataFrame()

for file in os.listdir(original_path):
    if file.endswith(".csv"):
        
        df = pd.read_csv(os.path.join(original_path, file))
        columns_move_index = list(range(8, 16)) + list(range(17, 36))
        for columns_index in columns_move_index:
            for i in range(len(df) - 1):
                df.iat[i, columns_index] = df.iat[i + 1, columns_index]
        if len(df):
            df = df.drop(len(df) - 1)
        # df = df.iloc[ : , 1 : ]
        result_df = pd.concat([result_df, df])
        
result_df.to_csv(os.path.join(result_path, "Train_Model_0715_Main.csv"), index = False)

其中，original_path表示存放有多個待處理的Excel表格文件的文件夾路徑，result_path則是結果Excel表格文件的存放路徑。

首先，我們通過result_df = pd.DataFrame()創建一個空的DataFrame，用於保存處理後的數據。接下來，遍歷原始文件夾中的所有文件，並找到文件夾內以.csv結尾的文件；隨後，讀取這些.csv文件，並將其保存到df中。

其次，我們通過columns_move_index = list(range(8, 16)) + list(range(17, 36))指定需要移動數據的列的索引範圍，並隨後遍歷需要移動數據的列。接下來的df.iat[i, columns_index] = df.iat[i + 1, columns_index]表示將當前行的數據替換為下一行對應的數據。

接下來，我們通過if len(df):判斷是否DataFrame不為空，如果是的話就刪除DataFrame中的最後一行數據；隨後，將處理後的DataFrame連接到result_df中。

最後，我們通過result_df.to_csv()函數，將最終處理後的DataFrame保存為一個新的Excel表格文件，從而完成我們的需求。

至此，大功告成。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

PLC結構化文本（ST）——屬性（Property）

PLC Structured Text Object Oriented Programming PLC結構化文本（ST）——屬性（Property）屬性的定義 C# 中的屬性（Property）是類和結構體中用於封裝數據的成員。它們提供了一種方式來定義類成員的訪問和設置規則，通常用於隱藏欄位（Fi ...
PHP 程式員學會了 Go 語言就能唬住面試官嗎？

唬住了 50k ，唬不住就 5k 。這句話一直是 PHP 程式員之間相互吹捧、吹牛逼的笑點，每次面試過後都會撓撓頭上僅剩的幾根頭髮，回想自己是否吹牛逼會過了頭。 ...
全網最適合入門的面向對象編程教程：46 Python函數方法與介面-函數與事件驅動框架

函數是 Python 中的一等公民,是一種可重用的代碼塊,用於封裝特定的邏輯；事件驅動框架是一種編程模式，它將程式的控制流轉移給外部事件,如用戶輸入、系統消息等，它事件驅動框架可以使用函數作為事件的處理邏輯。 ...
9/9

@目錄前言爬蟲步驟確定網址，發送請求獲取響應數據對響應數據進行解析保存數據完整源碼共勉博客前言本文寫了一個爬取視頻的案例，使用requests庫爬取了好看視頻的視頻，併進行保存到本地。後續也會更新selenium篇和DrissionPage篇。當然，爬取圖片肯定不止這三種方法，還有基於pytho ...
記錄JDK8到JDK17各個版本的更新重點

雖然大多數公司還是用的JDK8但是也要去瞭解和學習一下新得東西 ## JDK8新特性（2014年初）（LTS版本） 1、Lambda表達式 2、函數式編程 3、介面可以添加預設方法和靜態方法，也就是定義不需要實現類實現的方法 4、方法引用 5、重覆註解，同一個註解可以使用多次 6、引入Optiona ...
電腦網路之TCP/IP協議簡介

TCP/IP協議簡介首先TCP/IP協議不只是表示TCP協議和IP協議兩種協議，而是一個協議簇。協議簇是什麼並不難理解，就是字面意思，一個由多個協議組合而成的集合體，其中最有代表性的就是TCP和IP這兩個協議，除了這兩個還有我們熟知的FTP、UDP等協議。當然我們下麵主要介紹的還是這兩位主角TC ...
redis常用知識彙總（包括 jedis 和 springboot 整合 redis）

介紹 Redis 是一個開源的記憶體資料庫，它支持多種數據結構，並且常用於高速緩存、會話管理、消息隊列等場景。Redis 的全稱是 Remote Dictionary Server，是一種 key-value（鍵值對）存儲系統，能夠以極高的性能處理大量數據的讀寫操作。 Redis 的主要特點：基於內 ...
Java 工程解耦即高內聚低耦合

工程結構和模塊不斷地從 JAVA 的單體應用中分離。單體應用結構只有一個項目結構，有一個項目文件包。剛開學習電腦 JAVA 編程的時候，JAVA 項目分為 JAVAEE 和 JAVASE. 標準的 JAVA 類庫 jdk 是基礎的JAVA 開發工具箱，沒有綁定任何商業開發的工具包。企業 ...