python成長之路第一篇(5)文件的基本操作

来源:http://www.cnblogs.com/bj-xy/archive/2016/02/05/5183741.html
-Advertisement-
Play Games

一、三元運算 我們在上章學習的if,,else,,有一種簡便的方法 他的表達式是這樣的:變數 = 值1 if 條件 else 值2 解釋過來就是如果aaa等於sss則輸出值1否則輸出值2 二、類的概念 類是面向對象編程的核心, 它扮演相關數據及邏輯的容器角色。它們提供了創建“真實” 對象(也就是實例


一、三元運算 

我們在上章學習的if,,else,,有一種簡便的方法

他的表達式是這樣的:變數 = 值1 if 條件 else 值2

image

解釋過來就是如果aaa等於sss則輸出值1否則輸出值2

二、類的概念

類是面向對象編程的核心, 它扮演相關數據及邏輯的容器角色。它們提供了創建“真實”
對象(也就是實例)的藍圖。對於Python,一切事物都是對象,對象基於類創建。

image

如何查詢對象的類呢?

image

為啥分為有下劃線和沒下劃線的呢,這些又是什麼呢?本例中以查看的是列表的類,那麼這個類下麵就有了很多的方法也就是下麵看到的,帶下劃線的為內置方法,不帶下劃線的非內置方法只能表示一種方式,只能執行一種方式。也就是說這個變數是列表類型的就能使用這個列表類的所有方法

type:查看對象的類型

dir(類型名)查看類中提供的功能

help(類型名)查看類中所有詳細的功能

help(類型名.功能名稱)查看類中某功能的詳細信息

這裡只是瞭解一下至於功能後續會有專門的文章寫

Pycharm看類的方法:

image

 

三、文件操作

python是怎麼操作文件的呢?我們一起來看一下,一般來說對文件的操作有這麼幾種讀寫追加

open函數

不同模式打開文件的完全列表:

       模式       描述

r

以只讀方式打開文件。文件的指針將會放在文件的開頭。這是預設模式。

rb

以二進位格式打開一個文件用於只讀。文件指針將會放在文件的開頭。

r+

打開一個文件用於讀寫。文件指針將會放在文件的開頭。

rb+

以二進位格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。

w

打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

wb

以二進位格式打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

w+

打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

wb+

以二進位格式打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

a

打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。

ab

以二進位格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。

a+

打開一個文件用於讀寫。如果該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在,創建新文件用於讀寫。

ab+

以二進位格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。如果該文件不存在,創建新文件用於讀寫。

(1)打開文件

foo = open('test','r') #open是關鍵字,test是文件的名稱,r是打開的模式為只讀
print(foo)

<_io.TextIOWrapper name='test' mode='r' encoding='cp936'>

哦?返回的是什麼東東,原來在打開文件後,foo的值等於一個迭代器,迭代器是訪問集合內元素的一種方式。迭代器對象從集合的第一個元素開始訪問,直到所有的元素都被訪問一遍後結束。迭代器不能回退,只能往前進行迭代。

那怎麼能夠看到裡面的內容呢?非常簡單

(2)載入文件內容到記憶體

read()函數:

foo = open('test','r')
foo = foo.read()
print(foo)

只需要foo 等於foo.read(),read函數的作用就是從一個打開的文件中讀取一個字元串。

據說有人不喜歡read方式來讀取文件!!這是為什呢呢?

因為:

read()的機制是將文件內容一股腦的讀入記憶體,滿足不了大家的需求

所以出現了readlines()一次性載入所有內容到記憶體,並按照行分割,合成列表

readlines()

foo = open('test','r')
ss = foo.readlines()
print(ss)
['a\n', 'bb\n', 'ccc\n', 'dddd\n', 'eeeee']
納尼\n是毛毛啊,哦原來是換行符嚇老子一跳,還有人說了 我就1M的記憶體讀1G的文件,你不是要我命麽,沒關係python還有另外的方法來處理文件
readline()
每次僅讀取一行數據,這樣我們就可以for迴圈,處理到要處理的內容退出就好了
foo = open('test','r+')
ss = foo.readline()
dd = foo.readline()
print(ss+dd)

a
bb

(3)讀取中文文件

有勤快的小同學就試了試,尼瑪為啥中文文件就報錯呢?其實呢,不是你寫錯的而是編碼問題

①編碼與解碼

對於中文文件編碼格式為gbk,所以在正常的情況下我們使用Pycharm進行調試時用的是uft-8的編碼格式所以會報錯

image

我們知道我們現在一般接觸三種編碼格式分別是,gbk,utf-8,unicode

unicode:萬國碼Unicode 是為瞭解決傳統的字元編碼方案的局限而產生的,它為每種語言中的每個字元設定了統一併且唯一的二進位編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。

utf-8:UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言

GBK:是漢字編碼標準之一中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂

那麼他們之間的關係是什麼樣的呢,其實主需要記住一點就好,gbk,utf-8它的源是unicode,所以呢請看下圖

image

decode是解碼,encode是編碼,也就是gbk想要轉換成utf-8就需要先把gbk解碼成unicode,然後unicode在編碼成utf-8,我們來試一下

②python2.7和3.5正常輸出中文的多種方法

這些方法主要目的都是為了把編碼變成utf-8

python2.7:

方法1:在pycharm項目目錄下用windows創建一個txt文件

foo = open('ttt.txt','r')
ss = foo.read().decode('gbk')
print ss


二二
三三三
四四四四
五五五五五
六六六六六六

python3.5:

0.0是不是很鬱悶他自己就可以不需要變換編碼

foo = open('ttt.txt','r')
ss = foo.read()
print (ss)
 
codecs函數重點來了:
不管是2.7還是3.5有一些特殊的情況無法輸出中文字元則我們用到codecs這個函數
image 
調用了codecs函數後:
image 
其實呢方法很簡單激素codecs這個函數也提供了open的方法,只需要codecs.open(‘文件名’,’打開模式’,’編碼格式’)就好了。
註意:
使用pycharm切換2.7和3.5的時候可能出現混亂建議實際測試為準
 
(4)寫入操作
python提供了這麼多種打開方式,其實常用不沒有幾個r,r+,w,w+,a,a+我們一一來看①r+啥情況我前面的東西呢!!,額好吧全被替換掉了(推薦測試使用linu畢竟都是運行在linux中
image 
②w,汗以前的內容全被替換掉了,w+就不用測試了吧
image 
③a哦原來追加到最後了為毛不換行!在前面加個\n試試
image 
image 
(5)刪除
對於python來說沒有提供直接刪除文件內容的功能,所以只能使用語句來判斷(反正我是不知道)
例子:反正是特別麻煩後面可以使用with 來優化一下我來解釋一下,首先打開文件,for當i的內容等於ccc\n的情況下什麼也不做,否則添加入列表,因為有換行符所以有\n,最後用w+打開文件把列表中的內容寫入進去即可
 1 foo = open('text','r')
 2 aa = foo.readlines()
 3 ccc = []
 4 for i in aa:
 5     if i == 'ccc\n':
 6         continue
 7     else:
 8         ccc.append(i)
 9 foo.close()
10 
11 foe= open('text','w+')
12 for iss in ccc:
13     foe.write(iss)
14 foo.close()
刪除

 

(6)file對象的屬性
以下是和file對象相關的所有屬性的列表:
image 
例子:
fo = open("foo.txt", "r+")
print "文件名: ", fo.name
print "是否已關閉 : ", fo.closed
print "訪問模式 : ", fo.mode
print "末尾是否強制加空格 : ", fo.softspace
結果:
文件名:  foo.txt
是否已關閉 :  False
訪問模式 :  wb
末尾是否強制加空格 :  0

(7)文件定位

大家看到上面的打開方式的列表中有一個這樣的詞語‘指針’,那麼這個指針就類似於游標定位的位置,所以在python中,就有這個定位的操作

原文件text

aaa
bbb
ddd
fff

①打開文件,為什這裡只輸出了aaa bb呢,是因為read()後面加了個指針,指到了6,所以輸出了這個,有人還問了那指到了6應該輸出三個b啊現在怎麼是兩個呢,其實呢是因為你妹的還有個換行符占了個位置

1 foo = open('text','r+')
2 aa = foo.read(6)
3 print(aa)
4 aaa 
5 bb
文件定位-打開文件
② 查找當前位置tell()
foo = open('text','r+')
aa = foo.read(3)
ss = foo.tell()
print(aa,ss)
③把指針再次重新定位到文件開頭
1 foo = open('text','r+')
2 aa = foo.read(3)
3 print(foo.tell())
4 print(aa)
5 foo.seek(0, 0)
6 print(foo.tell())
7 3 
8 aaa 
9 0
重新定位指針

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 由於前幾次都沒能寫完,這次年底總算有自由時間了,又想繼續搗鼓一下。於是下載了VS 2015專業版(不知為什麼我特別鐘愛專業版,而不喜歡企業版)。由於以前的教訓,我這次決定寫一個極簡的Deom,簡到什麼程度呢?簡單到只實現添加、修改欄目,用戶登錄後可以添加管理文章、管理員登陸後可以修改網站設置(也就標...
  • 1 using System; 2 using System.Collections.Generic; 3 using System.Linq; 4 using System.Web; 5 using System.Web.UI; 6 using System.Web.UI.WebControls;
  • 之前就是說過“一個項目有很多重要的步驟以及功能”,那我們現在就來看看對於KTV項目來說;後臺是處於什麼樣的重要作用! 首先就得瞭解KTV後臺的一些功能了: 1.歌曲管理 、歌手管理 、設置資源路徑 2.新增歌手、歌手查詢、新增歌曲、歌曲查詢、更改歌曲路徑以及退出點歌系統 一.後臺登錄界面 01.判斷
  • 這裡是簡要的一些微信支付,公眾號支付的一些流程,包括以下配置信息,錯誤信息等,並不全面,但是希望能夠幫助到大家,不喜勿噴,我也是新手,也當是給自己寫了一個筆記,加深一下影響,以後再遇到,也能方便自己的學習
  • 本篇文章的主旨是使用 .NET/C# 實現 TCP 高性能服務的不同方式,包括但不限於如下內容:APM 方式,即 Asynchronous Programming Model;TAP 方式,即 Task-based Asynchronous Pattern;SAEA 方式,即 SocketAsync...
  • 集合概述 集合簡單的說就是數組的升級版。他可以動態的對集合的長度(也就是集合內最大元素的個數)進行定義和維護! ArrayList ArrayList非常類似於數組。也有人稱他為數組列表,它的容量可以根據需要進行動態擴充,而它的索引也會根據集合容量的擴展而重新分配和調整。也就是說ArrayList集...
  • ASP.NET使用StructureMap等依賴註入組件時最重要就是EntityFramework的DbContext對象要保證在每次HttpRequest只有一個DbContext實例,這裡將使用第三方提供的HttpSimulator進行測試。 1.定義IDependency介面 創建屏蔽不同依賴
  • 由快速排序引發對Java方法參數的思考
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...