Pandas 基礎學習

来源:https://www.cnblogs.com/zfcode/archive/2018/03/02/Pandas-ji-chu-xue-xi.html
-Advertisement-
Play Games

載入數據Fun:pandas.read_csv>>> import pandas>>> food_info = pandas.read_csv("food_info.csv")>>> print(food_info.dtypes)NDB_No int64Shrt_Desc objectWater_(... ...


載入數據

Fun:pandas.read_csv

>>> import pandas
>>> food_info = pandas.read_csv("food_info.csv")
>>> print(food_info.dtypes)
NDB_No               int64
Shrt_Desc           object
Water_(g)          float64
Energ_Kcal           int64
Protein_(g)        float64
Lipid_Tot_(g)      float64
Ash_(g)            float64
Carbohydrt_(g)     float64
Fiber_TD_(g)       float64
Sugar_Tot_(g)      float64
Calcium_(mg)       float64
Iron_(mg)          float64
Magnesium_(mg)     float64
Phosphorus_(mg)    float64
Potassium_(mg)     float64
Sodium_(mg)        float64
Zinc_(mg)          float64
Copper_(mg)        float64
Manganese_(mg)     float64
Selenium_(mcg)     float64
Vit_C_(mg)         float64
Thiamin_(mg)       float64
Riboflavin_(mg)    float64
Niacin_(mg)        float64
Vit_B6_(mg)        float64
Vit_B12_(mcg)      float64
Vit_A_IU           float64
Vit_A_RAE          float64
Vit_E_(mg)         float64
Vit_D_mcg          float64
Vit_D_IU           float64
Vit_K_(mcg)        float64
FA_Sat_(g)         float64
FA_Mono_(g)        float64
FA_Poly_(g)        float64
Cholestrl_(mg)     float64
dtype: object
>>> print(type(food_info))
<class 'pandas.core.frame.DataFrame'>

取數據的頭和尾

頭:head

food_info.head(1)

尾:tail

food_info.tail(1)

shape

>>> food_info.shape
(8618, 36)

取數據

指定行數據

>>> print(food_info.loc[0])
NDB_No                         1001
Shrt_Desc          BUTTER WITH SALT
Water_(g)                     15.87
Energ_Kcal                      717
Protein_(g)                    0.85
Lipid_Tot_(g)                 81.11
Ash_(g)                        2.11
Carbohydrt_(g)                 0.06
Fiber_TD_(g)                      0
Sugar_Tot_(g)                  0.06
Calcium_(mg)                     24
Iron_(mg)                      0.02
Magnesium_(mg)                    2
Phosphorus_(mg)                  24
Potassium_(mg)                   24
Sodium_(mg)                     643
Zinc_(mg)                      0.09
Copper_(mg)                       0
Manganese_(mg)                    0
Selenium_(mcg)                    1
Vit_C_(mg)                        0
Thiamin_(mg)                  0.005
Riboflavin_(mg)               0.034
Niacin_(mg)                   0.042
Vit_B6_(mg)                   0.003
Vit_B12_(mcg)                  0.17
Vit_A_IU                       2499
Vit_A_RAE                       684
Vit_E_(mg)                     2.32
Vit_D_mcg                       1.5
Vit_D_IU                         60
Vit_K_(mcg)                       7
FA_Sat_(g)                   51.368
FA_Mono_(g)                  21.021
FA_Poly_(g)                   3.043
Cholestrl_(mg)                  215
Name: 0, dtype: object

取範圍數據

>>> print(food_info.loc[1:2])
   NDB_No                 Shrt_Desc  Water_(g)  Energ_Kcal  Protein_(g)  \
1    1002  BUTTER WHIPPED WITH SALT      15.87         717         0.85
2    1003      BUTTER OIL ANHYDROUS       0.24         876         0.28

   Lipid_Tot_(g)  Ash_(g)  Carbohydrt_(g)  Fiber_TD_(g)  Sugar_Tot_(g)  \
1          81.11     2.11            0.06           0.0           0.06
2          99.48     0.00            0.00           0.0           0.00

        ...        Vit_A_IU  Vit_A_RAE  Vit_E_(mg)  Vit_D_mcg  Vit_D_IU  \
1       ...          2499.0      684.0        2.32        1.5      60.0
2       ...          3069.0      840.0        2.80        1.8      73.0

   Vit_K_(mcg)  FA_Sat_(g)  FA_Mono_(g)  FA_Poly_(g)  Cholestrl_(mg)
1          7.0      50.489       23.426        3.012           219.0
2          8.6      61.924       28.732        3.694           256.0

取列數據

>>> print(food_info["NDB_No"])
0        1001
1        1002
2        1003
3        1004
4        1005
5        1006
6        1007
7        1008
8        1009
9        1010
10       1011
11       1012
12       1013
13       1014
14       1015
15       1016
16       1017
17       1018
18       1019
19       1020
20       1021
21       1022
22       1023
23       1024
24       1025
25       1026
26       1027
27       1028
28       1029
29       1030
        ...
8588    43544
8589    43546
8590    43550
8591    43566
8592    43570
8593    43572
8594    43585
8595    43589
8596    43595
8597    43597
8598    43598
8599    44005
8600    44018
8601    44048
8602    44055
8603    44061
8604    44074
8605    44110
8606    44158
8607    44203
8608    44258
8609    44259
8610    44260
8611    48052
8612    80200
8613    83110
8614    90240
8615    90480
8616    90560
8617    93600
Name: NDB_No, Length: 8618, dtype: int64

取多個列的數據

>>> print(food_info[["NDB_No","Shrt_Desc"]])
      NDB_No                                          Shrt_Desc
0       1001                                   BUTTER WITH SALT
1       1002                           BUTTER WHIPPED WITH SALT
2       1003                               BUTTER OIL ANHYDROUS
3       1004                                        CHEESE BLUE
4       1005                                       CHEESE BRICK
5       1006                                        CHEESE BRIE
6       1007                                   CHEESE CAMEMBERT
7       1008                                     CHEESE CARAWAY
8       1009                                     CHEESE CHEDDAR
9       1010                                    CHEESE CHESHIRE
10      1011                                       CHEESE COLBY
11      1012                CHEESE COTTAGE CRMD LRG OR SML CURD
12      1013                        CHEESE COTTAGE CRMD W/FRUIT
13      1014   CHEESE COTTAGE NONFAT UNCRMD DRY LRG OR SML CURD
14      1015                   CHEESE COTTAGE LOWFAT 2% MILKFAT
15      1016                   CHEESE COTTAGE LOWFAT 1% MILKFAT
16      1017                                       CHEESE CREAM
17      1018                                        CHEESE EDAM
18      1019                                        CHEESE FETA
19      1020                                     CHEESE FONTINA
20      1021                                     CHEESE GJETOST
21      1022                                       CHEESE GOUDA
22      1023                                     CHEESE GRUYERE
23      1024                                   CHEESE LIMBURGER
24      1025                                    CHEESE MONTEREY
25      1026                         CHEESE MOZZARELLA WHL MILK
26      1027                CHEESE MOZZARELLA WHL MILK LO MOIST
27      1028                   CHEESE MOZZARELLA PART SKIM MILK
28      1029               CHEESE MOZZARELLA LO MOIST PART-SKIM
29      1030                                    CHEESE MUENSTER
...      ...                                                ...
8588   43544         BABYFOOD CRL RICE W/ PEARS & APPL DRY INST
8589   43546                     BABYFOOD BANANA NO TAPIOCA STR
8590   43550                     BABYFOOD BANANA APPL DSSRT STR
8591   43566       SNACKS TORTILLA CHIPS LT (BAKED W/ LESS OIL)
8592   43570  CEREALS RTE POST HONEY BUNCHES OF OATS HONEY RSTD
8593   43572                         POPCORN MICROWAVE LOFAT&NA
8594   43585                       BABYFOOD FRUIT SUPREME DSSRT
8595   43589                               CHEESE SWISS LOW FAT
8596   43595             BREAKFAST BAR CORN FLAKE CRUST W/FRUIT
8597   43597                            CHEESE MOZZARELLA LO NA
8598   43598                           MAYONNAISE DRSNG NO CHOL
8599   44005                          OIL CORN PEANUT AND OLIVE
8600   44018                   SWEETENERS TABLETOP FRUCTOSE LIQ
8601   44048                              CHEESE FOOD IMITATION
8602   44055                                CELERY FLAKES DRIED
8603   44061           PUDDINGS CHOC FLAVOR LO CAL INST DRY MIX
8604   44074                    BABYFOOD GRAPE JUC NO SUGAR CND
8605   44110                   JELLIES RED SUGAR HOME PRESERVED
8606   44158                         PIE FILLINGS BLUEBERRY CND
8607   44203               COCKTAIL MIX NON-ALCOHOLIC CONCD FRZ
8608   44258            PUDDINGS CHOC FLAVOR LO CAL REG DRY MIX
8609   44259  PUDDINGS ALL FLAVORS XCPT CHOC LO CAL REG DRY MIX
8610   44260  PUDDINGS ALL FLAVORS XCPT CHOC LO CAL INST DRY...
8611   48052                                 VITAL WHEAT GLUTEN
8612   80200                                      FROG LEGS RAW
8613   83110                                    MACKEREL SALTED
8614   90240                         SCALLOP (BAY&SEA) CKD STMD
8615   90480                                         SYRUP CANE
8616   90560                                          SNAIL RAW
8617   93600                                   TURTLE GREEN RAW

[8618 rows x 2 columns]

取所有的列名

>>> food_info.columns.tolist()
['NDB_No', 'Shrt_Desc', 'Water_(g)', 'Energ_Kcal', 'Protein_(g)', 'Lipid_Tot_(g)', 'Ash_(g)', 'Carbohydrt_(g)', 'Fiber_TD_(g)', 'Sugar_Tot_(g)', 'Calcium_(mg)', 'Iron_(mg)', 'Magnesium_(mg)', 'Phosphorus_(mg)', 'Potassium_(mg)', 'Sodium_(mg)', 'Zinc_(mg)', 'Copper_(mg)', 'Manganese_(mg)', 'Selenium_(mcg)', 'Vit_C_(mg)', 'Thiamin_(mg)', 'Riboflavin_(mg)', 'Niacin_(mg)', 'Vit_B6_(mg)', 'Vit_B12_(mcg)', 'Vit_A_IU', 'Vit_A_RAE', 'Vit_E_(mg)', 'Vit_D_mcg', 'Vit_D_IU', 'Vit_K_(mcg)', 'FA_Sat_(g)', 'FA_Mono_(g)', 'FA_Poly_(g)', 'Cholestrl_(mg)']

排序

升序

inplace = True代表在當前對象內直接排序,如果要返回一個新的對象 set False

food_info.sort_values("Water_(g)",inplace = True)
>>> food_info["Water_(g)"]
>>> 760       0.00
8599      0.00
654       0.00
631       0.00
630       0.00
629       0.00
611       0.00
610       0.00
655       0.00
673       0.00
663       0.00
671       0.00
670       0.00
669       0.00
633       0.00
668       0.00
700       0.00
665       0.00
664       0.00
662       0.00
656       0.00
661       0.00
660       0.00
659       0.00
658       0.00
657       0.00
699       0.00
737       0.00
8122      0.00
667       0.00
         ...
4270     99.80
4411     99.85
4408     99.89
4357     99.90
4239     99.90
4356     99.90
4369     99.90
4347     99.90
4205     99.90
4203     99.93
4204     99.95
4208     99.95
4213     99.95
4374     99.96
4407     99.97
4379     99.97
4373     99.97
4404     99.98
4372     99.98
4377    100.00
4378    100.00
4348    100.00
4209    100.00
4376    100.00
6150       NaN
6067       NaN
6113       NaN
1983       NaN
7776       NaN
6095       NaN

降序

>>> food_info.sort_values("Water_(g)",inplace = True , ascending = False)
>>> food_info["Water_(g)"]
4376    100.00
4209    100.00
4348    100.00
4378    100.00
4377    100.00
4372     99.98
4404     99.98
4407     99.97
4379     99.97
4373     99.97
4374     99.96
4213     99.95
4208     99.95
4204     99.95
4203     99.93
4356     99.90
4357     99.90
4239     99.90
4205     99.90
4369     99.90
4347     99.90
4408     99.89
4411     99.85
4270     99.80
4252     99.80
4392     99.80
4260     99.80
4409     99.79
4255     99.74
4397     99.70
         ...
739       0.00
790       0.00
638       0.00
689       0.00
688       0.00
687       0.00
686       0.00
685       0.00
666       0.00
632       0.00
653       0.00
639       0.00
696       0.00
8455      0.00
791       0.00
675       0.00
8180      0.00
704       0.00
705       0.00
706       0.00
707       0.00
738       0.00
6417      0.00
760       0.00
6150       NaN
6067       NaN
6113       NaN
1983       NaN
7776       NaN
6095       NaN

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在http服務里,header參數和表單參數是經常使用到的,本文主要是練習在Go語言里,如何解析Http請求的header里的參數和表單參數,具體代碼如下: 運行後,在chrom瀏覽器里執行請求:http://127.0.0.1:8001/hello?user=admin&pass=888,服務端會 ...
  • 一個web頁面一定少不了輸入框或者按鈕這兩種元素,那麼在Python里如何使用Selenium操作web頁面里的輸入框和按鈕呢?本文帶你簡單入門。 本文采用了一個例子,就是利用Selenium打開百度網頁,然後進行搜索關鍵字“Python”,執行搜索動作。具體代碼如下: Python Python ...
  • 使用Intellij Idea經常遇到的三種亂碼問題: 1、工程代碼亂碼 2、main方法運行,控制台亂碼 3、tomcat運行,控制台亂碼 解決方案: 1.工程代碼亂碼 Settings > Editor > File Encodings > Global Encodings & Project ...
  • 1、關於AOP AOP(Aspect Oriented Programming),即面向切麵編程,可以說是OOP(Object Oriented Programming,面向對象編程)的補充和完善。OOP引入封裝、繼承、多態等概念來建立一種對象層次結構,用於模擬公共行為的一個集合。OOP允許開發者定 ...
  • 有些人提到C++模板就會下意識地覺得可怕、看不懂、避而遠之。其實模板並不複雜,而且熟練後可以用在日常工作中,可以幫助我們重用代碼,讓代碼更簡潔、易讀、可維護。希望這個系列的文章,能夠讓更多人發現模板的魅力,幫助大家寫出更高質量的代碼。 ...
  • Cookie與Session簡介 本章介紹重點: 本章重點為大家介紹在Web開發過程當中經常會使用到的Cookie與Session的概念,它們的使用方法和應用場景,以及它們的優點與局限等等。深刻理解與掌握它們的用法,可以更好的幫助我們開發出正確可用的產品。 我們為什麼需要Cookie與Session ...
  • 基於Vue+Spring MVC+MyBatis+Shiro+Dubbo開發的分散式後臺管理系統 ...
  • 這個語法報錯,意思是試圖用python3.x來運行一個只用於python2.x版本的python代碼。完整的錯誤代碼是: ` SyntaxError: Missing parentheses in call to 'print'. Did you mean print(print "Added vi ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...