機器學習——線性回歸-KNN-決策樹(實例)

来源:https://www.cnblogs.com/siplips/archive/2018/10/09/9763212.html
-Advertisement-
Play Games

導入類庫 線性回歸 KNN 決策樹 ...


導入類庫

1 import numpy as np
2 import pandas as pd
3 from sklearn.linear_model import LinearRegression
4 from sklearn.preprocessing import StandardScaler
5 from sklearn.neighbors import KNeighborsClassifier
6 from sklearn.feature_extraction import DictVectorizer
7 from sklearn.tree import DecisionTreeClassifier

線性回歸

 1 def price_predict():
 2     # 數據有三個特征:距離地鐵距離、附近小學數量、小區綠化率
 3     X = np.array([[500.0, 3.0, 0.3], [1000.0, 1.0, 0.6], [750.0, 2.0, 0.3], [600.0, 5.0, 0.2], [1200.0, 1.0, 0.6]])
 4     # 具有三個特征的房屋對應的房價
 5     Y = np.array([10000, 9000, 8000, 12000, 8500])
 6 
 7     # 標準化,按列轉化,轉化到數據均值為0方差為1的標準分佈內
 8     std_x = StandardScaler()
 9     x_train = std_x.fit_transform(X)
10     std_y = StandardScaler()
11     y_train = std_y.fit_transform(Y.reshape(-1, 1))
12 
13     # 構建線性預測模型
14     lr = LinearRegression()
15     # 模型在歷史數據上進行訓練,Y.reshape(-1,1)將Y變為二維數組,fit函數要求二維數組
16     lr.fit(x_train, y_train)
17 
18     # 使用訓練模型預測新房屋價格
19     x_predict = std_x.transform(np.array([[1300, 3.0, 0.4]]))
20     print(std_y.inverse_transform(lr.predict(x_predict)))

KNN

 1 # K近鄰分類(K表示以最近的幾個鄰居作為分類的指標)
 2 # KNN表示了物以類聚人以群分的基本思考方法,最近的K個鄰居是什麼類別,預測樣本就會被劃為該類別
 3 def knn_predict_rev():
 4     # 數據理解為二維坐標上的6歌點
 5     X = np.array([[1.0, 1.0], [1, 1.5], [0.5, 1.5], [3.0, 3.0], [3.0, 3.5], [2.8, 3.1]])
 6     # 6個點的類別,按順序和X依次對應
 7     Y = np.array([0, 0, 0, 1, 1, 1])
 8 
 9     # n_neighbors就是KNN中的K
10     knn = KNeighborsClassifier(n_neighbors=3)
11     knn.fit(X, Y)
12     print(knn.predict(np.array([[2.0, 3.0]])))

決策樹

 1 def decide_play():
 2     '''
 3     ID3
 4     :return:
 5     '''
 6     df = pd.read_csv('dtree.csv')
 7     # 將數據轉換為字典格式,orient='record'參數指定數據格式為{column:value}的形式
 8     # 一個字典對應一行數據
 9     dict_train = df.loc[:, ['Outlook', 'Temperatur', 'Humidity', 'Windy']].to_dict(orient='record')
10     # 如果pandas從DataFrame取出一列數據,該數據類型會變成Series
11     dict_target = pd.DataFrame(df['PlayGolf'], columns=['PlayGolf']).to_dict(orient='record')
12 
13     # 訓練數據字典向量化
14     dv_train = DictVectorizer()
15     x_train = dv_train.fit_transform(dict_train)
16     # 目標數據字典向量化
17     dv_target = DictVectorizer()
18     y_target = dv_target.fit_transform(dict_target)
19 
20     # 創建決策樹
21     d_tree = DecisionTreeClassifier()
22     # 訓練數據
23     d_tree.fit(x_train, y_target)
24     data_predict = {
25         'Humidity': 85,
26         'Outlook': 'sunny',
27         'Temperatur': 85,
28         'Windy': False
29     }
30     # 標準化要預測的數據
31     x_data = dv_train.transform(data_predict)
32     # 預測數據並轉換為原格式
33     print(dv_target.inverse_transform(d_tree.predict(x_data)))

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 開始學python 交互MySQLdb,踩了很多坑第一個%d format: a number is required, not str參照以下博客:https://blog.csdn.net/u011878172/article/details/72599120# -*- coding: utf-... ...
  • 網路編程 getaddrinfo 函數 解析網址,返回IP地址。 例子: "github源代碼" c/c++ 學習互助QQ群:877684253 本人微信:xiaoshitou5854 ...
  • ## Profile 配置 Profile 是 Spring 用來針對不同的環境對不同的配置提供支持的,全局的 Profile 配置使用 `application-{profile}.properties` (如 `application-prod.properties`) 通過在 `applica... ...
  • 前段時間寫了個自動打卡的腳本,但是腳本不夠完善,我需要知道,打卡到底成沒成功,因此,我想到了用Python執行完代碼之後,再執行一段發送郵件的代碼。需求開始明確了,就開始分析和寫代碼實現吧。 ...
  • 筆記: ...
  • url傳遞過程中加號變空格 在接收url參數的過程中,會發現如果參數中存在‘+’號,接收後會變成空格。 如11+22接收後變成11 22。 要解決這個問題,需要將加號替換為%2B進行傳遞。 如11%2B22接收後變成11+22。 這種問題經常出現在字元串加密傳遞的過程中,這時就需要加密後把所有加號替 ...
  • 使用Git版本控制工具管理GitHu Git是一個分步式的管理系統:只要上傳操作得當,所有的都可以相當於是中央伺服器,成員代碼共用,A寫的代碼B也有,一般把一個人當做主機,其他人通過該主機拼裝代碼並克隆到自己的電腦上; 這樣即使是主機涼了,其他人也都會有各自的本地代碼,都不會涼; Svn是一個集中式 ...
  • 小程式開發流程 小程式開發文檔:https://developers.weixin.qq.com/miniprogram/dev/ ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...