多項式回歸學習筆記

来源:http://www.cnblogs.com/MikeZhang/archive/2017/08/05/polynomialRegression20170804.html
-Advertisement-
Play Games

操作系統 : CentOS7.3.1611_x64 python版本:2.7.5 sklearn版本:0.18.2 tensorflow版本 :1.2.1 多項式的定義及展現形式 多項式(Polynomial)是代數學中的基礎概念,是由稱為不定元的變數和稱為繫數的常數通過有限次加減法、乘法以及自然數 ...


操作系統 : CentOS7.3.1611_x64

python版本:2.7.5

sklearn版本:0.18.2

tensorflow版本 :1.2.1

多項式的定義及展現形式

多項式(Polynomial)是代數學中的基礎概念,是由稱為不定元的變數和稱為繫數的常數通過有限次加減法、乘法以及自然數冪次的乘方運算得到的代數表達式。

多項式分為一元多項式和多元多項式,其中:

不定元只有一個的多項式稱為一元多項式;

不定元不止一個的多項式稱為多元多項式。

 

 本文討論的是一元多項式相關問題。

 

其一般形式如下(python語法表達方式):

y = a0 + a1 * x + a2 * (x**2) + ... + an * (x ** n) + e

比如普通的二次多項式回歸模型如下(python語法表達方式):

y = a0 + a1 * x + a2 * (x**2) + e

當 a0,a1,a2,e = 10,2,-0.03,0.5 時,大致圖形如下:

源碼如下:

#! /usr/bin/env python
#-*- coding:utf-8 -*-
import pylab
import pandas as pd

def fun(x):
    # y = a0 + a1 * x + a2 * (x**2) + e
    a0,a1,a2,e = 10,2,-0.03,0.5
    y = a0 + a1 * x + a2 * (x**2) + e
    return y

arrX = range(-10000,10000)
arrY = []

for x in arrX :
    arrY.append(fun(x))

pylab.plot(arrX,arrY)
pylab.show()

 

普通的三次多項式回歸模型如下(python語法表達方式):

y = a0 + a1 * x + a2 * (x**2) + a3 * (x**3) + e

當 a0,a1,a2,a3,e = 10,-0.2,-0.03,-0.04,0.5 時,大致圖形如下:

源碼如下:

#! /usr/bin/env python
#-*- coding:utf-8 -*-
import pylab
import pandas as pd

def fun(x):
    # y = a0 + a1 * x + a2 * (x**2) + a3 * (x**3)+ e
    a0,a1,a2,a3,e = 10,-0.2,-0.03,-0.04,0.5
    y = a0 + a1 * x + a2 * (x**2) + a3 * (x**3)+ e
    return y

arrX = range(-10000,10000)
arrY = []

for x in arrX :
    arrY.append(fun(x))

pylab.plot(arrX,arrY)
pylab.show()

多項式回歸

在單因數(連續變數)試驗中,當回歸函數不能用直線來描述時,要考慮用非線性回歸函數。 多項式回歸屬於非線性回歸的一種。 這裡指單因數多項式回歸,即一元多項式回歸。

一般非線性回歸函數是未知的,或即使已知也未必可以用一個簡單的函數變換轉化為線性模型。這時,常用的做法是用因數的多項式。 如果從散點圖觀察到回歸函數有一個“彎”,則可考慮用二次多項式;有兩個彎則考慮用三次多項式;有三個彎則考慮用四次多項式,等等。

真實的回歸函數未必就是某個次數的多項式,但只要擬合得好,用適當的多項式來近似真實的回歸函數是可行的。

使用sklearn解決多項式回歸問題

示例代碼如下:

#! /usr/bin/env python
#-*- coding:utf-8 -*-
# 多項式回歸
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

rng = np.random.RandomState(1)

def fun(x):
    a0,a1,a2,a3,e = 0.1,-0.02,0.03,-0.04,0.05
    y = a0 + a1 * x + a2 * (x**2) + a3 * (x**3)+ e
    y += 0.03 * rng.rand(1)
    return y

plt.figure()
plt.title('polynomial regression(sklearn)')
plt.xlabel('x')
plt.ylabel('y')
plt.grid(True)

X = np.linspace(-1, 1, 30)
arrY = [fun(x) for x in X]
X = X.reshape(-1,1)
y = np.array(arrY).reshape(-1,1)

plt.plot(X, y, 'k.')

qf = PolynomialFeatures(degree=3)
qModel = LinearRegression()
qModel.fit(qf.fit_transform(X), y)

X_predict = np.linspace(-1, 2, 100)
X_predict_result = qModel.predict(qf.transform(X_predict.reshape(X_predict.shape[0], 1)))
plt.plot(X_predict,X_predict_result , 'r-')

plt.show()

該代碼github地址:https://github.com/mike-zhang/pyExamples/blob/master/algorithm/NonLinearRegression/pr_sklearn_test1.py

運行效果圖如下:

使用tensorflow解決多項式回歸問題

示例代碼如下:

#! /usr/bin/env python
#-*- coding:utf-8 -*-

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

learning_rate = 0.01
training_epochs = 40
rng = np.random.RandomState(1)

def fun(x):
    a0,a1,a2,a3,e = 0.1,-0.02,0.03,-0.04,0.05
    y = a0 + a1 * x + a2 * (x**2) + a3 * (x**3)+ e
    y += 0.03 * rng.rand(1)
    return y


trX = np.linspace(-1, 1, 30)
arrY = [fun(x) for x in trX]
num_coeffs = 4
trY = np.array(arrY).reshape(-1,1)

X = tf.placeholder("float")
Y = tf.placeholder("float")

def model(X, w):
    terms = []
    for i in range(num_coeffs):
        term = tf.multiply(w[i], tf.pow(X, i))
        terms.append(term)
    return tf.add_n(terms)

w = tf.Variable([0.] * num_coeffs, name="parameters")
y_model = model(X, w)

cost = tf.reduce_sum(tf.square(Y-y_model))
train_op = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

with tf.Session() as sess :
    init = tf.global_variables_initializer()
    sess.run(init)

    for epoch in range(training_epochs):
        for (x, y) in zip(trX, trY):
            sess.run(train_op, feed_dict={X: x, Y: y})

    w_val = sess.run(w)
    print(w_val)

plt.figure()
plt.xlabel('x')
plt.ylabel('y')
plt.grid(True)
plt.title('polynomial regression(tensorflow)')
plt.scatter(trX, trY)
trX2 = np.linspace(-1, 2, 100)
trY2 = 0
for i in range(num_coeffs):
    trY2 += w_val[i] * np.power(trX2, i)
plt.plot(trX2, trY2, 'r-')
plt.show()

該代碼github地址:https://github.com/mike-zhang/pyExamples/blob/master/algorithm/NonLinearRegression/pr_tensorflow_test1.py

運行效果如下:

好,就這些了,希望對你有幫助。

本文github地址:

https://github.com/mike-zhang/mikeBlogEssays/blob/master/2017/20170804_多項式回歸學習筆記.rst

歡迎補充


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 問題通常我們在設置子控制項的一些與外觀、佈局有關的屬性時,比如Size、Location、Anchor或Dock等,會激發子控制項的 Layout事件,並可能會引起視窗重繪。當子控制項較多時,如果頻繁設置上述屬性(例如在窗體的初始化代碼中),多個子控制項的Layout事件會引起視窗重繪效率問題,比如閃爍。特 ...
  • 貼一下自己序列化的代碼: 上面的寫法持續序列化不會有記憶體溢出的性能問題,之前一直被告知直接引用公司某位老鳥封裝好的dll來序列化,後來發現了老是出現記憶體溢出,貼一下它的錯誤寫法,僅供吸取教訓: 哎,老鳥趕時間的時候寫代碼都這麼隨意嗎?看到被註釋掉的try catch我猜測他曾經也覺得這裡有問題,不過 ...
  • 其實我也不知道如何定義這個標題,詞乏,姑且先這樣定義吧。 看了本文章的朋友,如果有更好標題,請告訴我,謝謝。 有個項目使用SDK時遇到這樣一個情況。 該SDK有個BtPrinterManager類,擁有兩個方法:ServerPrint和ClientPrint,這兩個方法有一部分參數是一樣的,一部分參 ...
  • 新建Model1.edmx文件 頁面引用資料庫Model1 如下創建AD資料庫的model文件、 找到以下菜單 找到所需要引用資料庫類名稱。 在頁面後臺引用 ...
  • 大家可能在項目中,有的時候,由於顯示的內容過長,所以,需要顯示一部分內容,然後後面用省略號,把滑鼠放上去,會顯示出來全部的內容。 作為一個LowB程式員的我,第一反應是SubString截取,然後替換,然後ToolTip顯示原有的內容。 我相信很大一部分的初級程式員第一想法也是這個,然而,這種方法不 ...
  • using System.IO; System.Windows.Forms.SaveFileDialog objSave = new System.Windows.Forms.SaveFileDialog();objSave.Filter = "(*.txt)|*.txt|" + "(*.*)|*. ...
  • Java連接MySQL資料庫增刪改查通用方法 運行環境:eclipse+MySQL 以前我們Java連接MySQL資料庫都是一個資料庫寫一個類,類下麵寫好多方法,要是多個資料庫,就要寫多個類多個方法,導致代碼編寫太過於繁瑣,所以為了改變這樣的繁瑣,我將連接資料庫的方法進行了一系列的封裝,使用戶傳入一 ...
  • 心血來潮想瞭解下常用圖片的格式解析,翻看了一些資料後,發現最簡單的是bmp格式,所以先拿它開刀。 BMP格式 這種格式內的數據分為 三到四個 部分,依次是: 1. 文件信息頭 (14位元組)存儲著文件類型,文件大小等信息 2. 圖片信息頭 (40位元組)存儲著圖像的尺寸,顏色索引,位平面數等信息 3. ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...