數據分析演算法---線性回歸（初識）

-Advertisement-

最近在學習數據分析線性回歸演算法時，產生了很多疑問。作為初學者，我認為應該先從基本概念上進行一些深度理解。下麵將我的一些思考總結如下：線性回歸模型為：（1）其中ε是剩餘誤差，假設它服從的是高斯分佈，然後因此就將線性回歸模型和高斯模型聯合起來，獲取公式如下：到這裡我是完全沒看懂！對於線性回歸我 ...

最近在學習數據分析線性回歸演算法時，產生了很多疑問。作為初學者，我認為應該先從基本概念上進行一些深度理解。下麵將我的一些思考總結如下：

線性回歸模型為： （1）

其中ε是剩餘誤差，假設它服從的是高斯分佈，然後因此就將線性回歸模型和高斯模型聯合起來，獲取公式如下：

到這裡我是完全沒看懂！

對於線性回歸我有4個疑問：

第一：看到的諸多線性回歸、邏輯回歸什麼的，回歸到底是什麼意思？

第二：這個ε剩餘誤差又有什麼樣的意義？

第三：為什麼剩餘誤差服從高斯分佈（即正態分佈），整個線性回歸模型就能寫成高斯分佈模型？

第四：這裡的線性到底指的是什麼？

接下來，我將針對這四個問題談一談自己的理解。

1. 回歸指的是什麼意思？

回歸，即將現有的數據向假設的模型擬合接近，還原真實的數據模式。

2. 如何理解ε剩餘誤差？

這裡不妨把（1）式進行合適的轉換： （2）

這樣就更容易理解，也就是我們只簡單地用線性模型來擬合真是的變數間的關係，並不能達到完美的解釋。所以，ε就彌補了用模型難以解釋的那一部分，即模型外的未知因素的影響。

3. 為什麼剩餘誤差符合高斯分佈，整個線性模型就符合高斯分佈？

看公式（2）應該可以較容易理解，這是純粹的數學知識。

4. 這裡的線性到底指的是什麼？

關於線性模型中的線性有三種說法：

（1）變數和參數都是線性的；

（2）變數是線性的，但參數不是線性的；

（3）參數是線性的，但變數不是線性的。

而我們這裡所說的線性模型主要是針對（3）而言的。所以只要參數是線性的這類問題，我們對變數無論是轉成指數、冪指數等任意一種函數形式，都可以用線性模型來解決問題，因為我們要學習的是這個參數向量，而變數值是確定的。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

vue-router 基本使用

路由，其實就是指向的意思，當我點擊頁面上的home按鈕時，頁面中就要顯示home的內容，如果點擊頁面上的about 按鈕，頁面中就要顯示about 的內容。Home按鈕 => home 內容， about按鈕 => about 內容，也可以說是一種映射. 所以在頁面上有兩個部分，一個是點擊部分，一個 ...
C#面試分享：單例模式

C 面試分享：單例模式提問1：請給出單例模式的實現：答：提問2：繼承會破壞單例模式嗎？分析：說實話，當時這個問題把我給問懵了，沒有想明白麵試官想考察什麼。下麵參考《Head First 設計模式》一書的相關問題，來做一些分析：首先，就上文的代碼而言，子類可以繼承 Animal 嗎？答 ...
BZOJ2287: 【POJ Challenge】消失之物(背包dp)

題意 ftiasch 有 N 個物品, 體積分別是 W1, W2, ..., WN。由於她的疏忽, 第 i 個物品丟失了。 “要使用剩下的 N - 1 物品裝滿容積為 x 的背包，有幾種方法呢？” -- 這是經典的問題了。她把答案記為 Count(i, x) ，想要得到所有1 <= i <= N, ...
SPOJ2713GSS4 - Can you answer these queries IV(線段樹)

題意 Sol 講過無數次了。。很顯然，一個$10^12$的數開方不超過$8$次後就會變為$1$ 因此直接暴力更改即可，維護一下這段區間是否被全改為了$1$ 雙倍經驗:https://www.luogu.org/problemnew/show/P4145 ...
[轉]Hibernate中Criteria的完整用法

1，Criteria Hibernate 設計了 CriteriaSpecification 作為 Criteria 的父介面，下麵提供了 Criteria和DetachedCriteria 。2，DetachedCriteria Spring 的框架提供了getHibernateTemplate( ...
ABC108C - Triangular Relationship(打表)

題意給出$n, k$，求出滿足$a+b, b + c, c + a$都是$k$的倍數的三元組$a, b, c$的個數，$1 \leqslant a, b, c \leqslant N$ $n \leqslant 10^5$ Sol 昨晚Atcoder的第三題我用$O(1)$的演算法過了一個$n \ ...
C++數字三角形問題與dp演算法

題目：數字三角形題目介紹：如圖所示的數字三角形，要求從最上方頂點開始一步一步下到最底層，每一步必須下一層，求出所經過的數字的最大和。輸入：第一行值n，代表n行數值；後面的n行數據代表每一行的數字。輸出：經過數字的最大和。例：輸入： 4 1 3 2 4 10 1 4 3 2 20 輸出： 2 ...
第35節：Java面向對象中的多線程

Java面向對象中的多線程多線程在面向對象中的多線程中，要理解多線程的知識點，首先要掌握什麼是進程，什麼是線程？為什麼有多線程呢？多線程存在的意義有什麼什麼呢？線程的創建方式又有哪些？以及要理解多線程的特點等。多線程和線程的理解多線程？線程，多個線程，如何理解什麼是進程呢？如圖：任務管 ...