【機器學習】支持向量機分類

来源:https://www.cnblogs.com/hjk-airl/archive/2022/07/13/16457435.html
-Advertisement-
Play Games

前言 支持向量機是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。SVM嘗試尋找一個最優決策邊界,使距離兩個類別最近的樣本最遠。 SVM使用鉸鏈損失函數計算經驗風險併在求解系統中加入了正則化項以優化結構風險,是一個具有稀疏性和穩健性的分類器 。SVM ...


前言

支持向量機是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。SVM嘗試尋找一個最優決策邊界,使距離兩個類別最近的樣本最遠。
SVM使用鉸鏈損失函數計算經驗風險併在求解系統中加入了正則化項以優化結構風險,是一個具有稀疏性和穩健性的分類器 。SVM可以通過核方法(kernel method)進行非線性分類,是常見的核學習(kernel learning)方法之一

SVM原理

  • 引入
    image

  • 直觀理解

    • 對數據進行分類,當超平面數據點‘間隔’越大,分類的確信度也越大。
    • 我們上面用的棍子就是分類平面。
  • 支持向量

image

  • 我們可以看到決定分割面其實只有上面4個紅色的點決定的,這四個點就叫做支持向量。

非線性SVM與核函數

如何變幻空間

對於非線性的數據我們是通過核函數把數據分為不同的平面在進行處理。
image

  • 核函數
    • 線性核函數:K(x,z) = x*z
    • 多項式核函數:K(x,z) = (x*z+1)^p
    • 高斯核函數:K(x,z) = exp(\(\frac{-|x-z|^2}{z*a^2}\))
    • 混合核:K(x,z) = aK1(x,z)+(1-a)K2(x,z), 0<=a<1\

多分類處理應用

  • 一對多法(OVR SVMs)

    • 訓練時依次把某個類別樣本歸為一類,其他剩餘樣本歸為一類
    • k個SVM:分類時將未知樣本分類為具有最大分類函數值的那類
  • 一對一法(OVO SVMs或者pairwise)

    • 在任意兩類樣本之間設計一個SVM
    • k(k-1)/2個SVM
    • 當對一個未知樣本進行分類時,最後得票最多的類別即為該未知樣本的類。
  • 層次SVM

    • 層次分類法首先將所有類別分成兩個子類,再將子類進一步劃分成兩個次級子類,如此迴圈,直到得到一個單獨的類別為止。類似與二叉樹分類。

優點

  • 相對於其他分類演算法不需要過多樣本,並且由於SVM引入核函數,所以SVM可以處理高維樣本。
  • 結構風險最小,這種風險是指分類器對問題真實模型的逼近與問題真實解之間的累計誤差。
  • 非線性,是指SVM擅長應對樣本數據線性不可分的情況,主要通過鬆弛變數(懲罰變數)和核函數技術來實現,這也是SVM的精髓所在。

開源包

LibSVM:https://www.csie.ntu.edu.tw/~cjlin/libsvm/

Liblinear:https://www.csie.ntu.edu.tw/~cjlin/liblinear/

數據集

數據集是使用sklearn包中的數據集。也可以下載下來方便使用。

百度網盤:
鏈接:https://pan.baidu.com/s/16H2xRXQItIY0hU0_wIAvZw
提取碼:vq2i

SVM實現鳶尾花分類

  • 代碼
## 數據集 sklearn中


import numpy as np

import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib import colors

from sklearn import svm
from sklearn import model_selection


## 載入數據集

def iris_type(s):
    it = {b'Iris-setosa':0, b'Iris-versicolor':1, b'Iris-virginica':2}
    return it[s]


data = np.loadtxt('Iris-data/iris.data',dtype=float,delimiter=',',converters={4:iris_type})

x,y = np.split(data, (4, ), axis=1)

x = x[:,:2]
x_train,x_test, y_train, y_test = model_selection.train_test_split(x,y,random_state=1,test_size=0.2)


## 構建SVM分類器,訓練函數

def classifier():
    clf = svm.SVC(C=0.8, kernel='linear', decision_function_shape='ovr')
    return clf

def train(clf, x_train, y_train):
    clf.fit(x_train, y_train.ravel())


clf = classifier()
train(clf,x_train,y_train)

## 初始化分類器,訓練模型
def show_accuracy(a, b, tip):
    acc = a.ravel()==b.ravel()
    print('%s accracy:%.3f'%(tip, np.mean(acc)))

## 展示訓練結果,及驗證結果

def print_accracy(clf, x_train, y_train, x_test, y_test):
    print('training prediction:%.3f'%(clf.score(x_train, y_train)))
    print('test prediction:%.3f'%(clf.score(x_test, y_test)))

    show_accuracy(clf.predict(x_train),y_train, 'training data')
    show_accuracy(clf.predict(x_test), y_test, 'testing data')

    print('decision_function:\n',clf.decision_function(x_train)[:2])

print_accracy(clf, x_train, y_train, x_test, y_test)



def draw(clf, x):
    iris_feature = 'sepal length', 'sepal width', 'petal length', 'petal width'

    x1_min,x1_max = x[:,0].min(), x[:,0].max()
    x2_min,x2_max = x[:,1].min(), x[:,1].max()

    x1, x2 = np.mgrid[x1_min:x1_max:200j, x2_min:x2_max:200j]

    grid_test = np.stack((x1.flat, x2.flat), axis=1)
    print('grid_test:\n',grid_test[:2])

    z = clf.decision_function(grid_test)
    print('the distance:',z[:2])

    grid_hat = clf.predict(grid_test)
    print(grid_hat[:2])


    grid_hat = grid_hat.reshape(x1.shape)
    cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
    cm_dark = mpl.colors.ListedColormap(['g', 'b', 'r'])

    plt.pcolormesh(x1, x2, grid_hat, cmap=cm_light)
    plt.scatter(x[:,0], x[:, 1],c=np.squeeze(y), edgecolors='k', s=50, cmap=cm_dark)
    plt.scatter(x_test[:,0],x_test[:,1], s=120, facecolor='none', zorder=10)
    plt.xlabel(iris_feature[0])
    plt.ylabel(iris_feature[1])
    plt.xlim(x1_min, x1_max)
    plt.ylim(x2_min, x2_max)
    plt.title('Iris data classification via SVM')
    plt.grid()
    plt.show()

draw(clf, x)

結果展示

可以看到分類效果和之前的k-means聚類效果圖是差不多的。

有興趣的可以看看k-means聚類進行分類:

使用k-means聚類對鳶尾花進行分類:https://www.cnblogs.com/hjk-airl/p/16410359.html

  • 分類效果圖
    image

  • 分類結果參數
    image

總結

可以看到SVM鳶尾花分類和K-means聚類是不同的,但是都可以達到分類的效果。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、普通的微信請求封裝 1 const http = (options) =>{ 2 return new Promise((resolve,reject) => { 3 wx.request({ 4 url: options.url, 5 method:options.method || 'get ...
  • 知識點 JavaScript部分函數 Array: concat():連接兩個數組。 join():設置分隔符連接數組成一個字元串。 pop():刪除最後一個元素。 sort():排序 Global: isNaN():判斷一個值是不是數字。 parseInt():轉換成整數。 parseFloat( ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 1. 代碼輸出結果 function Person(name) { this.name = name } var p2 = new Person('king'); console.log(p2.__proto__) //Person.pr ...
  • 在實際項目中麵包屑是非常常見的一個功能,用於切換層級選項 當然有的公司會使用TagsView導航欄,這個後續在做介紹 今天分享一個簡易的麵包屑組件,這邊配合ui庫進行封裝 安裝依賴,在main.js中引入 yarn add element-ui import Vue from 'vue' impor ...
  • markdown - 更簡潔、更高效 強烈建議開發者認真閱讀本文檔,掌握md及HBuilderX對md的強大支持。 窄屏幕下,可按Alt+滾輪橫向滾動 很多人只把markdown用於網路文章發表,這糟蹋了markdown。 markdown不止是HTML的簡化版,更重要的是txt的升級版、word的 ...
  • sass變數同javascript變數,可以用來存儲一些信息,並且可以重覆使用。 ...
  • 之前是採用npm或者yarn直接裝包vue-contextmenujs的形式: npm install vue-contextmenujs -S || yarn add vue-contextmenujs 當右鍵點擊記錄時,完整展示應該是如下圖所示: 結果,當點擊靠前的記錄時,頂部一部分記錄被瀏覽器 ...
  • 之前小億有講解過二極體和三極體的內容,感興趣的朋友可以去網站主頁搜索,今天我們來瞭解晶閘管。 晶閘管結構 單向晶閘管(晶體閘流管)是N-P-N-P四層半導體結構,中間形成了三個PN結。有三個電極,分別是陽極A,陰極K,門極G(也叫控制極)。 導電特性 如畫面中的電路,開關S1閉合時,但是門極G沒有觸 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...