機器學習——朴素貝葉斯

-Advertisement-

在考慮一個結果的概率時候，要考慮眾多的屬性，貝葉斯演算法利用所有可能的數據來進行修正預測，如果大量的特征產生的影響較小，放在一起，組合的影響較大，適合於朴素貝葉斯分類導入類庫代碼 ...

在考慮一個結果的概率時候，要考慮眾多的屬性，貝葉斯演算法利用所有可能的數據來進行修正預測，如果大量的特征產生的影響較小，放在一起，組合的影響較大，適合於朴素貝葉斯分類

導入類庫

1 from sklearn.datasets import fetch_20newsgroups
2 from sklearn.feature_extraction.text import TfidfVectorizer
3 from sklearn.naive_bayes import MultinomialNB

代碼

 1 def article_category():
 2     categories = ['alt.atheism', 'soc.religion.christian', 'comp.graphics', 'sci.med']
 3     twenty_train = fetch_20newsgroups(subset='train', categories=categories)
 4     # print(twenty_train)
 5     print(twenty_train.data)
 6     print(twenty_train.target)
 7     # 將x訓練集詞頻向量化
 8     tfidf_transformer = TfidfVectorizer()
 9     X_train_tfidf = tfidf_transformer.fit_transform(twenty_train.data)
10 
11     # 貝葉斯訓練
12     clf = MultinomialNB(alpha=1.0).fit(X_train_tfidf, twenty_train.target)
13     docs_new = ['Chemical reaction', 'Intel CPU is good']
14 
15     # 將要預測的數據詞頻向量化
16     X_new_tfidf = tfidf_transformer.transform(docs_new)
17     # 預測
18     predicted = clf.predict(X_new_tfidf)
19     print(predicted)
20     for doc, category in zip(docs_new, predicted):
21         print('%r => %s' % (doc, twenty_train.target_names[category]))

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

BZOJ1722: [Usaco2006 Mar] Milk Team Select 產奶比賽(樹形dp)

題意 "題目鏈接" Sol 挺顯然的樹形背包吧。。 $f[i][j]$表示$i$這棵子樹中答案為$j$的最大價值，轉移的時候背包一下。。第一次寫樹形背包，犯了兩個錯誤 1. 枚舉根節點的貢獻時需要倒著枚舉 2. 轉移時需要註意$k = 0$的情況，不要出現重覆轉移 ...
一文搞懂字元集編碼詳細介紹

線上學習: [撩課-JavaWeb系列1之基礎語法-前端基礎][撩課-JavaWeb系列2之XML][撩課-JavaWeb系列3之MySQL][撩課-JavaWeb系列4之JDBC][撩課-JavaWeb系列5之web伺服器-idea] 一、字元集的由來二、ASSCII 三、unicode 四、U ...
SpringMVC接收前端傳值有哪些方式？

有很多種，比如： 1、通過@RequestParam註解接收請求參數； 2、通過Bean封裝，接收多個請求參數 3、通過@ModelAttribute綁定接收前端表單數據 4、通過@PathVariable獲取URL中某段可變值； 5、通過@RequestBody接收請求體中的數據 6、通過@Req ...
「造個輪子」——設計 HTTP 請求全局上下文

本次 Cicada 已經更新到了 v1.0.3。主要是解決了兩個 issue，#9(Boss線程數好像設置有誤 ) #8(怎麼返回純字元串內容不要JSON格式？)。 ...
「題目代碼」P1049～P1053（Java）

P1049 譚浩強C語言(第三版)習題6.5 java import java.util. ; import java.io. ; import java.math.BigInteger; import java.lang.Character; public class Main { public ...
結對編程項目總結 by：陳巨集偉&劉益

結對編程項目在歡快的國慶假期中也順利結束了。從最初拿到結對編程項目的思考，再到一步一步實現，中間經歷了一個漫長的過程。在我和隊友的多次協商下，最終我們還是選擇使用基於python來實現這一次結對編程項目，並且最終選擇了以eric6 + pyqt5 +Anaconda3以及pycharm混搭的開發環境 ...
Java基礎教程(4)--面向對象概念

如果你之前從來沒有使用過面向對象編程語言，那麼在學習Java之前需要先理解幾個有關面向對象編程的基本概念。這篇教程將會向你介紹對象、類、集成、介面和包的概念，以及這些概念是如何與現實世界相關聯，並介紹這些概念在Java語言中的體現。 ...
c/c++ socket API 調用後的錯誤判斷 perror errno

socket API 調用後的錯誤判斷 perror errno 調用完socket API後，需要判斷調用是否成功與失敗。如果失敗，會自動設置errno(是個整數), 並且用perror可以列印出具體的錯誤信息。註意點： 1，如果有多個socket API調用失敗，errno存放的是最後一個失敗 ...