機器學習實戰這本書是在python2.x的環境下寫的,而python3.x中好多函數和2.x中的名稱或使用方法都不一樣了,因此對原書中的內容需要校正,下麵簡單的記錄一下學習過程中fix的部分 1、print 函數後面需要加括弧(程式清單2-4開始出現print函數) 2、raw_input改為inp ...
機器學習實戰這本書是在python2.x的環境下寫的,而python3.x中好多函數和2.x中的名稱或使用方法都不一樣了,因此對原書中的內容需要校正,下麵簡單的記錄一下學習過程中fix的部分
1、print 函數後面需要加括弧(程式清單2-4開始出現print函數)
2、raw_input改為input函數,在3.x中python使用input替代了raw_input函數(程式清單2-5)
3、reload(KNN)->import importlib
importlib.reload(KNN)
4、程式清單3-6中
在python2.7中,找到key所對應的第一個元素為:firstStr = myTree.keys()[0],這在python3.4中運行會報錯:‘dict_keys‘ object does not support indexing,這是因為python3改變了dict.keys,返回的是dict_keys對象,支持iterable 但不支持indexable,我們可以將其明確的轉化成list,則此項功能在python3中應這樣實現:
firstSides = list(myTree.keys())
firstStr = firstSides[0]#找到輸入的第一個元素
5、程式清單3-9
pickle對數據進行持久化的時候是採用二進位的方式進行存儲和讀取的,所以寫入文件的時候將
fw=open(filename,'w')---->fw=open(filename,'wb')
將文件以二進位的形式打開,方便pickle的寫入
從文件中讀取數據的時候也要用二進位的方式讀取做以下修改
fr=open(filename)---->fr=open(filename,'rb')
6、程式清單4-5中
wordList=textParse(open('ch04/email/ham/%d.txt' % i).read())
這一句在運行的時候老是報編碼錯誤,結果是讀取的文件中有亂碼,刪除亂碼後問題解決
錯誤代碼如下:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence
trainingSet=range(50);
del(trainingSet[randIndex])
由於range不能返回List,不支持del操作,所以運行時出現以下錯誤:
TypeError: 'range' object doesn't support item deletion
可以將代碼修改為:
trainingSet = list(range(50));
to be continued……