Python數據分析：實用向( 三 ) _生活百科

畫圖畫圖準備解決中文符號顯示問題plt.rcParams['font.sans-serif'] = ['SimHei']# 黑體plt.rcParams['axes.unicode_minus'] = False# 解決無法顯示符號的問題sns.set(font='SimHei', font_scale=0.8)# 解決Seaborn中文顯示問題設置背景樣式plt.style.use('classic')plt.rc("figure", facecolor="white")#去除灰色邊框繪圖這是一個畫箱線圖代碼import matplotlib.pyplot as pltsns.set_style('darkgrid')fig, ax = plt.subplots(figsize=(16,12),ncols=2)ax1 = sns.boxplot(x="Embarked", y="Fare", hue="Pclass", data=https://www.huyubaike.com/biancheng/train, ax = ax[0]);ax2 = sns.boxplot(x="Embarked", y="Fare", hue="Pclass", data=https://www.huyubaike.com/biancheng/test, ax = ax[1]);ax1.set_title("Training Set", fontsize = 18)ax2.set_title('Test Set',fontsize = 18)fig.show()畫缺口餅圖churn_value=https://www.huyubaike.com/biancheng/data['cvr_group_high'].value_counts()labels=data['cvr_group_high'].value_counts().indexplt.figure(figsize=(7,7))plt.pie(churn_value,labels=['一般客戶', '高價值客戶'],colors=["#75bbfd","#00ffff"], explode=(0.05,0),autopct='%1.1f%%', shadow=False)plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus'] = Falseplt.title("高價值客戶占比23.4%")#plt.savefig('pie.png', dpi=300)畫相關性系數圖mask = np.zeros_like(data.corr(), dtype=np.bool)#mask[np.triu_indices_from(mask)] = Trueplt.subplots(figsize = (15,12))sns.heatmap(data.corr(),annot=True,#mask = mask,cmap = 'RdBu', ## in order to reverse the bar replace "RdBu" with "RdBu_r"linewidths=.9,linecolor='gray',fmt='.2g',center = 0,square=True)plt.title("Correlations Among Features", y = 1.03,fontsize = 20, pad = 40) #相關性矩陣plt.savefig('cor.png', dpi=300)plt.show()畫核密度估計fig = plt.figure(figsize=(15,8),)## I have included to different ways to code a plot behigh, choose the one that suites you.ax=sns.kdeplot(data.client[data.cvr_group_high == 0] ,color='gray',shade=True,label='high')ax=sns.kdeplot(data.loc[(data['cvr_group_high'] == 1),'client'] ,color='g',shade=True,label='high',)plt.title('client - high vs high', fontsize = 25, pad = 40)plt.ylabel("Frequency of cvr", fontsize = 15, labelpad = 20)plt.xlabel("Client", fontsize = 15,labelpad =20)## Converting xticks into words for better understandinglabels = ['H5', 'android', 'ios','pc','wap']plt.xticks(sorted(data.client.unique()), labels)plt.legend()模型訓練導入模塊#加載模塊from sklearn.preprocessing import StandardScalerimport warningswarnings.filterwarnings("ignore") #過濾掉警告的意思from pyforest import *import pandas as pdimport numpy as npfrom sklearn.ensemble import RandomForestClassifier#隨機森林from sklearn.svm import SVC,LinearSVC#支持向量機from sklearn.linear_model import LogisticRegression#邏輯回歸from sklearn.neighbors import KNeighborsClassifier#KNN算法from sklearn.cluster import KMeans#K-Means 聚類算法from sklearn.naive_bayes import GaussianNB#樸素貝葉斯from sklearn.tree import DecisionTreeClassifier#決策樹import xgboost as xgbfrom xgboost import XGBClassifierfrom catboost import CatBoostClassifierfrom sklearn.ensemble import AdaBoostClassifierfrom sklearn.ensemble import GradientBoostingClassifier from sklearn.metrics import classification_report,precision_score,recall_score,f1_score,accuracy_score #分類報告from sklearn.metrics import confusion_matrix#混淆矩陣from sklearn.metrics import silhouette_score#輪廓系數（評價k-mean聚類效果）from sklearn.model_selection import GridSearchCV#交叉驗證from sklearn.metrics import make_scorerfrom sklearn.ensemble import VotingClassifier#投票def plot_predictions(test,predicted):#整體平移x=np.arange(0,len(test))+1#x[0]=1#my_x_ticks = np.arange(1, 14, 1)#plt.xticks(my_x_ticks)plt.plot(x,test,label='Real')plt.plot(x,predicted,color='darkOrange',linestyle='--',label='Predicted')#plt.xlabel('month')plt.ylabel('count')plt.legend()import mathdef mse_loss(y_true, y_pred):return np.sum(np.power(y_true - y_pred, 2)) / y_true.shape[0] / 2def return_rmse(test,predicted):rmse = math.sqrt(mse_loss(test, predicted))return rmse#print("The mean squared error is {}.".format(rmse))Classifiers=[["Random Forest",RandomForestClassifier()],["Support Vector Machine",SVC()],["LogisticRegression",LogisticRegression()],["KNN",KNeighborsClassifier(n_neighbors=5)],["Naive Bayes",GaussianNB()],["Decision Tree",DecisionTreeClassifier()],["AdaBoostClassifier",AdaBoostClassifier()],["GradientBoostingClassifier", GradientBoostingClassifier()],["XGB", XGBClassifier()],]設置訓練集X=train.drop(['目標客戶編號','品牌類型','購買意愿'], axis = 1)# X=train.drop(['目標客戶編號','品牌類型'], axis = 1)t=Xheaders = X.columnsX= X.astype(float)y = train["購買意愿"]訓練模型import warningswarnings.filterwarnings('ignore')Classify_result=[]names=[]prediction=[]for name,classifier in Classifiers:classifier=classifierclassifier.fit(X_train,y_train)y_pred=classifier.predict(X_test)recall=recall_score(y_test,y_pred,average='macro')precision=precision_score(y_test,y_pred,average='macro')f1score = f1_score(y_test, y_pred,average='macro')mse = return_rmse(y_test,y_pred)class_eva=pd.DataFrame([recall,precision,f1score,mse])Classify_result.append(class_eva)name=pd.Series(name)names.append(name)y_pred=pd.Series(y_pred)prediction.append(y_pred)plot_predictions(y_test,y_pred)## plt.savefig('seven1.png', dpi=300)plt.show()


上一頁
1
2
3
4
下一頁
		  	

    
    




    
    
    


推薦閱讀

           
                  
              
                  淡豆豉煮水喝有什么作用與功效 淡豆豉煮水喝有什么作用 
                
                   
                
              
            

                  
              
                  關于閃長巖簡述 閃長巖 
                
                   
                
              
            

                  
              
                  保衛蘿卜深海16攻略 保衛蘿卜深海攻略2關 
                
                   
                
              
            

                  
              
                  知名女星李羲兒車禍縫54針！一臉血跡躺倒在地，車子翻轉掉落田溝 ... 
                
                   
                
              
            

                  
              
                  報考的c1考了科目一可以改成c2嗎 報的是c1,考了科一,想換成c2可以不 
                
                   
                
              
            

                  
              
                  vivox21耗電快怎么辦 vivox21耗電快怎么解決 
                
                   
                
              
            

                  
              
                  李廣的生平事跡 李廣人物介紹 
                
                   
                
              
            

                  
              
                  職場女強人的星座女巨蟹女 
                
                   
                
              
            

                  
              
                  2021年正月初六出生的寶寶名字如何取,簡約大氣旺生肖 
                
                   
                
              
            

                  
              
                  2006年屬狗的是什么命五行屬什么 
                
                   
                
              
            

                  
              
                  光遇12月3日復刻旅行先祖兌換物品要多少蠟燭,高手進階 
                
                   
                
              
            

                  
              
                  平凡的世界讀書心得初二優秀作文700字 
                
                   
                
              
            

                  
              
                  宋媽后來怎么樣了 宋媽后來怎樣了 
                
                   
                
              
            

                  
              
                  當一個女人不愛你了會有什么表現 
                
                   
                
              
            

                  
              
                  飛機托運酒水規定2022 國內飛機能帶酒嗎？ 
                
                   
                
              
            

                  
              
                  四個木念什么 四個木念什么呀 
                
                   
                
              
            

                  
              
                  交通事故索賠需要準備哪些誤工費證據 
                
                   
                
              
            

                  
              
                  今日查詢價格3011元，今日查詢價格3011元寶？ 
                
                   
                
              
            

                  
              
                  造夢西游4手機版龍幣怎么得到 
                
                   
                
              
            

                  
              
                  關于跑跑姜餅人簡述 跑跑姜餅人 
                
                   
                
              
            

          

python ROS2時間同步 

圖文 Python 嵌入式打包 

其三 Gitea 1.18 功能前瞻：增強文本預覽效果、繼續擴展軟件包注冊中心、增強工單實用功能、完善了用戶邀請機制和SEO 

3 Python全棧工程師之從網頁搭建入門到Flask全棧項目實戰 - 入門Flask微框架 

跟我學Python圖像處理丨圖像特效處理：毛玻璃、浮雕和油漆特效 

四 Selenium4.0+Python3系列 - 常見元素操作（含鼠標鍵盤事件） 

二、python基本數據類型 

python3使用mutagen進行音頻元數據處理 

Python 根據兩個字段排序 中文排序 漢字排序 升序 降序 

錘子手機怎么樣，功能都實用嗎（錘子手機怎么進入工程模式)

Python數據分析：實用向( 三 )

推薦閱讀

淡豆豉煮水喝有什么作用與功效淡豆豉煮水喝有什么作用

關于閃長巖簡述閃長巖

保衛蘿卜深海16攻略保衛蘿卜深海攻略2關

知名女星李羲兒車禍縫54針！一臉血跡躺倒在地，車子翻轉掉落田溝 ...

報考的c1考了科目一可以改成c2嗎報的是c1,考了科一,想換成c2可以不

vivox21耗電快怎么辦 vivox21耗電快怎么解決

李廣的生平事跡李廣人物介紹

職場女強人的星座女巨蟹女

2021年正月初六出生的寶寶名字如何取,簡約大氣旺生肖

2006年屬狗的是什么命五行屬什么

光遇12月3日復刻旅行先祖兌換物品要多少蠟燭,高手進階

平凡的世界讀書心得初二優秀作文700字

宋媽后來怎么樣了宋媽后來怎樣了

當一個女人不愛你了會有什么表現

飛機托運酒水規定2022 國內飛機能帶酒嗎？

四個木念什么四個木念什么呀

交通事故索賠需要準備哪些誤工費證據

今日查詢價格3011元，今日查詢價格3011元寶？

造夢西游4手機版龍幣怎么得到

關于跑跑姜餅人簡述跑跑姜餅人