AI帶你省錢旅游！精準預測民宿房源價格！( 四 )

2026-05-09 生活百科

最受歡迎的房型是什么# 基于評論量統計排序ax = gm_df.groupby('property_type').agg(median_rating=('review_scores_rating', 'median'),number_of_reviews=('number_of_reviews', 'max')).sort_values(by='number_of_reviews', ascending=False).reset_index()ax.head()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖
在評論最多的前 10 種房產類型中，Entire rental unit 評論數量最多，其次是Private room in rental unit 。

# 可視化bx = ax.loc[:10]bx =sb.boxplot(data =https://www.huyubaike.com/biancheng/bx, x='median_rating', y='property_type')bx.set_xlim(4.5, 5)plt.title('Most Enjoyed Property types');plt.xlabel('Median Rating');plt.ylabel('Property Type')

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖
房東與房源分布

# 持有房源最多的房東host_df = pd.DataFrame(gm_df['host_name'].value_counts()/gm_df['host_name'].count() *100).reset_index()host_df = host_df.rename(columns={'index':'name', 'host_name':'perc_count'})host_df.head(10)

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖
host_df['perc_count'].loc[:10].sum()從上述分析可以看出，房源最多的前 10 名房東占房源總數的 13.6% 。
大曼徹斯特地區提供的客房類型分布gm_df['room_type'].value_counts()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖

# 分布繪圖zx = sb.countplot(data=https://www.huyubaike.com/biancheng/gm_df, x='room_type')total = float(gm_df['room_type'].count())for p in zx.patches:width = p.get_width()height = p.get_height()zx.text(p.get_x() + p.get_width()/2.,height+5, '{:1.1f}%'.format((height/total)*100), ha='center')zx.set_title('Plot showing different type of rooms available');plt.xlabel('Room')

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖
大部分客房是整棟房屋/公寓，占房源總數的 60% ，其次是私人客房，占房源總數的 39%，共享房間和酒店房間分別占房源的 0.7% 和 0.5% 。
機器學習建模下面我們使用回歸建模方法來對民宿房源價格進行預估。
特征工程

關于特征工程，歡迎大家查閱ShowMeAI對應的教程文章，快學快用。

機器學習實戰 | 機器學習特征工程最全解讀

我們首先對原始數據進行特征工程，得到適合建模的數據特征。
# 查看此時的數據集gm_df.head()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖

# 回歸數據集gm_regression_df = gm_df.copy()# 剔除無用字段gm_regression_df = gm_regression_df.drop(columns=['id', 'scrape_id', 'last_scraped', 'name', 'host_id', 'host_since', 'first_review', 'last_review', 'price_clusters', 'host_name'])# 再次查看數據gm_regression_df.head()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖
我們發現host_response_rate 和 host_acceptance_rate字段帶有百分號，我們再做一點數據清洗。

# 去除百分號并轉換為數值型gm_regression_df['host_response_rate'] =gm_regression_df['host_response_rate'].str.replace("%", "")gm_regression_df['host_acceptance_rate'] =gm_regression_df['host_acceptance_rate'].str.replace("%", "")# convert to intgm_regression_df['host_response_rate'] = pd.to_numeric(gm_regression_df['host_response_rate']).astype(int)gm_regression_df['host_acceptance_rate'] =pd.to_numeric(gm_regression_df['host_acceptance_rate']).astype(int)# 查看轉換后結果gm_regression_df['host_response_rate'].head()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖
bathrooms_text 列包含數字和文本數據的組合，我們對其做一些處理
# 查看原始字段gm_regression_df['bathrooms_text'].value_counts()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖

# 切分與數據處理def split_bathroom(df, column, text, new_column):df_2 = df[df[column].str.contains(text, case=False)]df.loc[df[column].str.contains(text, case=False), new_column] = df_2[column]return df# 應用上述函數gm_regression_df = split_bathroom(gm_regression_df, column='bathrooms_text', text='shared', new_column='shared_bath')gm_regression_df = split_bathroom(gm_regression_df, column='bathrooms_text', text='private', new_column='private_bath')# 查看shared_bath字段gm_regression_df['shared_bath'].value_counts()

AI帶你省錢旅游！精準預測民宿房源價格！

文章插圖

# 查看private_bath字段gm_regression_df['private_bath'].value_counts()
上一頁
1
2
3
4
5
6
下一頁
		  	

    
    




    
    
    


推薦閱讀

           
                  
              
                  平凡的世界讀書心得初二優秀作文700字 
                
                   
                
              
            

                  
              
                  宋媽后來怎么樣了 宋媽后來怎樣了 
                
                   
                
              
            

                  
              
                  2006年屬狗的是什么命五行屬什么 
                
                   
                
              
            

                  
              
                  關于跑跑姜餅人簡述 跑跑姜餅人 
                
                   
                
              
            

                  
              
                  報考的c1考了科目一可以改成c2嗎 報的是c1,考了科一,想換成c2可以不 
                
                   
                
              
            

                  
              
                  當一個女人不愛你了會有什么表現 
                
                   
                
              
            

                  
              
                  造夢西游4手機版龍幣怎么得到 
                
                   
                
              
            

                  
              
                  職場女強人的星座女巨蟹女 
                
                   
                
              
            

                  
              
                  交通事故索賠需要準備哪些誤工費證據 
                
                   
                
              
            

                  
              
                  vivox21耗電快怎么辦 vivox21耗電快怎么解決 
                
                   
                
              
            

                  
              
                  李廣的生平事跡 李廣人物介紹 
                
                   
                
              
            

                  
              
                  飛機托運酒水規定2022 國內飛機能帶酒嗎？ 
                
                   
                
              
            

                  
              
                  知名女星李羲兒車禍縫54針！一臉血跡躺倒在地，車子翻轉掉落田溝 ... 
                
                   
                
              
            

                  
              
                  光遇12月3日復刻旅行先祖兌換物品要多少蠟燭,高手進階 
                
                   
                
              
            

                  
              
                  2021年正月初六出生的寶寶名字如何取,簡約大氣旺生肖 
                
                   
                
              
            

                  
              
                  淡豆豉煮水喝有什么作用與功效 淡豆豉煮水喝有什么作用 
                
                   
                
              
            

                  
              
                  今日查詢價格3011元，今日查詢價格3011元寶？ 
                
                   
                
              
            

                  
              
                  四個木念什么 四個木念什么呀 
                
                   
                
              
            

                  
              
                  關于閃長巖簡述 閃長巖 
                
                   
                
              
            

                  
              
                  保衛蘿卜深海16攻略 保衛蘿卜深海攻略2關 
                
                   
                
              
            

          

一篇文章帶你了解NoSql數據庫——Redis簡單入門 

一篇文章帶你了解服務器操作系統——Linux簡單入門 

一步一圖帶你深入理解 Linux 虛擬內存管理 

一篇文章帶你了解熱門版本控制系統——Git 

一篇文章帶你了解網頁框架——Vue簡單入門 

我用canvas帶你看一場流星雨 

一篇文章帶你掌握主流辦公框架——SpringBoot 

帶你認識JDK8中超nice的Native Memory Tracking 

SpringBoot+Vue3 AgileBoot - 手把手一步一步帶你Run起全棧項目 

帶你讀AI論文丨ACGAN-動漫頭像生成


          
    
      上一篇：java中HashMap的設計精妙在哪？ 
      下一篇：完全背包問題 —— 貪心優化 DP 范圍


    
      
        更多...
        
          
               
            
              完全背包問題 —— 貪心優化 DP 范圍
            
          

               
            
              AI帶你省錢旅游！精準預測民宿房源價格！
            
          

               
            
              java中HashMap的設計精妙在哪？
            
          

               
            
              Arctic 基于 Hive 的流批一體實踐
            
          

               
            
              Div. 3 Codeforces Round #828  A-F
            
          

               
            
              原神圣顯之鑰升級突破材料是什么
            
          

               
            
              摩爾莊園機械龍魚的垂釣位置在什么地方
            
          

               
            
              支付寶莊園小課堂答案9.16
            
          

               
            
              2022支付寶螞蟻莊園9月15日答案
            
          

               
            
              王者榮耀莊周天秀幻夢新皮膚是什么價格



  
    
       
      
        
          生活百科
        
        
          Copyright © 2017-2022 浙江龍網 京ICP備14049044號-12