PinnedA/B Testing : 90,000 Mobile Game Data(Python)To answer the question, ‘Does setting the gate at level 30 or level 40 result in higher player retention rates?’ I conducted an A/B test…Apr 26, 2024Apr 26, 2024
PinnedAnalyzing 530,000 Black Friday transactions data using MSSQL and PowerBIThis paper analyzes 530,000 Black Friday transactions data using MS SQL. The analysis reveals a consumption distribution tending towards…Apr 15, 2024Apr 15, 2024
印度物流巨頭公司Delhivery的14萬筆物流數據分析本文資料取自印度物流巨頭公司Delhivery真實物流數據,進行探索性資料分析(EDA),結果發現,60%的訂單是以小車(Carting)運送,其餘40%的訂單是整車貨物運輸(FTL)。其中小車運送的平均時間為2小時,整車貨物運輸運送的平均時間為11小時。然而,導航預估的時間都比…Jul 9, 2024Jul 9, 2024
RFM User Segmentation of 2.63 Million Purchase Records on an E-commerce Website (Python)This article analyzes user data from an e-commerce website specializing in electronic products, with a dataset consisting of 2.63 million…Jul 5, 2024Jul 5, 2024
電商網站263萬筆購買資料之RFM用戶分群本文選自2020年某電子產品電商網站,共263萬筆之購買資料進行用戶分析。在探索性資料分析(EDA)當中,我們發現三星與蘋果這兩大品牌分別以34%和30%的占了最大的市場份額。另外用戶的成交時間主要以上午9點到10點之間為最高峰。在RFM分析中,最重要的「重要價值客戶」僅僅佔10…Jul 2, 2024Jul 2, 2024
手遊9萬筆數據之A/B Testing分析「關卡(gate)設置在玩家30等或是40等時,玩家的留存率會較高?」為了回答這個問題,我對這款手遊數據進行A/B testing。本文利用無母數方法與拔靴法解決樣本非常態分配的問題。結果顯示,關卡設置在30等時玩家留存率較高,但玩家遊玩的回合數沒有顯著差異。Apr 23, 2024Apr 23, 2024
Factors Affecting Individual Medical Expenditure: Multiple Linear Regression and Machine Learning…I established mutiple regression models using data from 1338 US nationals. Robust standard errors were utilized to address…Apr 16, 2024Apr 16, 2024
Predicts the Recurrence in Thyroid Cancer Based on Machine Learning Models(Python)Apr 16, 2024Apr 16, 2024
統計學基本觀念與簡單線性迴歸分析這篇文章會介紹統計學中幾個重要的觀念:屬量資料與類別資料該如何建模;OLS與MLE的介紹;如何評估點估計量的表現; 信賴區間與型一錯誤的介紹;簡單回歸的假設以及分析等等,幫助數據分析新手們降低統計學門檻。Apr 10, 2024Apr 10, 2024