南通網(wǎng)站群建設(shè)網(wǎng)絡(luò)廣告電話
一、Spark 案例實操
1.數(shù)據(jù)準(zhǔn)備
電商網(wǎng)站的用戶行為數(shù)據(jù),主要包含用戶的 4 種行為:搜索,點擊,下單,支付
樣例類:
2. Top10 熱門品類
先按照點擊數(shù)排名,靠前的就排名高;如果點擊數(shù)相同,再比較下單數(shù);下單數(shù)再相同,就比較支付數(shù)。
我們有多種寫法,越往后性能越高
(1)第一種寫法
// TODO : Top10熱門品類val sparConf = new SparkConf().setMaster("local[*]").setAppName("HotCategoryTop10Analysis")val sc = new SparkContext(sparConf)