什么是SeabornSeaborn是基于matplotlib的圖形可視化python包。它提供了一種高度交互式界面,便于用戶能夠做出各種有吸引力的統(tǒng)計圖表。 Seaborn是在matplotlib的基礎(chǔ)上進行了更高級的API封裝,從而使得作圖更加容易,在大多數(shù)情況下使用seaborn能做出很具有吸引力的圖,而使用matplotlib就能制作具有更多特色的圖。應(yīng)該把Seaborn視為matplotlib的補充,而不是替代物。同時它能高度兼容numpy與pandas數(shù)據(jù)結(jié)構(gòu)以及scipy與statsmodels等統(tǒng)計模式。 按照國際慣例,先裝一波
什么報錯了,報錯是肯定的,seaborn包依賴于scipy包,所以要先裝scipy,解決方法如下: 升級pip解決了這個問題
seaborn APISeaborn 要求原始數(shù)據(jù)的輸入類型為 pandas 的 Dataframe 或 Numpy 數(shù)組,畫圖函數(shù)有以下幾種形式: sns.圖名(x='X軸 列名', y='Y軸 列名', data=原始數(shù)據(jù)df對象) sns.圖名(x='X軸 列名', y='Y軸 列名', hue='分組繪圖參數(shù)', data=原始數(shù)據(jù)df對象) sns.圖名(x=np.array, y=np.array[, ...])
barplot 將點估計和置信區(qū)間顯示為矩形條。 條形圖表示具有每個矩形的高度的數(shù)值變量的集中趨勢的估計,并且使用誤差條提供圍繞該估計的不確定性的一些指示 API介紹
Example for barplot
橫坐標為0-7的整數(shù),縱坐標表示這八個整數(shù)分別所占的權(quán)重,調(diào)整 palette 參數(shù)可以美化顯示風格 image
seaborn.barplot實戰(zhàn)1.數(shù)據(jù)集通過爬蟲爬取了貓眼上面,用戶對電影《狄仁杰之四大天王》的影評,如下圖所示,包括 image
2.代碼
通過pandas,讀取出數(shù)據(jù)在 data中,評分在rate下面 ,data['rate'].value_counts(),統(tǒng)計出各分數(shù)的人數(shù),如下圖所示 image
最后橫坐標為rate.index(0.0,0.5,1.0,1.5....5.0),縱坐標為給出各分數(shù)的人數(shù)/總?cè)藬?shù),這很容易理解,最后算出的就是,這個評分所占的比例。 3.分析結(jié)果image
看到超過40%的人給出了5.0的評分,超過85%的人給出了3.5以上的評分,至少說明這部電影在口碑方面上取得的成績是比較好的. 小結(jié)結(jié)合爬蟲爬取下來的電影數(shù)據(jù),根據(jù)評分來通過seaborn繪制出評分的發(fā)布直方圖,只介紹了seaborn的一種方法,不要著急,stpe by stpe.事實上一頭扎進文檔里,我相信看過5種繪圖方式,你就記不住了,方法學會了,之后,根據(jù)需求,查閱文檔,現(xiàn)學現(xiàn)用就行了 |
|