做社交網(wǎng)站有哪些全世界足球排名前十位
目錄
1.認(rèn)識(shí)Python
2.環(huán)境與工具
2.1 python環(huán)境
2.2 Visual Studio Code編譯
3.詞頻云圖
3.1 代碼構(gòu)思
3.2 代碼實(shí)例
3.3 運(yùn)行結(jié)果
4.總結(jié)
1.認(rèn)識(shí)Python
Python 是一個(gè)高層次的結(jié)合了解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語(yǔ)言。
Python 的設(shè)計(jì)具有很強(qiáng)的可讀性,相比其他語(yǔ)言經(jīng)常使用英文關(guān)鍵字或標(biāo)點(diǎn)符號(hào),它具有比其他語(yǔ)言更有特色的語(yǔ)法結(jié)構(gòu)。
2.環(huán)境與工具
2.1 python環(huán)境
在Windows上使用命令行窗口查看所安裝的python版本
python --version
?
2.2 Visual Studio Code編譯
Visual Studio Code是一款由微軟開(kāi)發(fā)且跨平臺(tái)的免費(fèi)源代碼編輯器。該軟件以擴(kuò)展的方式支持語(yǔ)法高亮、代碼自動(dòng)補(bǔ)全、代碼重構(gòu)功能,并且內(nèi)置了命令行工具和Git 版本控制系統(tǒng)。
3.詞頻云圖
3.1 代碼構(gòu)思
使用詞頻云圖模塊庫(kù)wordcloud、畫(huà)圖模板庫(kù)matplotlib、中文分詞庫(kù)jieba,讀入文本文件、圖片文件,然后通過(guò)分詞進(jìn)行文本解析,然后繪制最終的詞頻云圖。
3.2 代碼實(shí)例
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
import jieba# 文件路徑
filename = 'test2.txt'# 讀取文本文件
with open(filename, encoding='utf-8') as f:vtext = f.read()# 使用 jieba 分詞
vtext = ' '.join(jieba.cut(vtext))# 讀取背景圖片
img = plt.imread('1.png')# 獲取默認(rèn)的屏蔽詞,并添加自定義屏蔽詞
stopwords = set(STOPWORDS)
vstop = ['沒(méi)有', '還有', '不是', '只是', '說(shuō)到']
for i in vstop:stopwords.add(i)# 生成詞云對(duì)象
wordcloud = WordCloud(font_path='./part4/cangekuheiziti.ttf',background_color='white',max_words=200,mask=img,stopwords=stopwords
).generate(vtext)# 顯示詞頻云圖
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off') # 設(shè)置圖形坐標(biāo)# 顯示圖形
plt.show()# 保存圖形
wordcloud.to_file('wordcloud_output.jpg')
3.3 運(yùn)行結(jié)果
4.總結(jié)
在程序運(yùn)行前要保證文本文件1.txt文件內(nèi)有文本,這樣才能根基文本文件中詞語(yǔ)出現(xiàn)的頻率生成最終的詞頻圖,還有要注意要有.ttf字體文件以及背景圖片。
自己運(yùn)行起來(lái)試試看吧!