詞云是什么?如何使用Python創(chuàng)建詞云?
介紹從開始從事數(shù)據(jù)可視化工作的那一天起,我就愛上它了,我總是喜歡從數(shù)據(jù)中獲得有用的見解。在此之前,我只了解基本圖表,例如條形圖,散點(diǎn)圖,直方圖等,這些基本圖表內(nèi)置在tableau中,而Power BI則用于數(shù)據(jù)可視化。通過每天完成此任務(wù),我遇到了許多新圖表,例如徑向儀表盤,華夫圖等。因此,出于好奇,最近我正在搜索數(shù)據(jù)可視化中使用的所有圖表類型,這些詞云引起了我的注意,我發(fā)現(xiàn)它非常有趣。之后,我嘗試使用Tableau和Power BI中的少量數(shù)據(jù)來制作詞云,在成功嘗試之后,我想通過使用條形圖,餅圖和其他圖表的代碼來嘗試使用它。詞云是什么?定義:詞云是一個簡單但功能強(qiáng)大的可視化表示對象,用于文本處理,它以更大,更粗的字母和不同的顏色顯示最常用的詞,單詞的大小越小,重要性就越小。
詞云的用途
1.社交媒體上的熱門標(biāo)簽(Instagram,Twitter):全世界的社交媒體都在尋找最新的趨勢,因此,我們可以獲取人們在其帖子中使用最多的標(biāo)簽來探索最新的趨勢。
2.媒體中的熱門話題:分析新聞報道,我們可以在頭條新聞中找到關(guān)鍵字,并提取出前n個需求較高的主題,來獲得所需的結(jié)果,即前n個熱門媒體主題。
3.電子商務(wù)中的搜索詞:在電子商務(wù)購物網(wǎng)站中,網(wǎng)站所有者可以制作被搜索次數(shù)最多的購物商品的詞云,這樣,他就可以了解在特定時期內(nèi)哪些商品需求量最大。讓我們開始使用Python來實現(xiàn)詞云首先,我們需要在jupyter notebook中安裝所有庫。在python中,我們將安裝一個內(nèi)置庫wordcloud。在Anaconda命令提示符下,輸入以下代碼:pip install wordcloud
如果你的anaconda環(huán)境支持conda,請輸入:conda install wordcloud
這可以直接在notebook中實現(xiàn),只需在代碼的開頭添加“!”即可。像這樣:!pip install wordcloud
但現(xiàn)在我想生成擁有任何主題的維基百科文本的詞云,因此,我將需要一個Wikipedia庫來訪問Wikipedia API,可以通過在anaconda命令提示符下安裝Wikipedia來完成,如下所示:pip install wikipedia
現(xiàn)在我們還需要其他一些庫,它們是numpy,matplotlib和pandas。截至目前,我們需要的庫就安裝好了import wikipedia
result= wikipedia.page("MachineLearning")
final_result = result.content
print(final_result)
機(jī)器學(xué)習(xí)維基百科頁面的輸出:
上圖是我們通過檢索Wikipedia的機(jī)器學(xué)習(xí)頁面獲得的輸出圖像,我們還可以看到它可以向下滾動,這表示將檢索整個頁面。在這里,我們還可以通過摘要方法得到頁面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)
print(result)
這里我們有句子的參數(shù),因此我們可以用它來檢索特定的行數(shù)。
輸出5個句子讓我們一起創(chuàng)建wordcloudfrom wordcloud import WordCloud, StopWords
import matplotlib.pyplot as plt
def plot_cloud(wordcloud):
plt.figure(figsize=(10, 10))
plt.imshow(wordcloud)
plt.a(chǎn)xis("off");
wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)
plot_cloud(wordcloud)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實用主義
- 7 騰訊 Q2 財報亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機(jī)會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對接會成功舉辦