免费人成动漫在线播放r18-免费人成观看在线网-免费人成黄页在线观看日本-免费人成激情视频在线观看冫-jlzzjlzz亚洲大全-jlzzjlzz亚洲日本

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 資訊 » 正文

盤點(diǎn)一個英文文本中統(tǒng)計關(guān)鍵詞的方法

放大字體  縮小字體 發(fā)布日期:2022-12-07 18:08:24    作者:微生翼虎    瀏覽次數(shù):86
導(dǎo)讀

大家好,我是皮皮。一、前言前幾天在Python最強(qiáng)王者交流群【W(wǎng)endy Zheng】問了一個英文文本中統(tǒng)計關(guān)鍵詞得問題,這里拿出來給大家分享下。二、實(shí)現(xiàn)過程針對這個問題,感謝給出一個思路方法,也許有幫助,首先我們需

大家好,我是皮皮。

一、前言

前幾天在Python最強(qiáng)王者交流群【W(wǎng)endy Zheng】問了一個英文文本中統(tǒng)計關(guān)鍵詞得問題,這里拿出來給大家分享下。

二、實(shí)現(xiàn)過程

針對這個問題,感謝給出一個思路方法,也許有幫助,首先我們需要將Excel中得文本進(jìn)行導(dǎo)入到一個文感謝件中去,代碼如下:

# coding: utf-8import pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())# df['可以關(guān)鍵詞']for text in df['工作要求']: # print(text) if text is not None: with open('工作要求.txt', mode='a', encoding='utf-8') as file: file.write(str(text))print('寫入完成')

接下來就可以針對這個文感謝件進(jìn)行相關(guān)得詞頻統(tǒng)計了,如果你有自己自定義得關(guān)鍵詞,也可以就著關(guān)鍵詞去統(tǒng)計,沒有得話,就自己在關(guān)鍵詞范圍內(nèi),任意取多少個關(guān)鍵詞都可以,相關(guān)得代碼如下所示:

from collections import Counterimport pandas as pddf = pd.read_excel('./文本.xlsx')# print(df.head())words = []with open('工作要求.txt', 'r', encoding='utf-8') as f: line = f.readlines() for word in line[0].split(' '): words.append(word)print(len(words))counter = Counter(words)# print(counter)# df['可以關(guān)鍵詞']for text in df['可以關(guān)鍵詞']: for k, v in counter.items(): if k == text: print(k, v)

這個代碼對于英文文本還是適用得,不過有個小問題,如下。

最后這里也給出中文分詞得代碼和可視化代碼,兩者結(jié)合在一起得,感興趣得小伙伴們可以試試看。

from collections import Counter # 統(tǒng)計詞頻from pyecharts.charts import Barfrom pyecharts import options as optsfrom snownlp import SnowNLPimport jieba # 分詞with open('text_分詞后_outputs.txt', 'r',encoding='utf-8') as f: read = f.read()with open('stop_word.txt', 'r', encoding='utf-8') as f: stop_word = f.read()word = jieba.cut(read)words = []for i in list(word): if i not in stop_word: words.append(i)columns = []data = []for k, v in dict(Counter(words).most_common(10)).items(): columns.append(k) data.append(v)bar = ( Bar() .add_xaxis(columns) .add_yaxis("詞頻", data) .set_global_opts(title_opts=opts.TitleOpts(title="詞頻top10")) )bar.render("詞頻.html")三、總結(jié)

大家好,我是皮皮。這篇文章主要盤點(diǎn)了一個英文文本中統(tǒng)計關(guān)鍵詞方法處理得問題,文中針對該問題,給出了具體得解析和代碼實(shí)現(xiàn),幫助粉絲順利解決了問題。

最后感謝粉絲【W(wǎng)endy Zheng】提問,感謝【Python進(jìn)階者】給出得思路和代碼解析,感謝【Python狗】等人參與學(xué)習(xí)交流。

 
(文/微生翼虎)
免責(zé)聲明
本文僅代表作發(fā)布者:微生翼虎個人觀點(diǎn),本站未對其內(nèi)容進(jìn)行核實(shí),請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

粵ICP備16078936號

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

客服001 客服002 客服003

工作時間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 天天曰夜夜曰 | 中文字幕第315页 | 免费大片黄在线现看国语 | 免费看黄网站在线 | 波多野结衣在线免费视频 | 免费国产成人高清在线看软件 | 免费国产成人18在线观看 | 欧美大片国产在线永久播放 | 欧美成人综合 | 国产午夜一级鲁丝片 | 精品一卡二卡三视频 | 中国黄色毛片 大片 | 成人a大片高清在线观看 | 在线日韩国产 | 欧美a欧美乱码一二三四区 欧美a在线看 | 黄色网在线免费观看 | 在线播放日韩 | 成人精品国产 | 正品蓝导航永久福利在线视频 | 日本三级欧美三级人妇英文 | 黄色一级片观看 | 国产片一级aaa毛片视频 | 2021人人莫人人擦人人看 | 日韩欧美在线看 | 国产成人综合亚洲动漫在线 | 亚洲91在线视频 | 天天干天天日天天射天天操毛片 | 日本人免费xxx在线视频 | 91视频合集 | 午夜小视频在线播放 | 日本黄色片网站 | 九九网站| 26uuu在线观看 | 国产大片中文字幕在线观看 | 成人在线视频网 | 国产成人综合久久精品红 | 午夜爱爱网站 | 一级毛片影院 | 男女拍拍拍无挡免费视频 | 久久精品94精品久久精品动漫 | 色综合久久六月婷婷中文字幕 |