韩漫免费漫画在线观看方法,《好好疼爱里面》免费看,年轻漂亮的女士护士内衣,妈妈醉酒后把我当爸爸电视剧

文章 > Python基础教程 > Python如何使用Spacy进行分词

Python如何使用Spacy进行分词

Python Spacy

头像

小妮浅浅

2021-07-29 09:42:355802浏览 · 0收藏 · 0评论

说明

1、Spacy语言模型包含一些强大的文本分析功能,如词性标记和命名实体识别。

2、导入spacy相关模块后,需要加载中文处理包。然后读小说数据,nlp处理天龙八部小说,包括分词、定量、词性标注、语法分析、命名实体识别,用符号/分隔小说。最后,通过is_stop函数判断单词中的单词是否为无效单词,删除无效单词后,将结果写入txt文件。

实例

import spacy
import pandas as pd
import time
from spacy.lang.zh.stop_words import STOP_WORDS
 
nlp = spacy.load('zh_core_web_sm')
 
def fenci_stopwords(data,newdata1):
    fenci = []
    qc_stopwords =[]
 
    article = pd.read_table(data,encoding="utf-8")
    start1 = time.time()
    with open(newdata1,'w',encoding='utf-8') as f1:
        for i in article["天龙八部"]:#分词
            doc = nlp(i)
            result1 = '/'.join([t.text for t in doc])
            fenci.append(result1)
 
  for j in fenci:#去除停用词   
            words = nlp.vocab[j]    
            if words.is_stop == False:        
                qc_stopwords.append(j)
                result2 = '/'.join(qc_stopwords)
                f1.write(result2)
    end1 = time.time()
    return end1-start1

以上就是Python使用Spacy进行分词的方法,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

五姑娘影院在线观看免费版电视剧 | 《办公室高潮秘书2》| 鹿鞭丸的功效和作用| 黑色蕾丝包臀紧身连衣裙| 成品PPT网站大片入口| 内衣走秀| 免费观看60分钟高清电视剧| 《初尝禁果》2:做爰HD| 《性爽2》电影| 窝窝影院在线观看免费播放电视剧| 朋友的未婚妻| 小花园按摩手法视频教程| 《健身房下的特殊待遇》| 国外成品网站1688入口在哪| 国精产品偷偷偷拍XXXX| AVI 视频| 成人电影| 臭小子快拔出来我是你嫲视频 | 暴躁妹妹CSGO直播| 白带内裤拉丝尿液| 成年二人世界免费观看电视剧| 尧建云| 出门忘穿胸置乳头凸起怎么办| 白带内裤拉丝尿液| 11人裸体航班女服务员是谁| 女性扒开大腿内侧小肚子痒| 伦理《少妇的滋味》完整版 | 电影《裸体肉欲》| 超级少女| 做爰高潮A片(毛片)| 类似蜜桃成熟时的电影| 《女仆教育》动漫第一季| 依卡| 小蜜桃免费观看高清电视剧| 《爸开车我抱着妈妈去姥姥家》| 和妈妈做了怎么办心理咨询| 李丽珍爱的精灵| 巨茎挺进李淑芬的体内视频| 麻花传剧MV无痕免费观看姐弟| 李丽珍的电影| 芬太尼在美国是怎么样的存在