韩漫免费漫画在线观看方法,《好好疼爱里面》免费看,年轻漂亮的女士护士内衣,妈妈醉酒后把我当爸爸电视剧

文章 > Python基础教程 > Python中Tf-idf文本特征的提取

Python中Tf-idf文本特征的提取

Python Tf-idf

头像

小妮浅浅

2021-09-15 09:25:473836浏览 · 0收藏 · 0评论

说明

1、TF-IDF是如果词或词组出现在文章中的概率较高,而在其他文章中很少出现,那么它就被认为具有很好的类别区分能力,适合进行分类。

2、提取文本特征,用来评估字词对文件集或某个语料库中文件的重要性。

实例

def tfidf_demo():
    """
    用tfidf的方法进行文本特征提取
    :return:
    """
    # 1.将中文文本进行分词
    data = ["一种还是一种今天很残酷,明天更残酷,后天很美好,但绝对大部分是死在明天晚上,所以每个人不要放弃今天。",
            "我们看到的从很远星系来的光是在几百万年之前发出的,这样当我们看到宇宙时,我们是在看它的过去。",
            "如果只用一种方式了解某样事物,你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"]
    data_new = []
    for sent in data:
        data_new.append(cut_word(sent))
    # print(data_new)
    # 2.实例化一个转换器类
    transfer = TfidfVectorizer(stop_words=["一种", '因为'])
    # 3.调用fit_transform
    data_final = transfer.fit_transform(data_new)
    print("data_new:\n", data_final.toarray())
    print("特征名字:\n", transfer.get_feature_names())
    return None

以上就是Python中Tf-idf文本特征的提取,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

公交车被上高湖了还能坐吗小说 | 二人努力生猴子免费观看| 黑人空乘伦理5| 欧美人动物PPT免费模板大全| 《性房纵欲》在线观看| 《交换做爰》在线观看| 水蜜桃免费观看电视剧最新章节| 两人一起做AJ的视频教程| 被灌满精子的女人会得白血病吗| 性之剧毒 电影| 免费的行情网站WWW下载大全| 日韩电影在线观看高清版电视剧| 《炸裂吧!巨棒》免费阅读漫画| 打牌生猴子的视频大全| 一母四女战一婿刘琴小说免费阅读| 女友小雪被教练猛烈进出视频| 周未同床 电影| 奶牛厂| 停电插班花TXT| 痴癫普通话版免费观看| 妈妈的朋友| 《头等舱》韩国电影在线看| 一前一后三个人一起的游戏规则| 《急救护士1982满天星》| 《厨房韵母2》动漫下线了吗| 《黏糊糊的你》免费观看| 《打烊后仅剩的沙龙樱花片尾曲》 | 麻豆蜜桃69无码专区在线| 野花韩国视频中文免费观看7| 男女睡过以后谁更想念| 空姐少女正版2| 茉莉花| 杨利伟的简介| 农场一母四女一婿胡本兴小说| 臣卜扌桑扌圭辶鬲猛| 爱动漫网| 《年轻朋友的妻子3》| 妈妈的闺蜜电视剧免费观看完整版..| 麻花传MDR国语免费版| 干柴烈火1982年美国版| 公天天吃我奶躁我的在