韩漫免费漫画在线观看方法,《好好疼爱里面》免费看,年轻漂亮的女士护士内衣,妈妈醉酒后把我当爸爸电视剧

文章 > Python基础教程 > python搜索模块如何查询

python搜索??槿绾尾檠?/p>

python搜索???/a>

头像

小妮浅浅

2021-08-10 09:44:592915浏览 · 0收藏 · 0评论

说明

获取原始数据并构建倒排索引后,可根据用户输入查找相关内容。

1、先对用户的输入进行分词。

2、然后根据倒排索引获取与每个单词相关的文章。

3、最后,计算每个单词和相关文章之间的分数。分数越高,相关性越大。

实例

def search(self, query):
    BM25_scores = {}
 
    # 对用户输入分词
    # 并将其变成 {word: frequency, ...} 的形式
    query = jieba.lcut_for_search(query)
    word2freq = self.format(query)
 
    # 遍历每个词
    # 计算每个词与相关文章之间的得分(计算公式参考 BM25 算法)
    for word in word2freq:
        data = self.iindex.get(word)
        if not data:
            continue
        BM25_score = 0
        qf = word2freq[word]
        df = data['df']
        ds = data['ds']
        W = math.log((self.N - df + 0.5) / (df + 0.5))
        for doc in ds:
            doc_id = doc['id']
            tf = doc['tf']
            dl = doc['dl']
            K = self.k1 * (1 - self.b + self.b * (dl / self.AVGDL))
            R = (tf * (self.k1 + 1) / (tf + K)) * (qf * (self.k2 + 1) / (qf + self.k2))
            BM25_score = W * R
            BM25_scores[doc_id] = BM25_scores[doc_id] + BM25_score if doc_id in BM25_scores else BM25_score
 
    # 对所有得分按从大到小的顺序排列,返回结果
    BM25_scores = sorted(BM25_scores.items(), key = lambda item: item[1])
    BM25_scores.reverse()
    return BM25_scores

以上就是python搜索??榈牟檠椒?,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

姨母的绣感中字2| 白丝脚上的浓浓的精华波能用吗| 伦理《少妇的滋味》完整版| 《大度》韩版免费| 久久久综合精品一区二区三区| 暴躁少女免费看完整版| 《炸裂吧!巨棒》免费阅读漫画 | 窝窝影院在线观看免费播放电视剧| 小蜜桃免费观看高清电视剧| 舒淇| 被灌满精子的女人会得白血病吗| 《美丽妻子替夫还债》剧情| 欧美叔叔别撩我免费观看电视剧| 蜜桃来偷欢免费观看高清电视剧| 公么无耻要求中韩双字的意思| 《丰满的女邻居》播放| 高瀬杏| EXO妈妈MV高清免费观看| 小雪解开乳罩给老杨摸| 趁女朋友洗澡C她闺蜜| 《工地夫妻》原声版| GAI视频免费播放器| 《酒店激战》动漫1-5集免费观..| 后妈的绣感6| 亲你私下的男人最有效的一句| 《被按摩的人妻4》| 美丽小洞5荷尔蒙| 一边啃奶头一边躁狂会怎么样| 电影《偷吃》在线观看| 麻花传剧MV无痕免费观看姐弟 | 交换的一天电影完整播放在线观看| 老公把舌头放进我B里搅拌| 搜索引擎| 《慈母夜吟》完整版| 高三妈妈用性缓解孩子压力| 狠狠的鲁五月| 小日子在线观看高清完整版| 黑色莆丝透视露胸旗袍连衣裙| 免费观看已满十八岁电视剧国外| 蜜桃熟了| -区二三国产好的精华波品牌介绍