国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當前位置: 首頁 > news >正文

可信賴的武漢網(wǎng)站建設舉例網(wǎng)絡營銷的例子

可信賴的武漢網(wǎng)站建設,舉例網(wǎng)絡營銷的例子,php做的網(wǎng)站處理速度怎么樣,東莞市建設工程檢測中心網(wǎng)站前言 Elasticsearch 是基于 Lucene 的世界范圍內(nèi)最流行的全文檢索框架,其文檔相似度算法包含 TF/IDF 和 BM25,從 ES 5.0開始 BM25 算法已經(jīng)成為 ES 默認的相似度評分模塊。 TF-IDF 與 BM25 的區(qū)別 TF-IDF 和 BM25 都是計算文本相似性的常用算法。TF-ID…
前言

Elasticsearch 是基于 Lucene 的世界范圍內(nèi)最流行的全文檢索框架,其文檔相似度算法包含 TF/IDF 和 BM25,從 ES 5.0開始 BM25 算法已經(jīng)成為 ES 默認的相似度評分模塊。

TF-IDF 與 BM25 的區(qū)別

TF-IDF 和 BM25 都是計算文本相似性的常用算法。TF-IDF 的計算方法簡單,計算復雜度低,但對高頻詞不敏感,參數(shù)難以調(diào)節(jié)。BM25 是在 TF-IDF 的基礎上進行改進的,它考慮了文檔的長度和查詢詞在文檔中出現(xiàn)的次數(shù),在大多數(shù)情況下都能夠產(chǎn)生比 TF-IDF 更準確的相關性評分

TF-IDF 和 BM25 的主要區(qū)別在于計算方法的不同。TF-IDF 的計算方法為:

TF-IDF(t,d) = TF(t,d) * IDF(t)

其中:

  • TF(t,d) 表示詞 t 在文檔 d 中的詞頻
  • IDF(t) 表示詞 t 的逆文檔頻率

BM25 的計算方法為:

BM25(t,d) = (k1 + 1) * TF(t,d) / (k1 * (1 - b + b * df / docLength) + TF(t,d))

其中:

  • k1 是控制詞頻對權重的貢獻的參數(shù)
  • b 是控制逆文檔頻率對權重的貢獻的參數(shù)
  • d 是控制文檔長度對權重的貢獻的參數(shù)

TF-IDF 和 BM25 的區(qū)別主要體現(xiàn)在以下幾個方面:

  • 參數(shù)數(shù)量:TF-IDF 只需要一個參數(shù),即逆文檔頻率。BM25 需要三個參數(shù),即 k1、b 和 d,可以根據(jù)實際需求進行調(diào)節(jié),以提高相關性評分的準確性
  • 計算復雜度:TF-IDF 的計算復雜度為 O(n),其中 n 是文檔中的詞數(shù)。BM25 的計算復雜度與 TF-IDF 相當,即 O(n)。
  • 相關性評分:BM25 在大多數(shù)情況下都能夠產(chǎn)生比 TF-IDF 更準確的相關性評分。
評分在查詢業(yè)務場景中的應用

在實際業(yè)務中,有關查詢場景的評分可以分為如下四類:

不關注評分

這類場景下,純粹把 ES 當作檢索庫使用,不關注相似度評分,那么可以使用 constant query 或者使用 bool query 中的 filter 來進行過濾即可,這樣可以提高檢索性能

默認評分

默認評分,也就是框架默認評分。這類場景下,僅使用最簡單的查詢方式,比如 查詢 name:"tom",并沒有人為額外干預評分的機制,僅靠默認的評分算法的得到 rank 列表 ,做為檢索結果

業(yè)務評分 + 框架評分

此種場景下比較常見,比如查詢 name:"tom"^10 name:"cat"^5, 或者更加復雜的結合通過 Function Score Query 來完成更加復雜的業(yè)務

僅業(yè)務評分

這種場景下,一般在推薦業(yè)務中比較常見,其完全忽略框架的評分策略,而采納業(yè)務方或者產(chǎn)品方定義的評分規(guī)則,實現(xiàn)起來一般比較復雜,看一個例子:

GET /pi_ent_work/_search
{"query": {"function_score": {"query": {"bool": {"must": [{"query_string": {"boost": 0, # 注意此處禁用框架評分"query": "prov:(33 OR 36)"}}], "must_not": [{"terms": {"id": ["123"]}}], "filter": [{"term": {"count": {"value": "1"}}}]}}, "score_mode": "sum", "boost_mode": "replace", "functions": [{"script_score": {"script": {"lang": "expression", # 完全采用自定義評分并與數(shù)據(jù)中的某個字段關聯(lián)"source": " _score*0.8 + doc['custom_score'].value*0.4"}}}, {"weight": 6, "filter": {"query_string": {"query": "prov:(33 OR 36)"}}}, {"weight": 4, "filter": {"query_string": {"query": " product_id:112900 "}}}, {"weight": 2, "filter": {"query_string": {"query": "price:[* TO 3]"}}}]}}, "size": 100, "_source": {"includes": ["id","_score","prov","product_id","custom_score","count"]}
}

上面的例子完全忽略了框架評分,而全部采用自己指定的規(guī)則評分,在 ES 中可以結合 Function Score Query來實現(xiàn)

總結

在實際工作中,搜索和推薦業(yè)務會比較依賴全文檢索框架,很多情況下框架的默認的評分機制并不能很好的滿足我們的需求,所以需要結合一些自定義評分策略來完善我們的 rank 效果

http://aloenet.com.cn/news/45790.html

相關文章:

  • 網(wǎng)站后臺建設計劃書微信做單30元一單
  • 做網(wǎng)站的銷售團隊站長之家最新網(wǎng)站
  • 網(wǎng)站安裝系統(tǒng)怎么安裝教程視頻強強seo博客
  • 公司怎么做網(wǎng)站營銷模式方案
  • 北京網(wǎng)站建設新聞國產(chǎn)長尾關鍵詞拘挖掘
  • 有機蔬菜哪個網(wǎng)站做的更好溫州seo按天扣費
  • 網(wǎng)站制作公司興田德潤怎么聯(lián)系今天熱點新聞
  • 佛山網(wǎng)站代運營準度科技有限公司網(wǎng)站內(nèi)部鏈接優(yōu)化方法
  • 紹興做網(wǎng)站優(yōu)化大師電腦版
  • 免費商品列表網(wǎng)頁模板源代碼seo快速排名上首頁
  • 定制制作網(wǎng)站哪家好惠州seo網(wǎng)站推廣
  • 服裝官網(wǎng)網(wǎng)站建設百度推廣登陸后臺
  • 幫你省網(wǎng)站怎么做怎樣做網(wǎng)絡銷售平臺
  • 靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁的區(qū)別是什么魔貝課凡seo課程好嗎
  • 網(wǎng)站服務器打不開大數(shù)據(jù)培訓班需要多少錢
  • 邢臺市做網(wǎng)站seo工具不包括
  • 昔陽網(wǎng)站建設注冊域名在哪里注冊
  • php做門戶網(wǎng)站2024年最新時事新聞
  • 電影頻道做的網(wǎng)站廣告谷歌手機版瀏覽器官網(wǎng)
  • 小企業(yè)網(wǎng)絡營銷外包南寧seo產(chǎn)品優(yōu)化服務
  • wordpress建站好嗎武漢seo搜索優(yōu)化
  • 網(wǎng)絡營銷常用的方法seo 優(yōu)化技術難度大嗎
  • 專業(yè)做網(wǎng)站公司排名人工智能培訓機構哪個好
  • 做壁畫的網(wǎng)站湖南網(wǎng)站優(yōu)化
  • 如何在搜索中找到自己做的網(wǎng)站設計模板網(wǎng)站
  • msn網(wǎng)站制作windows優(yōu)化大師怎么用
  • 做商業(yè)廣告有什么網(wǎng)站好推銷的北大青鳥職業(yè)技術學院簡介
  • 女人能做網(wǎng)站開發(fā)嗎世界杯比分
  • 做網(wǎng)站可以申請專利嗎優(yōu)化防疫措施
  • 非響應式網(wǎng)站改響應式百度推廣賬號