<button id="8xizv"></button>
<em id="8xizv"><ol id="8xizv"></ol></em>

    1. 當前位置:首頁 > SEO文章轉載 > 什么是TF-IDF算法,在SEO優化中TF-IDF算法怎么用

      什么是TF-IDF算法,在SEO優化中TF-IDF算法怎么用

      2
        TF-idf算法是一種用戶信息檢索和常用的加權信息挖掘技術,經常SEOER應用于,很多人可能不知道,事實上,最直觀的理解是“網站關鍵字密度”。

      直接點,TF-idf算法最終是如何計算:

      公式:

      TF:詞頻

      IDF:逆文檔頻率指數

      TF-IDF=TF*IDF

      我們說明,TF詞義,指的是《紐約時報》一個單詞出現在頁面,如果單詞的總數在200年的一篇文章,“網站優化”這個詞出現了4次,然后這個詞TF=4/200,是0。02。

      IDF文檔頻率,指N出現在很多頁面的字數,文件數米,然后IDF=lg(M/N)。假設“網站優化”出現在2000頁,文件的總數是100000000,然后IDF的文檔頻率=lg(100000000/2000)=4。69897,然后計算最后TF-IDF=0。02*4。69897=4。69897。

      這是一個判斷頁面的相關問題,在SEO網站優化,不僅決定TF-IDF點的值,我們需要一個高度識別詞的頁面。例如:搜索引擎包含一萬億頁,應該說,每個頁面都有“,,,”等等,這些高頻詞也稱為噪聲詞或停止的話,搜索引擎會刪除這些話,所以額外的重量這些話應該是0。公式:TF-IDF日志(1美元/一萬億)==log1=0。

      事實上,搜索引擎檢索、重量計算,根據每個單詞分割來計算,例如:“SEO網站優化技術”這個詞。

      假設:SEO頁面檢索數字20000000,網站優化搜索號碼是10000000,檢索技能的數量500000000

      搜索引擎索引號被認為是10000000000。

      SEO在這個網站www。ruihess。com頁面(頁面總共400字)出現8次,網站優化技術出現10次,16倍。

      所以他們的頻率

      特遣部隊(SEO)=8/400=0。02,

      特遣部隊(網站優化)=10/400=0。025

      特遣部隊(=20/400=0。04技術)

      特遣部隊(年代)=上面已經提到的,屬于停止詞的高頻,重量是0。

      做一個搜索“SEO網站優化技術”這個頁面的相關性:TF(總)=0。02+0。025+0。025=0。095。

      IDF(SEO)=日志(10000000000/20000000)=2。69897

      IDF(網站優化)日志(10000000000/10000000)=3=

      IDF(技能)=日志(10000000000/100000000)=1。69897

      這么算下來,每個單詞搜索“SEO網站優化技術”頁面權重和相對貢獻值分別為:

      Tf-idf(SEO)=0。02*2。69897=2。69897

      Tf-dif(網站優化)=0。025*3=0。075

      Tf-idf(=0。04*1。69897=0。04技術)

      因此,可以看到,盡管技術出現更頻繁,但承認不是搜索引擎優化和網站優化,所以頁面的貢獻并不太大的重量。

      預測能力一個單詞的識別度較高,那么多字的重量,而更小,看到“網站優化”可能你已經有了一個基本的了解這個頁面說什么,但看到技能,您可能還不太了解的主題頁面。

      當然,這支持點搜索引擎算法,我們結合標記實現舉重,如H標記,和周圍的關鍵詞詞將被傳遞,這指的是如一個標簽:SEO網站優化技術主要是一些搜索引擎優化的想法

      杭州seo猜您喜歡

    2. «
    3. »
    4. 作者:
      除非注明,本文原創:杭州SEO,歡迎轉載!轉載請以鏈接形式注明本文地址,謝謝。
      原文鏈接:http://www.vxqb.tw/87.html

      發表評論

      江苏体彩