尤物视频在线观看|国产尤物视频在线观看|99热在线获取最新地址,久久频这里精品99香蕉久,国产色婷婷精品综合在线,亚洲欧美日韩高清在线看

觸屏版
全國服務(wù)熱線：0571-87205688

價格查詢批量查詢一鍵轉(zhuǎn)入

或者

立即發(fā)布需求

昵稱：匆匆那年

接單：187 關(guān)注TA

達(dá)標(biāo)率 0%

博文分類

最新博文

熱門博文

刷百度相關(guān)搜索和下拉框的技術(shù)原理

作者：匆匆那年 瀏覽：123次發(fā)布時間：2017-11-03

分享

評論

贊0

第一：百度搜索SEO出現(xiàn)的相關(guān)搜索：

以SEO為核心的相關(guān)詞-什么是SEO，如何進(jìn)行SEO

以SEO語義相關(guān)的相關(guān)詞-網(wǎng)絡(luò)推廣

第二：搜狗搜索SEO出現(xiàn)的相關(guān)搜索：

以SEO為核心的相關(guān)詞- seo是什么 seo教程seo查詢

以SEO語義相關(guān)的相關(guān)詞-搜索引擎優(yōu)化

第三：360搜索知乎出現(xiàn)的相關(guān)搜索

以知乎為核心的知乎網(wǎng)，知乎日報

以知乎同類性質(zhì)，語義相關(guān)的果殼網(wǎng)，天涯論壇

還有一就是產(chǎn)品，品牌，公司相關(guān)，比如搜飲料出現(xiàn)康師傅

相關(guān)搜索含義：用戶在搜索框搜索關(guān)鍵詞的時候，在搜索結(jié)果頁的最下方呈現(xiàn)出與搜索詞精準(zhǔn)匹配，詞組匹配，廣泛匹配，相同拼音的相關(guān)詞。遵循拼音，詞組，意義相關(guān)性算法。

相關(guān)搜索目的：增加用戶搜索體驗(yàn)感，最大限度的解決用戶的搜索需求。當(dāng)用戶查詢詞不當(dāng)，查詢結(jié)果不佳，不知道還有什么更精彩豐富內(nèi)容，那么相關(guān)搜索就可以解決這些用戶痛點(diǎn)，為用戶啟發(fā)性質(zhì)作用，幫助用戶發(fā)現(xiàn)和他更多他意圖相關(guān)的詞。

下拉框是一種搜索提示，是用戶搜索關(guān)鍵詞沒有點(diǎn)擊搜索的時候出現(xiàn)的提示，根據(jù)關(guān)鍵詞前綴匹配

相關(guān)搜索是一種推薦引擎，是用戶搜索關(guān)鍵詞點(diǎn)擊搜索之后的推薦，根據(jù)關(guān)鍵詞語義，拼音，詞組匹配

第一：為了最正確的搜索結(jié)果。

第二：是為了擴(kuò)展搜索，找到更多的東西。

刷搜索引擎相關(guān)搜索的目的：

第一：就是讓我們網(wǎng)站已經(jīng)有了排名的品牌詞，網(wǎng)站名稱，網(wǎng)站關(guān)鍵詞出現(xiàn)在更多關(guān)鍵詞的相關(guān)搜索中，讓更多的用戶點(diǎn)擊相關(guān)搜索達(dá)到網(wǎng)站，提高網(wǎng)站權(quán)重，網(wǎng)站流量。

第二：當(dāng)搜某個核心關(guān)鍵詞，在相關(guān)搜索中出現(xiàn)你的產(chǎn)品，品牌，名稱的推薦，那么會給用戶帶來視覺沖擊，信任建立，知名度，競爭力。

第三：起到引導(dǎo)作用，比如搜索飲料相關(guān)搜索出現(xiàn)康師傅，那么用戶很可能會點(diǎn)擊康師傅。

刷百度相關(guān)搜索原理：

第一：搜索詞熱搜指數(shù)，熱搜度，當(dāng)一個詞的熱度達(dá)到一定搜索流量的時候，只要搜索該詞的拼音，相關(guān)詞就會出現(xiàn)該關(guān)鍵詞。

第二：與搜索詞相關(guān)度，相關(guān)搜索詞語義，拼音，詞組肯定和搜索詞匹配。

第三：搜索引擎網(wǎng)站流量，就算沒有人搜索這個次，但是改詞在百度的權(quán)重非常高，同樣能夠出現(xiàn)在相關(guān)搜索詞中。

第四：下拉框和相關(guān)搜索的影響度很高。

第五：實(shí)時熱點(diǎn)，例子，搜索知乎的時候，出現(xiàn)了林志穎，這個語義并不關(guān)聯(lián)，但是林志穎的人氣很高，導(dǎo)致搜索了知乎的人可能跟著搜索過林志穎，這是用戶行為決定的搜索相關(guān)詞也是其中一個算法原理。

刷相關(guān)搜索的實(shí)現(xiàn)方法：

第一：比如SEO，我們可以先搜索SEO，然后接著再去搜索SEO教程，那么每天以幾倍的方式增加，當(dāng)達(dá)到一定搜索量的時候，那么SEO的相關(guān)詞搜索就會出現(xiàn)SEO教程了。

打開百度首頁//www.baidu.com/輸入黑卡紙出來的地址為：

//www.baidu.com/s?wd=%BA%DA%BF%A8%D6%BD&rsv_bp=0&inputT=32343

這串代碼中：%BA%DA%BF%A8%D6%BD是代表黑卡紙的代碼

inputT=32343這個是代表搜索結(jié)果出來的運(yùn)算時間（每臺電腦這個數(shù)據(jù)都不一樣的）

再出來的頁面中輸入你要的品牌，比如荔禾黑卡，輸入完畢后，點(diǎn)百度一下。

出來的地址為：//www.baidu.com/s?bs=%BA%DA%BF%A8%D6%BD&f=8&rsv_bp=1&wd=%BA%DA%BF%A8%D6%BD%C0%F3%BA%CC%BA%DA%BF%A8&inputT=54390

這串代碼中：

%BA%DA%BF%A8%D6%BD

這里不變，因?yàn)檫@個是之前我們搜索的黑卡紙，百度就在這里開始記錄下黑卡紙和現(xiàn)在的黑卡紙荔禾黑卡這兩個詞是相關(guān)的。

f=8這個數(shù)值是會變動的。范圍為：

0-9.數(shù)值越高，代表著這個相關(guān)搜索的詞越容易做上去。

%BA%DA%BF%A8%D6%BD%C0%F3%BA%CC%BA%DA%BF%A8是代表黑卡紙荔禾黑卡的代碼

inputT=54390是代表這個是代表搜索結(jié)果出來的運(yùn)算時間

第二：雇傭水軍，或者買肉雞真實(shí)去人為制造相關(guān)搜索量。

第三：去購買網(wǎng)站的彈窗廣告，用戶沒點(diǎn)一次就是搜索一次。

第四：誘導(dǎo)，通過在論壇或其他流量大的頁面，放上相關(guān)詞和搜索詞的訪問地址后誘導(dǎo)用戶不斷點(diǎn)擊。

第五：購買軟件來刷搜索引擎相關(guān)搜索。

注意：

第一：相關(guān)搜索詞必須有一定的搜索量

第二：相關(guān)搜索詞確實(shí)和搜索關(guān)鍵詞是相關(guān)性質(zhì)的詞

怎么刪除百度相關(guān)搜索：

第一：百度網(wǎng)頁投訴中心投訴

第二：把正面的信息刷上去壓制負(fù)面相關(guān)搜索，并把正面信息做好相應(yīng)的著陸文章頁面。

相關(guān)搜索算法思想：

相關(guān)搜索系統(tǒng)的輸入為用戶的搜索詞，而輸出是一堆與這個詞相關(guān)的其他詞。

搜索詞的出現(xiàn)得益于搜索引擎的詞典，可以計算出語義相關(guān)的詞，但是這樣的詞典中語義相關(guān)的詞還是不足與滿足用戶，所以在次基礎(chǔ)上加入用戶行為（搜索記錄，點(diǎn)擊記錄）來拓展更多相關(guān)詞庫。

通過用戶數(shù)據(jù)引發(fā)的思考：

第一：后繼詞，當(dāng)用戶搜索一個詞比如SEO,，發(fā)現(xiàn)在搜索結(jié)果列表中沒有你需要的內(nèi)容，那么就繼續(xù)用戶其他的詞來尋找，比如搜索SEO教程，那么SEO教程就成了SEO的后繼詞了，所以這種屬于用戶幫搜索引擎找語義相關(guān)詞。

第二：如果一個關(guān)鍵詞搜索詞結(jié)果，跟另外一個，甚至幾個關(guān)鍵詞搜索出來的結(jié)果很多交集，那么這些關(guān)鍵詞很可能也是語義相關(guān)的詞，如果這些搜索結(jié)果的交集被點(diǎn)擊并滿足了，那就確定相關(guān)了。

比如：搜索關(guān)鍵詞A，B，同樣找到了結(jié)果中的HTML1頁面都滿足了這個搜索詞的需求，那么A，B是有一定相關(guān)性的。

相關(guān)搜索算法實(shí)現(xiàn)原理：

用戶后繼詞原理：

把用戶在5分鐘之內(nèi)在搜索引擎中搜索詞定義為一次搜索行為，那么就形成了搜索日志，搜索日志如下：

cookie:用戶cookieid keys:[A1,A2……] [B1,B2……] [C1,C2……]

接著按用戶進(jìn)行分類，時間間隔5分鐘進(jìn)行數(shù)據(jù)清理，[x1,x2……]一個數(shù)組表示一次搜索行為，每個數(shù)組的第一位就是當(dāng)次搜索行為的第一個搜索詞。

cookie:用戶cookieid keys:[A1,A2……] [B1,B2……] [C1,C2……]

對于單個用戶來說搜索后繼詞的確定性是不夠的，比如搜索科比，但是一看到旁邊有人我就立刻改變搜索培訓(xùn)，那么這兩個詞是沒有相關(guān)性質(zhì)的。那么就加入統(tǒng)計規(guī)則去掉一些雜質(zhì)，比如某個詞B只有出現(xiàn)在5個用戶的相同的搜索詞A的后繼詞中才算一個A的后繼詞，還有其他的一些規(guī)則，這么下來，日志就變成了。

key：A succeed：A1,A2,A3……

用戶協(xié)同過濾原理：

當(dāng)搜索用戶日志足夠多的情況，可以把擁有相同搜索記錄的用戶聚合起來，通過協(xié)同過濾算法，獲取更多的相關(guān)性的詞。通過下面協(xié)同過濾算法同樣可以把加索爾推薦給NBA了。

A用戶：籃球后繼詞男籃女籃

B用戶：NBA 后繼詞男籃科比

C用戶：男籃比賽后繼詞男籃加索爾

從搜索詞算法實(shí)現(xiàn)：

如果一個關(guān)鍵詞搜索詞結(jié)果，跟另外一個，甚至幾個關(guān)鍵詞搜索出來的結(jié)果很多交集，那么這些關(guān)鍵詞很可能也是語義相關(guān)的詞。

從搜索日志來看例子：

key:搜索詞 time:搜索時間 cookie:用戶cookieid result:a,b,c,d,e（前5個搜索結(jié)果）

這次，我們只用key和result兩項(xiàng)，稍微處理下來以后就變成了

key:搜索詞A result:a,b,c,d,e（前5個搜索結(jié)果）

key:搜索詞B result:a,f,c,g,m（前5個搜索結(jié)果）

如果我們把每一行數(shù)據(jù)的result想象成一篇文檔，result里面的每個結(jié)果集想象成一個詞語，那么這其實(shí)就是求兩個文檔之間的相似性了，從頭到尾過一遍就可以找到每一行數(shù)據(jù)和它最相似的數(shù)據(jù)了，而每一行可以用當(dāng)行的搜索詞表示，這么一算下來數(shù)據(jù)就變成這樣子了，后面的括號里面是兩個詞的相似度，如果想知道文本的相似性如何計算，可以參考我之前的文章，本文最后有鏈接。

key：搜索詞Asucceed：搜索詞B（0.8）搜索詞C（0.6）……

key：搜索詞Bsucceed：搜索詞A（0.8）搜索詞E（0.7）……

有了上面這個數(shù)據(jù)，拍一個閾值（比如0.7）卡一下，就得到最后的相關(guān)搜索的結(jié)果了。

這個計算相似性的方法的計算量比較大，而且閾值沒有卡好的話容易出現(xiàn)不相關(guān)的結(jié)果，在實(shí)際工程應(yīng)用中使用得不多，下面這個方法使用得更多點(diǎn)，相當(dāng)于這個的加強(qiáng)版。

從用戶搜索結(jié)果集考慮

如果某個搜索結(jié)果（比如一個網(wǎng)頁或者一個商品）出現(xiàn)在了不同的搜索詞的結(jié)果集中，那么這些個搜索詞很可能是相關(guān)的，如果這個搜索結(jié)果在不同的搜索詞下都被點(diǎn)擊了，那么這些個詞的相關(guān)性就更高了。

點(diǎn)擊的加成是很強(qiáng)大的，而且在數(shù)據(jù)量巨大的情況下，我們可以只考慮點(diǎn)擊的情況，還是拉出搜索日志，不過這次是搜索點(diǎn)擊日志了，拉出來處理一下就變成下面這個樣子，每行就是某個搜索詞下點(diǎn)擊的商品

key：搜索詞Aclick:結(jié)果A結(jié)果B結(jié)果C

這個樣子和上面第二種方法最后出來的樣子基本一樣，不過這次是點(diǎn)擊數(shù)據(jù)，相關(guān)性可比直接的搜索結(jié)果要好很多了，因?yàn)樗阉鹘Y(jié)果取決于你的搜索算法，而這種點(diǎn)擊數(shù)據(jù)是來自用戶的，人的可靠性可高了不少，所以說這個是上一個的加強(qiáng)版。

我們可以按照上一個的方法按文本相似性的方法進(jìn)行處理，但是計算量也比較大，如果再仔細(xì)看看這個數(shù)據(jù)的樣子，如果我們把相關(guān)搜索系統(tǒng)想象成豆瓣，搜索詞看成豆瓣的用戶，搜索結(jié)果集看成是豆瓣的電影，那么相關(guān)搜索就變成了一個豆瓣的猜你感興趣的人，也變成了一個協(xié)同過濾的推薦系統(tǒng)了（協(xié)同過濾算法可以參考文章最后的鏈接），上一節(jié)的協(xié)同過濾算法的數(shù)據(jù)是詞和后繼詞，這里是詞和點(diǎn)擊結(jié)果，雖然數(shù)據(jù)集不同，但是可以用一樣的算法，所以，搜索和推薦技術(shù)其實(shí)是密不可分的，既然這樣，完全可以用協(xié)同過濾算法進(jìn)行推薦了。

協(xié)同過濾的算法，簡單版本整體不會超過200行，很容易實(shí)現(xiàn)的。

通過這樣的方式，容易推出意思相近的詞，同樣也容易推出看似完全不相關(guān)但仔細(xì)想想還是靠譜的詞，就像下面這樣，他們雖然不見得近義詞，但是很可能會點(diǎn)擊到同一個結(jié)果上。

分形：分形理論|分形圖像|分形數(shù)學(xué)

機(jī)器學(xué)習(xí)：吳恩達(dá)|數(shù)據(jù)挖掘|機(jī)器學(xué)習(xí)周志華

林心如：霍建華|任重|何潤東……

機(jī)器學(xué)習(xí)

既然上面提到了一下機(jī)器學(xué)習(xí)，其實(shí)還有更高端一點(diǎn)的算法，就是用機(jī)器學(xué)習(xí)了，呵呵。我們?nèi)绻焉厦娴慕Y(jié)果key：搜索詞Aclick:結(jié)果A結(jié)果B結(jié)果C處理一下，變成下面的樣子，表示每個結(jié)果集對應(yīng)的搜索詞。

結(jié)果A：搜索詞A搜索詞B搜索詞C…

結(jié)果B：搜索詞B搜索詞A搜索詞D……

變成上面這個樣子難度不大吧，就是做個倒排就行了，好了，我們把一行看成一篇文檔，每個搜索詞看成一個詞，不就是求各個詞的相似性嘛，祭出神器Word2Vec，直接計算每個搜索詞的詞向量，然后計算各個詞向量之間的相似性，就可以算出每個詞應(yīng)該推薦的詞了。

在這里，我們使用了當(dāng)前最火的機(jī)器學(xué)習(xí)哦，如果用word2vec的庫來實(shí)現(xiàn)的話，代碼同樣不超過20行，呵呵，word2vec我之前的文章也有說過，可以看看底部的鏈接

模型MIX

上面說了四種模型，如果使用呢？呵呵，相關(guān)搜索不是有很多詞嘛，很簡單拉，每個模型分幾個詞，看看哪個模型效果好，哪個模型出來的詞用戶點(diǎn)得多再調(diào)整唄，我們看看京東，搜索資治通鑒的時候他們的相關(guān)搜索如下。

我估計啊資治通鑒中華書局，資治通鑒柏楊這種就是第一種模型推出來的，就是后繼詞部分推薦出來的，而史記，二十四史這類應(yīng)該就是通過協(xié)同過濾推薦出來的，至于是哪種協(xié)同過濾就不好推測了。

上一篇：巧借內(nèi)容營銷進(jìn)行網(wǎng)站SEO并持續(xù)引流量 下一篇：淺談網(wǎng)站中的布局與建網(wǎng)站的注意事項(xiàng)

猜你喜歡

評論(0人參與，0條評論)

發(fā)布評論

最新評論

copyright 2016(c)yuntask.com版權(quán)所有杭州志卓科技股份有限公司浙ICP備09021221號