尤物视频在线观看|国产尤物视频在线观看|99热在线获取最新地址,久久频这里精品99香蕉久,国产色婷婷精品综合在线,亚洲欧美日韩高清在线看

刷百度相關(guān)搜索和下拉框的技術(shù)原理

作者:匆匆那年 瀏覽:123 發(fā)布時間:2017-11-03
分享 評論 0

    第一:百度搜索SEO出現(xiàn)的相關(guān)搜索:


    以SEO為核心的相關(guān)詞-什么是SEO,如何進(jìn)行SEO


    以SEO語義相關(guān)的相關(guān)詞-網(wǎng)絡(luò)推廣


    第二:搜狗搜索SEO出現(xiàn)的相關(guān)搜索:


    以SEO為核心的相關(guān)詞- seo是什么 seo教程seo查詢


    以SEO語義相關(guān)的相關(guān)詞-搜索引擎優(yōu)化


    第三:360搜索知乎出現(xiàn)的相關(guān)搜索


    以知乎為核心的知乎網(wǎng),知乎日報


    以知乎同類性質(zhì),語義相關(guān)的果殼網(wǎng),天涯論壇


    還有一就是產(chǎn)品,品牌,公司相關(guān),比如搜飲料出現(xiàn)康師傅


    相關(guān)搜索含義:用戶在搜索框搜索關(guān)鍵詞的時候,在搜索結(jié)果頁的最下方呈現(xiàn)出與搜索詞精準(zhǔn)匹配,詞組匹配,廣泛匹配,相同拼音的相關(guān)詞。遵循拼音,詞組,意義相關(guān)性算法。


    相關(guān)搜索目的:增加用戶搜索體驗(yàn)感,最大限度的解決用戶的搜索需求。當(dāng)用戶查詢詞不當(dāng),查詢結(jié)果不佳,不知道還有什么更精彩豐富內(nèi)容,那么相關(guān)搜索就可以解決這些用戶痛點(diǎn),為用戶啟發(fā)性質(zhì)作用,幫助用戶發(fā)現(xiàn)和他更多他意圖相關(guān)的詞。


    下拉框是一種搜索提示,是用戶搜索關(guān)鍵詞沒有點(diǎn)擊搜索的時候出現(xiàn)的提示,根據(jù)關(guān)鍵詞前綴匹配


    相關(guān)搜索是一種推薦引擎,是用戶搜索關(guān)鍵詞點(diǎn)擊搜索之后的推薦,根據(jù)關(guān)鍵詞語義,拼音,詞組匹配


    第一:為了最正確的搜索結(jié)果。


    第二:是為了擴(kuò)展搜索,找到更多的東西。


    刷搜索引擎相關(guān)搜索的目的:


    第一:就是讓我們網(wǎng)站已經(jīng)有了排名的品牌詞,網(wǎng)站名稱,網(wǎng)站關(guān)鍵詞出現(xiàn)在更多關(guān)鍵詞的相關(guān)搜索中,讓更多的用戶點(diǎn)擊相關(guān)搜索達(dá)到網(wǎng)站,提高網(wǎng)站權(quán)重,網(wǎng)站流量。


    第二:當(dāng)搜某個核心關(guān)鍵詞,在相關(guān)搜索中出現(xiàn)你的產(chǎn)品,品牌,名稱的推薦,那么會給用戶帶來視覺沖擊,信任建立,知名度,競爭力。


    第三:起到引導(dǎo)作用,比如搜索飲料相關(guān)搜索出現(xiàn)康師傅,那么用戶很可能會點(diǎn)擊康師傅。


    刷百度相關(guān)搜索原理:


    第一:搜索詞熱搜指數(shù),熱搜度,當(dāng)一個詞的熱度達(dá)到一定搜索流量的時候,只要搜索該詞的拼音,相關(guān)詞就會出現(xiàn)該關(guān)鍵詞。


    第二:與搜索詞相關(guān)度,相關(guān)搜索詞語義,拼音,詞組肯定和搜索詞匹配。


    第三:搜索引擎網(wǎng)站流量,就算沒有人搜索這個次,但是改詞在百度的權(quán)重非常高,同樣能夠出現(xiàn)在相關(guān)搜索詞中。


    第四:下拉框和相關(guān)搜索的影響度很高。


    第五:實(shí)時熱點(diǎn),例子,搜索知乎的時候,出現(xiàn)了林志穎,這個語義并不關(guān)聯(lián),但是林志穎的人氣很高,導(dǎo)致搜索了知乎的人可能跟著搜索過林志穎,這是用戶行為決定的搜索相關(guān)詞也是其中一個算法原理。


    刷相關(guān)搜索的實(shí)現(xiàn)方法:


    第一:比如SEO,我們可以先搜索SEO,然后接著再去搜索SEO教程,那么每天以幾倍的方式增加,當(dāng)達(dá)到一定搜索量的時候,那么SEO的相關(guān)詞搜索就會出現(xiàn)SEO教程了。


    打開百度首頁//www.baidu.com/輸入黑卡紙出來的地址為:


    //www.baidu.com/s?wd=%BA%DA%BF%A8%D6%BD&rsv_bp=0&inputT=32343


    這串代碼中:%BA%DA%BF%A8%D6%BD是代表黑卡紙的代碼


    inputT=32343這個是代表搜索結(jié)果出來的運(yùn)算時間(每臺電腦這個數(shù)據(jù)都不一樣的)


    再出來的頁面中輸入你要的品牌,比如荔禾黑卡,輸入完畢后,點(diǎn)百度一下。


    出來的地址為://www.baidu.com/s?bs=%BA%DA%BF%A8%D6%BD&f=8&rsv_bp=1&wd=%BA%DA%BF%A8%D6%BD%C0%F3%BA%CC%BA%DA%BF%A8&inputT=54390


    這串代碼中:


    %BA%DA%BF%A8%D6%BD


    這里不變,因?yàn)檫@個是之前我們搜索的黑卡紙,百度就在這里開始記錄下黑卡紙和現(xiàn)在的黑卡紙荔禾黑卡這兩個詞是相關(guān)的。


    f=8這個數(shù)值是會變動的。范圍為:


    0-9.數(shù)值越高,代表著這個相關(guān)搜索的詞越容易做上去。


    %BA%DA%BF%A8%D6%BD%C0%F3%BA%CC%BA%DA%BF%A8是代表黑卡紙荔禾黑卡的代碼


    inputT=54390是代表這個是代表搜索結(jié)果出來的運(yùn)算時間


    第二:雇傭水軍,或者買肉雞真實(shí)去人為制造相關(guān)搜索量。


    第三:去購買網(wǎng)站的彈窗廣告,用戶沒點(diǎn)一次就是搜索一次。


    第四:誘導(dǎo),通過在論壇或其他流量大的頁面,放上相關(guān)詞和搜索詞的訪問地址后誘導(dǎo)用戶不斷點(diǎn)擊。


    第五:購買軟件來刷搜索引擎相關(guān)搜索。


    注意:


    第一:相關(guān)搜索詞必須有一定的搜索量


    第二:相關(guān)搜索詞確實(shí)和搜索關(guān)鍵詞是相關(guān)性質(zhì)的詞


    怎么刪除百度相關(guān)搜索:


    第一:百度網(wǎng)頁投訴中心投訴


    第二:把正面的信息刷上去壓制負(fù)面相關(guān)搜索,并把正面信息做好相應(yīng)的著陸文章頁面。


    相關(guān)搜索算法思想:


    相關(guān)搜索系統(tǒng)的輸入為用戶的搜索詞,而輸出是一堆與這個詞相關(guān)的其他詞。


    搜索詞的出現(xiàn)得益于搜索引擎的詞典,可以計算出語義相關(guān)的詞,但是這樣的詞典中語義相關(guān)的詞還是不足與滿足用戶,所以在次基礎(chǔ)上加入用戶行為(搜索記錄,點(diǎn)擊記錄)來拓展更多相關(guān)詞庫。


    通過用戶數(shù)據(jù)引發(fā)的思考:


    第一:后繼詞,當(dāng)用戶搜索一個詞比如SEO,,發(fā)現(xiàn)在搜索結(jié)果列表中沒有你需要的內(nèi)容,那么就繼續(xù)用戶其他的詞來尋找,比如搜索SEO教程,那么SEO教程就成了SEO的后繼詞了,所以這種屬于用戶幫搜索引擎找語義相關(guān)詞。


    第二:如果一個關(guān)鍵詞搜索詞結(jié)果,跟另外一個,甚至幾個關(guān)鍵詞搜索出來的結(jié)果很多交集,那么這些關(guān)鍵詞很可能也是語義相關(guān)的詞,如果這些搜索結(jié)果的交集被點(diǎn)擊并滿足了,那就確定相關(guān)了。


    比如:搜索關(guān)鍵詞A,B,同樣找到了結(jié)果中的HTML1頁面都滿足了這個搜索詞的需求,那么A,B是有一定相關(guān)性的。


    相關(guān)搜索算法實(shí)現(xiàn)原理:


    用戶后繼詞原理:


    把用戶在5分鐘之內(nèi)在搜索引擎中搜索詞定義為一次搜索行為,那么就形成了搜索日志,搜索日志如下:


    cookie:用戶cookieid keys:[A1,A2……] [B1,B2……] [C1,C2……]


    接著按用戶進(jìn)行分類,時間間隔5分鐘進(jìn)行數(shù)據(jù)清理,[x1,x2……]一個數(shù)組表示一次搜索行為,每個數(shù)組的第一位就是當(dāng)次搜索行為的第一個搜索詞。


    cookie:用戶cookieid keys:[A1,A2……] [B1,B2……] [C1,C2……]


    對于單個用戶來說搜索后繼詞的確定性是不夠的,比如搜索科比,但是一看到旁邊有人我就立刻改變搜索培訓(xùn),那么這兩個詞是沒有相關(guān)性質(zhì)的。那么就加入統(tǒng)計規(guī)則去掉一些雜質(zhì),比如某個詞B只有出現(xiàn)在5個用戶的相同的搜索詞A的后繼詞中才算一個A的后繼詞,還有其他的一些規(guī)則,這么下來,日志就變成了。


    key:A succeed:A1,A2,A3……


    用戶協(xié)同過濾原理:


    當(dāng)搜索用戶日志足夠多的情況,可以把擁有相同搜索記錄的用戶聚合起來,通過協(xié)同過濾算法,獲取更多的相關(guān)性的詞。通過下面協(xié)同過濾算法同樣可以把加索爾推薦給NBA了。


    A用戶:籃球 后繼詞 男籃 女籃


    B用戶:NBA 后繼詞 男籃 科比


    C用戶:男籃比賽 后繼詞 男籃 加索爾


    從搜索詞算法實(shí)現(xiàn):


    如果一個關(guān)鍵詞搜索詞結(jié)果,跟另外一個,甚至幾個關(guān)鍵詞搜索出來的結(jié)果很多交集,那么這些關(guān)鍵詞很可能也是語義相關(guān)的詞。


    從搜索日志來看例子:


    key:搜索詞 time:搜索時間 cookie:用戶cookieid result:a,b,c,d,e(前5個搜索結(jié)果)


    這次,我們只用key和result兩項(xiàng),稍微處理下來以后就變成了


    key:搜索詞A result:a,b,c,d,e(前5個搜索結(jié)果)


    key:搜索詞B result:a,f,c,g,m(前5個搜索結(jié)果)


    如果我們把每一行數(shù)據(jù)的result想象成一篇文檔,result里面的每個結(jié)果集想象成一個詞語,那么這其實(shí)就是求兩個文檔之間的相似性了,從頭到尾過一遍就可以找到每一行數(shù)據(jù)和它最相似的數(shù)據(jù)了,而每一行可以用當(dāng)行的搜索詞表示,這么一算下來數(shù)據(jù)就變成這樣子了,后面的括號里面是兩個詞的相似度,如果想知道文本的相似性如何計算,可以參考我之前的文章,本文最后有鏈接。


    key:搜索詞Asucceed:搜索詞B(0.8)搜索詞C(0.6)……


    key:搜索詞Bsucceed:搜索詞A(0.8)搜索詞E(0.7)……


    有了上面這個數(shù)據(jù),拍一個閾值(比如0.7)卡一下,就得到最后的相關(guān)搜索的結(jié)果了。


    這個計算相似性的方法的計算量比較大,而且閾值沒有卡好的話容易出現(xiàn)不相關(guān)的結(jié)果,在實(shí)際工程應(yīng)用中使用得不多,下面這個方法使用得更多點(diǎn),相當(dāng)于這個的加強(qiáng)版。


    從用戶搜索結(jié)果集考慮


    如果某個搜索結(jié)果(比如一個網(wǎng)頁或者一個商品)出現(xiàn)在了不同的搜索詞的結(jié)果集中,那么這些個搜索詞很可能是相關(guān)的,如果這個搜索結(jié)果在不同的搜索詞下都被點(diǎn)擊了,那么這些個詞的相關(guān)性就更高了。


    點(diǎn)擊的加成是很強(qiáng)大的,而且在數(shù)據(jù)量巨大的情況下,我們可以只考慮點(diǎn)擊的情況,還是拉出搜索日志,不過這次是搜索點(diǎn)擊日志了,拉出來處理一下就變成下面這個樣子,每行就是某個搜索詞下點(diǎn)擊的商品


    key:搜索詞Aclick:結(jié)果A結(jié)果B結(jié)果C


    這個樣子和上面第二種方法最后出來的樣子基本一樣,不過這次是點(diǎn)擊數(shù)據(jù),相關(guān)性可比直接的搜索結(jié)果要好很多了,因?yàn)樗阉鹘Y(jié)果取決于你的搜索算法,而這種點(diǎn)擊數(shù)據(jù)是來自用戶的,人的可靠性可高了不少,所以說這個是上一個的加強(qiáng)版。


    我們可以按照上一個的方法按文本相似性的方法進(jìn)行處理,但是計算量也比較大,如果再仔細(xì)看看這個數(shù)據(jù)的樣子,如果我們把相關(guān)搜索系統(tǒng)想象成豆瓣,搜索詞看成豆瓣的用戶,搜索結(jié)果集看成是豆瓣的電影,那么相關(guān)搜索就變成了一個豆瓣的猜你感興趣的人,也變成了一個協(xié)同過濾的推薦系統(tǒng)了(協(xié)同過濾算法可以參考文章最后的鏈接),上一節(jié)的協(xié)同過濾算法的數(shù)據(jù)是詞和后繼詞,這里是詞和點(diǎn)擊結(jié)果,雖然數(shù)據(jù)集不同,但是可以用一樣的算法,所以,搜索和推薦技術(shù)其實(shí)是密不可分的,既然這樣,完全可以用協(xié)同過濾算法進(jìn)行推薦了。


    協(xié)同過濾的算法,簡單版本整體不會超過200行,很容易實(shí)現(xiàn)的。


    通過這樣的方式,容易推出意思相近的詞,同樣也容易推出看似完全不相關(guān)但仔細(xì)想想還是靠譜的詞,就像下面這樣,他們雖然不見得近義詞,但是很可能會點(diǎn)擊到同一個結(jié)果上。


    分形:分形理論|分形圖像|分形數(shù)學(xué)


    機(jī)器學(xué)習(xí):吳恩達(dá)|數(shù)據(jù)挖掘|機(jī)器學(xué)習(xí)周志華


    林心如:霍建華|任重|何潤東……


    機(jī)器學(xué)習(xí)


    既然上面提到了一下機(jī)器學(xué)習(xí),其實(shí)還有更高端一點(diǎn)的算法,就是用機(jī)器學(xué)習(xí)了,呵呵。我們?nèi)绻焉厦娴慕Y(jié)果key:搜索詞Aclick:結(jié)果A結(jié)果B結(jié)果C處理一下,變成下面的樣子,表示每個結(jié)果集對應(yīng)的搜索詞。


    結(jié)果A:搜索詞A搜索詞B搜索詞C…


    結(jié)果B:搜索詞B搜索詞A搜索詞D……


    變成上面這個樣子難度不大吧,就是做個倒排就行了,好了,我們把一行看成一篇文檔,每個搜索詞看成一個詞,不就是求各個詞的相似性嘛,祭出神器Word2Vec,直接計算每個搜索詞的詞向量,然后計算各個詞向量之間的相似性,就可以算出每個詞應(yīng)該推薦的詞了。


    在這里,我們使用了當(dāng)前最火的機(jī)器學(xué)習(xí)哦,如果用word2vec的庫來實(shí)現(xiàn)的話,代碼同樣不超過20行,呵呵,word2vec我之前的文章也有說過,可以看看底部的鏈接


    模型MIX


    上面說了四種模型,如果使用呢?呵呵,相關(guān)搜索不是有很多詞嘛,很簡單拉,每個模型分幾個詞,看看哪個模型效果好,哪個模型出來的詞用戶點(diǎn)得多再調(diào)整唄,我們看看京東,搜索資治通鑒的時候他們的相關(guān)搜索如下。


    我估計啊資治通鑒中華書局,資治通鑒柏楊這種就是第一種模型推出來的,就是后繼詞部分推薦出來的,而史記,二十四史這類應(yīng)該就是通過協(xié)同過濾推薦出來的,至于是哪種協(xié)同過濾就不好推測了。