尤物视频在线观看|国产尤物视频在线观看|99热在线获取最新地址,久久频这里精品99香蕉久,国产色婷婷精品综合在线,亚洲欧美日韩高清在线看

人工智能在搜索算法中的應(yīng)用

作者:草根香蕉皮 瀏覽:71 發(fā)布時(shí)間:2017-11-03
分享 評(píng)論 0

2016 年以來,IT行業(yè)最大的技術(shù)突破應(yīng)該是人工智能了,不僅在一年左右時(shí)間,在最后一個(gè)人類曾經(jīng)自以為機(jī)器很難戰(zhàn)勝人類的游戲項(xiàng)目上完勝人類,前幾天更是出現(xiàn)了逆天的AlphaGo Zero,完全不用借鑒人類知識(shí),自學(xué) 3 天就超越了人類。

  人工智能領(lǐng)域最牛X的公司,國外是Google,國內(nèi)是百度。都是搜索引擎。這恐怕也不是什么巧合,而是因?yàn)樗阉饕媸亲钸m合開發(fā)人工智能的公司,他們擁有最大量的數(shù)據(jù),包括文字、圖片、視頻,還有地圖、路況、用戶使用數(shù)據(jù)等等。

  搜索引擎公司的AI成果在多大程度上運(yùn)用到了他們的核心業(yè)務(wù)-搜索中?他們都沒有明確地對(duì)外說明,從搜索工程師的零碎發(fā)言中猜測(cè),至少目前還沒有大規(guī)模使用,并沒有改變搜索算法的基礎(chǔ)。畢竟人工智能雖然概念存在了幾十年,但效果突飛猛進(jìn)只是近幾年的事,還沒有出現(xiàn)通用人工智能,在圍棋這種規(guī)則簡(jiǎn)單明確的領(lǐng)域中牛X,遷移到規(guī)則模糊的系統(tǒng)中,比如搜索,還需要一些時(shí)間。

  但我想,人工智能大規(guī)模應(yīng)用于搜索算法是早晚的事。據(jù)說以前百度大搜索部門和人工智能/深度學(xué)習(xí)部門之間是有些矛盾的,現(xiàn)在吳恩達(dá)離開了百度,陸奇對(duì)百度又進(jìn)行了很多人事調(diào)整,搜索部門對(duì)人工智能的排斥也許就大大降低了。

2015 年上線的Google RankBrain解決的也是對(duì)查詢?cè)~的深入理解問題,尤其是比較長(zhǎng)尾的詞,找到與用戶查詢?cè)~不完全匹配、但其實(shí)很好回答了用戶查詢的那些頁面。和百度DNN是非常類似的。Google沒有具體說明RankBrain的訓(xùn)練方法,估計(jì)和百度DNN也是類似的。

  2015 年RankBrain上線時(shí),15%的查詢?cè)~經(jīng)過RankBrain處理, 2016 年所有查詢?cè)~都要結(jié)果RankBrain處理。

  Google自己經(jīng)常舉的RankBrain例子是這個(gè)查詢:

  What’s the title of the consumer at the highest level of a food chain

  這個(gè)查詢?cè)~相當(dāng)長(zhǎng)尾,完全匹配的結(jié)果比較少,而且查詢中的幾個(gè)詞容易有歧義,比如consumer通常是消費(fèi)者的意思,food chain也可以理解為餐飲連鎖,但這個(gè)完整的查詢和商場(chǎng)、消費(fèi)者、飯館之類的意思沒有任何關(guān)系,RankBrain能理解其實(shí)用戶問的是食物鏈頂端的物種是什么名字。同樣,搜索結(jié)果不能按照傳統(tǒng)的關(guān)鍵詞匹配來處理。

  這種長(zhǎng)尾查詢數(shù)量很大,每天Google收到的查詢里有15%是以前都沒出現(xiàn)過的。這種查詢要靠關(guān)鍵詞匹配就比較難以找到高質(zhì)量頁面,數(shù)量太少,甚至沒有,但理解了查詢的語義和意圖,就能找到滿足用戶需求的、關(guān)鍵詞并不完全匹配的頁面。

  對(duì)SEO的影響以后再詳細(xì)寫,這里只是先簡(jiǎn)單提示一下:頁面要包含關(guān)鍵詞,這在目前的關(guān)鍵詞優(yōu)化過程中是必然的,現(xiàn)在搜索引擎能理解兩句不同的話意思是一樣的了,以后創(chuàng)作或編輯頁面內(nèi)容時(shí),是不是還一定要包含關(guān)鍵詞呢?