如今的搜索引擎不僅需要提供用戶想要的信息,還要猜到用戶想要什么。
瘋狂原始人、鋼鐵俠、中國合伙人、致青春……互聯(lián)網時代,想找一部電影看看,隨便一個搜索引擎通常都能幫到你。但,當你不知道自己想要什么,或是沒法準確描述出來“要什么”時,該找誰幫忙呢?
一種電影系統(tǒng)推薦算法或許可以。日前,百度舉辦了首屆“電影推薦系統(tǒng)算法創(chuàng)新大賽”,來自清華、北大等全國100多所高校1000多名參賽同學利用百度給出的數據集,用不同算法實現(xiàn)了線上“私人電影院”的構想。
以主動發(fā)現(xiàn)用戶需求為特征的推薦引擎伸向了視頻領域,這意味著,當你還未主動發(fā)出觀看電影或視頻的信號時,你喜歡的內容就已經呈現(xiàn)在你面前。
要把這個過程變?yōu)楝F(xiàn)實并不輕松。“它是通過大量計算和分析得來的結果。”指導參賽選手進行視頻推薦引擎開發(fā)的百度垂直搜索部資深研發(fā)工程師胡一川說,“要根據用戶的行為去分析、了解用戶的興趣,然后把他感興趣的東西給他。這樣的話,每個人來這個網站,看到的東西都是不同的。”
百度目前的產品“今晚看啥”采用的是混合推薦的算法。用戶的觀看歷史記錄、評分記錄、觀看時長和時間地點以及社交關系等數據都被搜集起來,意在建立一套完整的個性化推薦算法,真正為用戶實現(xiàn)個性化定制。
電影推薦系統(tǒng)的實現(xiàn),可以聯(lián)系用戶和信息,一方面幫助用戶發(fā)現(xiàn)對自己有價值的信息,另一方面讓信息能夠展現(xiàn)在對他感興趣的人群中,從而實現(xiàn)信息提供商與用戶的雙贏。
胡一川說,以前是一搜即得,但以后用戶不用搜索,甚至不用登陸百度賬號,百度視頻的首頁就會給你提供完全的個性化視頻推薦,匿名推薦。
談到比賽本身的意義,百度個性化推薦部門的相關負責人認為,比賽很好地體現(xiàn)了學術比賽與工程產品在思路上的差異和共同點。
一些簡單通用、在不同規(guī)模數據集上都表現(xiàn)較好的模型是學術和工業(yè)界都非常關注的;而另外一些學術界和學術比賽中關注較多的數據集,在實際工程中卻使用較少,這一部分是值得研發(fā)人員去調研嘗試的,對為用戶推薦更好的產品有很大的意義。比賽也發(fā)現(xiàn)和鍛煉了一批潛力較好的同學,無論是對企業(yè)還是對行業(yè)發(fā)展都是很有價值的。