一、頭條推薦系統(tǒng)的本質
說白了,這個系統(tǒng)就是把最合適的內容送到最感興趣的人眼前。
系統(tǒng)一邊給作品貼上各種標簽,一邊給用戶畫像,完成之后,系統(tǒng)就開始“牽線搭橋”了,然后把用戶可能喜歡的內容精準地推過去,這就是推薦系統(tǒng)。
給用戶推送內容,系統(tǒng)主要看三個關鍵點:內容本身、用戶的特點,還有用戶對內容到底有多感興趣。
對于內容,系統(tǒng)會用關鍵詞提取和AI技術去識別,給內容貼上各種標簽,然后分門別類地放到不同的領域里,像教育、體育、職場這些。比如,一篇關于籃球的文章,系統(tǒng)就會把它歸到體育類。
對于用戶畫像,系統(tǒng)會收集用戶的性別、年齡、地域、職業(yè)等基礎信息,而且還會通過用戶以前瀏覽過的內容,就是用戶歷史行為,分析用戶喜歡看什么,不喜歡看什么,去更深的了解用戶的喜好與需求。
比如,如果一篇內容推給用戶,用戶連點都不點,那系統(tǒng)就會想:這用戶可能不感興趣。如果用戶點了進去了,但又很快就退出,也不點贊、評論,甚至點了個“不喜歡”,那系統(tǒng)就會覺得,雖然內容可能戳中了用戶的某個興趣點,但內容質量不行,用戶不滿意。反過來,如果用戶不僅點擊閱讀,還點贊、評論、收藏,甚至關注了作者,那系統(tǒng)就會覺得:這用戶對內容很滿意,而且內容質量也挺高!
最后,系統(tǒng)會綜合上面各種因素,把最合適的內容最好的內容,推送給真正感興趣的用戶手機屏幕前。這就是推薦系統(tǒng)的工作原理!
二、內容的審核、冷啟動、推薦、復核流程
創(chuàng)作者內容剛發(fā)出去,先得過初審這一關,如果能通過審核,開始推薦;如果不通過,要么被限制推薦限流。
初審主要是看內容是否符合平臺規(guī)則、有沒有違反國家的法律法規(guī),這個過程是機器和人工一起配合完成的。
一般來說,初審速度挺快的,基本1分鐘內就能搞定。但要是遇到過年過節(jié),或者有大型賽事、活動的時候,初審時間就會稍微長一點。
初審通過后,就進入冷啟動環(huán)節(jié)了。因為平臺和系統(tǒng)也不知道新發(fā)的內容質量怎樣,用戶喜歡不喜歡,所以會先推送給一小波人進行試水,大概展示幾百幾千次,通過用戶的反饋,系統(tǒng)就能大概知道哪些人喜歡這個作品,哪些人不喜歡。
經過冷啟動階段,系統(tǒng)已經收集到了一些基礎數(shù)據(jù)。如果一篇內容的數(shù)據(jù)表現(xiàn)很好,系統(tǒng)就會覺得內容質量不錯,有潛力,會加大推薦力度;如果數(shù)據(jù)不行,推薦就會減少。
正常推薦過程中,系統(tǒng)會監(jiān)測作品的各種數(shù)據(jù),比如用戶的點贊收藏評論等,如果負面反饋數(shù)據(jù)很高,作品就會再次進行復審,減少或停止推薦。
如果內容比較優(yōu)質,會繼續(xù)加大推薦力度,進入下一個更大的流量池,推送給更多的人看,如果用戶反饋還是很好,則繼續(xù)推送更多的人,一直這樣循環(huán)往復的進行。
這一切的流量,最終目的就是保證最好內容推給最需要的用戶。