近日,網(wǎng)信辦等四部委決定開展【關(guān)于開展“清朗·網(wǎng)絡(luò)平臺(tái)算法典型問題治理”專項(xiàng)行動(dòng)的通知】。今天,公號(hào)君試圖對(duì)通知中提到的排名算法做進(jìn)一步的整理和介紹。
在通知中,對(duì)熱搜榜單提出的要求是:
提升榜單透明度打擊操縱榜單行為。全面公示熱搜榜單算法原理,提升榜單透明度和可解釋性。完善榜單日志留存,提高榜單算法原理可驗(yàn)證性。健全水軍刷榜、水軍賬號(hào)等違規(guī)行為、賬號(hào)檢測(cè)識(shí)別技術(shù)手段,嚴(yán)管不法分子惡意利用榜單排序規(guī)則操縱榜單、炒作熱點(diǎn)行為。
算法治理專項(xiàng)指引對(duì)熱搜榜單提出:
細(xì)分起來,熱搜和榜單是兩類形式,但其本質(zhì)都是向個(gè)體用戶展示當(dāng)前正在受其他用戶高度關(guān)注的話題、人物、事件等的列表。高度關(guān)注可進(jìn)一步分解為:搜索熱度、討論熱度、傳播熱度、高互動(dòng)率等。
因此,熱搜榜單本質(zhì)上是個(gè)排名算法。
排名算法與推薦算法的區(qū)別
排名是指對(duì)項(xiàng)目進(jìn)行選擇、篩選、評(píng)分和排序,然后以列表的形式呈現(xiàn)給用戶。排序可以基于不同的因素,包括重復(fù)性、流行度或與用戶的相關(guān)性。排序可以根據(jù)用戶的特定請(qǐng)求進(jìn)行,例如用戶在搜索欄中搜索特定項(xiàng)目時(shí),或在沒有搜索欄的情況下搜索特定項(xiàng)目時(shí)。
而推薦系統(tǒng)【詳見之前發(fā)表的本系列文章】則是向人們推薦他們沒有明確要求的內(nèi)容的系統(tǒng)。推薦系統(tǒng)根據(jù)用戶的明確評(píng)分或參與度來了解用戶的喜好,并將其與項(xiàng)目本身的元數(shù)據(jù)相結(jié)合,從而在未來推薦類似的項(xiàng)目。這些系統(tǒng)還可以學(xué)習(xí)用戶的偏好模式,并對(duì)內(nèi)容的多樣性或偶然性進(jìn)行優(yōu)化,從而使用戶不會(huì)重復(fù)看到相同類型的內(nèi)容。
排名算法的主要考量因素
排名算法在內(nèi)容分發(fā)和推薦系統(tǒng)中扮演著至關(guān)重要的角色,它通過多種因素綜合決定哪些內(nèi)容應(yīng)該被展示給用戶。理解這些因素及其相互作用有助于更好地認(rèn)識(shí)平臺(tái)如何對(duì)信息進(jìn)行篩選、排序和推薦。以下將詳細(xì)論述影響排名算法的幾個(gè)主要因素。
首先,熱度是排名算法中最核心的因素之一,尤其在社交平臺(tái)和搜索引擎中占據(jù)重要地位。熱度可以從多個(gè)維度進(jìn)行拆解,包括搜索熱度、討論熱度、傳播熱度以及互動(dòng)率。熱度的提升通常意味著內(nèi)容正在受到廣泛關(guān)注和討論,因此排名算法自然會(huì)將其視為優(yōu)先展示的內(nèi)容。
搜索熱度是指某個(gè)關(guān)鍵詞或話題在一定時(shí)間內(nèi)的搜索頻次。在搜索引擎中,搜索熱度直接決定了搜索結(jié)果的展示順序。對(duì)于社交平臺(tái)而言,用戶對(duì)某一話題的高頻搜索也常常與內(nèi)容的廣泛關(guān)注度密切相關(guān)。當(dāng)某個(gè)關(guān)鍵詞或主題的搜索熱度突然飆升時(shí),平臺(tái)會(huì)優(yōu)先將相關(guān)內(nèi)容展示給更多用戶,以回應(yīng)用戶的關(guān)注需求。
討論熱度則關(guān)注內(nèi)容在社交媒體或論壇等平臺(tái)上的互動(dòng)量,它通常通過用戶的評(píng)論、分享、點(diǎn)贊等行為來衡量。討論熱度反映了一個(gè)話題或事件在社交圈中的討論程度,也能反映出該內(nèi)容的社會(huì)話題性。平臺(tái)通常會(huì)將高討論熱度的內(nèi)容作為優(yōu)先展示對(duì)象,尤其是在涉及社會(huì)熱點(diǎn)事件時(shí),內(nèi)容的討論量可以直接影響其排名。
與此類似,傳播熱度衡量的是內(nèi)容的傳播速度和廣度。這一因素往往通過用戶的分享、轉(zhuǎn)發(fā)等行為來計(jì)算。當(dāng)內(nèi)容迅速在用戶之間傳播開來時(shí),平臺(tái)會(huì)認(rèn)為這類內(nèi)容具有較強(qiáng)的社會(huì)影響力,因此會(huì)給予較高的排名。在現(xiàn)代社交平臺(tái)中,內(nèi)容的傳播不僅僅依賴于內(nèi)容本身的吸引力,還受到了社交網(wǎng)絡(luò)結(jié)構(gòu)和用戶間傳播鏈的影響。
最后,互動(dòng)率指的是用戶與內(nèi)容的互動(dòng)頻率,包括點(diǎn)贊、評(píng)論、分享等行為。高互動(dòng)率意味著內(nèi)容能夠激發(fā)用戶的積極參與,通常也意味著該內(nèi)容具有較高的用戶吸引力和傳播潛力。因此,平臺(tái)算法會(huì)優(yōu)先展示互動(dòng)率高的內(nèi)容,這也是社交媒體平臺(tái)推廣內(nèi)容的重要依據(jù)。
除了熱度,內(nèi)容質(zhì)量也是排名算法中不可忽視的因素。盡管熱度在短期內(nèi)能引起廣泛關(guān)注,但內(nèi)容本身的質(zhì)量決定了用戶的長期興趣和平臺(tái)的內(nèi)容生態(tài)。內(nèi)容質(zhì)量的評(píng)價(jià)通?;诙鄠€(gè)方面,其中最重要的指標(biāo)包括原創(chuàng)性、專業(yè)性和用戶反饋。
原創(chuàng)性是內(nèi)容質(zhì)量的一個(gè)關(guān)鍵因素。原創(chuàng)內(nèi)容通常被視為更具價(jià)值和新鮮感,因?yàn)樗鼮橛脩籼峁┝诵碌挠^點(diǎn)或信息,而非簡單的重復(fù)或轉(zhuǎn)載。平臺(tái)往往優(yōu)先展示原創(chuàng)內(nèi)容,以提升平臺(tái)的信息多樣性和獨(dú)特性。另一方面,專業(yè)性在一些特定領(lǐng)域尤為重要。例如,科學(xué)、醫(yī)學(xué)或技術(shù)領(lǐng)域的內(nèi)容,其專業(yè)性直接影響其可靠性和權(quán)威性。平臺(tái)會(huì)根據(jù)內(nèi)容的準(zhǔn)確性、來源及相關(guān)領(lǐng)域?qū)<业膮⑴c度來評(píng)估其質(zhì)量,確保向用戶推薦的內(nèi)容具有較高的知識(shí)價(jià)值。
此外,用戶反饋也是衡量內(nèi)容質(zhì)量的重要標(biāo)準(zhǔn)。用戶的評(píng)論、評(píng)分和反饋不僅反映了他們對(duì)內(nèi)容的滿意度,還為平臺(tái)提供了內(nèi)容質(zhì)量的直接評(píng)估。在社交平臺(tái)中,積極的用戶反饋往往意味著該內(nèi)容能夠滿足用戶的興趣和需求,因此平臺(tái)會(huì)優(yōu)先展示這些內(nèi)容。
時(shí)間敏感性是另一個(gè)在排名中占據(jù)重要位置的因素,特別是在新聞、熱點(diǎn)話題和緊急事件中尤為突出。內(nèi)容的時(shí)效性決定了其在特定時(shí)段內(nèi)的相關(guān)性和重要性。對(duì)于新聞?lì)悆?nèi)容,尤其是突發(fā)新聞事件,平臺(tái)通常會(huì)根據(jù)內(nèi)容的發(fā)布時(shí)間來調(diào)整其排名,優(yōu)先展示最新的報(bào)道和信息。這是因?yàn)?,用戶在訪問平臺(tái)時(shí),往往期待獲取及時(shí)的信息和事件更新,因此平臺(tái)算法必須確保這些內(nèi)容能夠在最短的時(shí)間內(nèi)傳遞給用戶。
時(shí)效性的另一面是對(duì)某些事件的即時(shí)響應(yīng)。例如,當(dāng)社會(huì)或政治事件發(fā)生時(shí),相關(guān)話題的討論和報(bào)道通常會(huì)迅速增加。平臺(tái)會(huì)根據(jù)這一變化調(diào)整內(nèi)容的展示順序,確保用戶能夠及時(shí)看到與當(dāng)前熱點(diǎn)相關(guān)的內(nèi)容。這種時(shí)間敏感性不僅僅依賴于內(nèi)容的發(fā)布時(shí)刻,還受到平臺(tái)對(duì)事件動(dòng)態(tài)的實(shí)時(shí)監(jiān)測(cè)和評(píng)估。
用戶個(gè)性化偏好是排名算法的一個(gè)重要特征,尤其在社交媒體和推薦系統(tǒng)中尤為明顯。平臺(tái)會(huì)根據(jù)用戶的歷史行為,如搜索歷史、瀏覽記錄、點(diǎn)擊行為等來推測(cè)用戶的興趣,從而優(yōu)先展示符合其偏好的內(nèi)容。這種個(gè)性化排序能夠提高內(nèi)容的相關(guān)性和用戶的滿意度,因?yàn)橛脩舾赡芘c符合其興趣的內(nèi)容產(chǎn)生互動(dòng)。
通過分析用戶的瀏覽和搜索歷史,平臺(tái)能夠識(shí)別用戶的潛在需求和興趣。例如,若一個(gè)用戶頻繁搜索與電影相關(guān)的內(nèi)容,平臺(tái)就可能在該用戶的推薦流中優(yōu)先展示電影相關(guān)的新聞、評(píng)論或預(yù)告片。而點(diǎn)擊行為也是平臺(tái)了解用戶偏好的重要途徑。用戶的點(diǎn)擊歷史為平臺(tái)提供了關(guān)于用戶興趣的直接反饋,平臺(tái)可以通過這些行為預(yù)測(cè)用戶對(duì)未來內(nèi)容的興趣。
平臺(tái)還會(huì)結(jié)合交互行為(如點(diǎn)贊、評(píng)論和分享)來進(jìn)一步優(yōu)化內(nèi)容推薦。用戶與內(nèi)容的互動(dòng)頻率越高,平臺(tái)就越能準(zhǔn)確地了解其興趣,進(jìn)而調(diào)整未來推薦的內(nèi)容類型和優(yōu)先級(jí)。
在社交平臺(tái)中,社交影響力也是排名算法中一個(gè)不容忽視的因素。社交影響力通常體現(xiàn)在內(nèi)容創(chuàng)作者的影響力上,平臺(tái)會(huì)根據(jù)創(chuàng)作者的粉絲數(shù)量、互動(dòng)頻率以及其在特定領(lǐng)域的權(quán)威性來評(píng)估其內(nèi)容的優(yōu)先展示權(quán)。知名創(chuàng)作者或公共人物發(fā)布的內(nèi)容,通常會(huì)獲得更高的排名,因?yàn)檫@些內(nèi)容往往能夠吸引更多的用戶關(guān)注和互動(dòng)。
社交影響力的評(píng)估不僅限于內(nèi)容創(chuàng)作者本身,還可能與社交驗(yàn)證相關(guān)。例如,某些平臺(tái)通過用戶的社交驗(yàn)證(如推薦、轉(zhuǎn)發(fā)、標(biāo)記等)來評(píng)估內(nèi)容的社會(huì)認(rèn)可度。這些社交信號(hào)為平臺(tái)提供了關(guān)于內(nèi)容影響力的額外信息,平臺(tái)會(huì)基于這些信號(hào)優(yōu)化內(nèi)容排序,確保高影響力的內(nèi)容能夠獲得更多的曝光。
最后,內(nèi)容的相關(guān)性是所有排名算法的基礎(chǔ)。無論是搜索引擎還是社交平臺(tái),排名算法都會(huì)根據(jù)內(nèi)容與用戶需求的匹配程度來決定其優(yōu)先展示的順序。在搜索引擎中,內(nèi)容的相關(guān)性主要通過關(guān)鍵詞匹配來判斷,平臺(tái)會(huì)依據(jù)用戶查詢的關(guān)鍵詞與網(wǎng)頁內(nèi)容的匹配度來進(jìn)行排序。在社交媒體平臺(tái)中,內(nèi)容的相關(guān)性不僅僅依賴于關(guān)鍵詞,還與用戶的興趣、行為歷史以及當(dāng)前的社交趨勢(shì)息息相關(guān)。
平臺(tái)會(huì)根據(jù)用戶的興趣偏好來排序內(nèi)容,確保用戶看到的是與自己需求最匹配的內(nèi)容。而上下文關(guān)聯(lián)性則指的是平臺(tái)根據(jù)當(dāng)前流行趨勢(shì)或用戶關(guān)注的特定話題進(jìn)行內(nèi)容推薦。例如,當(dāng)某個(gè)話題成為熱點(diǎn)時(shí),平臺(tái)會(huì)優(yōu)先推送與該話題相關(guān)的內(nèi)容,以提升用戶的參與感和互動(dòng)性。
由上可見,排名算法是一個(gè)復(fù)雜的系統(tǒng),涵蓋了從內(nèi)容熱度、質(zhì)量、時(shí)效性到用戶偏好、社交影響力和相關(guān)性等多個(gè)因素。每個(gè)因素都在算法中扮演著獨(dú)特的角色,平臺(tái)會(huì)根據(jù)這些因素的綜合評(píng)估來決定內(nèi)容的排序和展示。隨著用戶行為和社會(huì)熱點(diǎn)的不斷變化,排名算法也在持續(xù)優(yōu)化和調(diào)整,以確保為用戶提供最相關(guān)、最有價(jià)值的內(nèi)容。這種動(dòng)態(tài)調(diào)整使得平臺(tái)能夠始終保持與用戶需求的高度契合,并促進(jìn)更高效的信息傳播和用戶互動(dòng)。
排名算法的主要考量因素
社交媒體平臺(tái)的排名算法是為了在海量內(nèi)容中迅速篩選出最相關(guān)、最有吸引力的信息,最終提升用戶的體驗(yàn)。為了實(shí)現(xiàn)這一目標(biāo),社交平臺(tái)使用了多種排名算法。不同的排名算法適用于不同類型的內(nèi)容和用戶需求,下面詳細(xì)討論幾種常用的社交媒體排名算法。
1. 時(shí)間排序(Time-based Ranking)
時(shí)間排序是一種非常直觀且常見的排名方式,特別適用于新聞、實(shí)時(shí)事件更新或其他具有時(shí)效性內(nèi)容的展示。其基本原理是優(yōu)先展示最新發(fā)布的內(nèi)容,確保用戶能夠獲得與當(dāng)前事件或話題最相關(guān)的信息。
這種排序方法的主要優(yōu)點(diǎn)在于其簡單性和對(duì)時(shí)效性內(nèi)容的優(yōu)化。當(dāng)某個(gè)新聞事件、社會(huì)熱點(diǎn)或突發(fā)情況發(fā)生時(shí),時(shí)間排序會(huì)根據(jù)發(fā)布時(shí)間將這些內(nèi)容迅速推送到用戶的時(shí)間線上,確保用戶獲取到實(shí)時(shí)的更新信息。典型應(yīng)用場(chǎng)景包括:
然而,時(shí)間排序也有其局限性。雖然它能確保最新內(nèi)容的優(yōu)先展示,但它并不總能保證這些內(nèi)容是最相關(guān)或最有價(jià)值的。因此,單純依靠時(shí)間排序有時(shí)會(huì)讓一些質(zhì)量不高但發(fā)布時(shí)間最新的內(nèi)容占據(jù)顯著位置,影響用戶的體驗(yàn)。
2. 社交信號(hào)排序(Social Signals)
社交信號(hào)排序基于用戶的互動(dòng)行為來調(diào)整內(nèi)容排名,是社交媒體平臺(tái)中最常見的排名方式之一。社交信號(hào)包括點(diǎn)贊、評(píng)論、分享等用戶互動(dòng)行為,這些行為可以反映出內(nèi)容的受歡迎程度、熱度和社會(huì)影響力。
社交信號(hào)排序的核心思想是:用戶的互動(dòng)越多,內(nèi)容就越可能被視為有價(jià)值的,應(yīng)該被推薦給更多用戶。因此,社交平臺(tái)通常會(huì)通過計(jì)算內(nèi)容的社交信號(hào)來評(píng)估其熱度,并根據(jù)這一熱度進(jìn)行排名。具體來說,社交信號(hào)排序包括以下幾個(gè)方面:
社交信號(hào)排序的優(yōu)點(diǎn)在于能夠通過用戶的行為反饋來反映出內(nèi)容的受歡迎程度和社會(huì)影響力,確保平臺(tái)上展示的內(nèi)容是那些被用戶積極參與和認(rèn)同的。它增強(qiáng)了平臺(tái)內(nèi)容的互動(dòng)性,提升了用戶的參與感和粘性。
然而,這種方法的缺點(diǎn)在于,社交信號(hào)也容易受到網(wǎng)絡(luò)效應(yīng)的影響。例如,某些內(nèi)容可能因?yàn)榫哂小安《臼絺鞑ァ钡奶匦裕ū热绺阈σ曨l、極端觀點(diǎn)等)而迅速獲得大量社交信號(hào),即便它們的實(shí)際質(zhì)量或相關(guān)性并不高。因此,平臺(tái)需要謹(jǐn)慎設(shè)計(jì)社交信號(hào)排序算法,避免“點(diǎn)擊誘餌”內(nèi)容或低質(zhì)量信息占據(jù)主導(dǎo)地位。
3. 內(nèi)容相關(guān)性排序(Content Relevance Ranking)
內(nèi)容相關(guān)性排序是一種根據(jù)用戶的興趣和需求對(duì)內(nèi)容進(jìn)行定制化排序的算法。平臺(tái)通過分析用戶的歷史行為(如瀏覽記錄、搜索記錄、點(diǎn)擊行為、點(diǎn)贊、評(píng)論等)來預(yù)測(cè)他們可能感興趣的內(nèi)容,并在信息流中優(yōu)先展示這些內(nèi)容。
內(nèi)容相關(guān)性排序的關(guān)鍵在于個(gè)性化。社交媒體平臺(tái)會(huì)基于用戶的過往行為建立其興趣模型,并利用這些數(shù)據(jù)來推測(cè)用戶的當(dāng)前興趣。這包括以下幾個(gè)方面:
內(nèi)容相關(guān)性排序的最大優(yōu)勢(shì)是能夠?yàn)槊總€(gè)用戶提供個(gè)性化的體驗(yàn)。通過深入分析用戶的行為和興趣,平臺(tái)能夠不斷調(diào)整和優(yōu)化推薦內(nèi)容,從而提升用戶的參與度和滿意度。
然而,內(nèi)容相關(guān)性排序也有其局限性。過度依賴用戶的歷史行為可能導(dǎo)致信息繭房的現(xiàn)象,即用戶只會(huì)看到與其興趣高度匹配的內(nèi)容,忽視了其他潛在的有價(jià)值信息。這種個(gè)性化推薦可能限制了用戶接觸多元化內(nèi)容的機(jī)會(huì)。
4. 混合排序算法(Hybrid Ranking Algorithm)
混合排序算法是當(dāng)前許多大型社交媒體平臺(tái)采用的主流排名方法,它結(jié)合了多種排名策略,以應(yīng)對(duì)復(fù)雜的內(nèi)容推薦需求?;旌吓判蛩惴軌蛘蠒r(shí)間敏感性、社交信號(hào)、內(nèi)容相關(guān)性等多個(gè)因素,綜合評(píng)估內(nèi)容的優(yōu)先級(jí),從而為用戶呈現(xiàn)最合適的內(nèi)容。
混合排序算法通常會(huì)結(jié)合以下幾個(gè)因素:
混合排序算法的最大優(yōu)勢(shì)在于其靈活性和適應(yīng)性。它能夠在多變的信息環(huán)境中,綜合考慮多個(gè)因素,確保平臺(tái)展示最符合用戶需求的內(nèi)容。無論是時(shí)效性強(qiáng)的新聞報(bào)道,還是基于用戶興趣的個(gè)性化推薦,混合排序都能夠高效整合和優(yōu)化。然而,混合排序算法也面臨著一定的挑戰(zhàn),特別是在如何合理加權(quán)不同因素之間的權(quán)重。不同類型的內(nèi)容和用戶需求可能對(duì)時(shí)間、社交信號(hào)或相關(guān)性的依賴不同,如何平衡這些因素以實(shí)現(xiàn)最佳推薦,仍然是平臺(tái)面臨的技術(shù)難題。