版本号3.3 2015年7月16日
目录
什么是新榜指数 (3)
算法简述 (3)
算法详解 (4)
1、选定指标 (4)
2、指标标准化 (4)
3、指标加权 (5)
算法所使用数据的统计口径 (6)
FAQ (7)
1、为何要设定常数? (7)
2、1000分是最高分吗? (7)
3、常数设定中的点赞数的最高值为何没用10万,而是1万? (7)
4、算法会经常变么,如发布上限从8篇/天变成了10篇/天? (7)
5、新榜指数可以跨期比较么? (8)
拓展:两微一端的独立及跨平台应用 (8)
什么是新榜指数
新榜指数(New Rank Index,NRI)系由新榜(newrank)基于海量数据、用户深度反馈及专家建议而推出,用于衡量中国移动互联网渠道新媒体(主要指两微一端)的传播能力,此指数反映该新媒体主体的热度和发展趋势。
以下算法主要针对进行阐述。
算法简述
新榜指数是由原始数据参照基数通过计算公式推导出来的标量数值,用以衡量原始数据在其所属维度的相对表现。例如,xx点赞数为:379,我们会将这一数据和点赞常数进行比较,以确定其点赞数的相对位置,进而转换为其点赞指数,其余指标以此类推。
该算法相较于常规加权有四大优势:1、不仅显示绝对表现,还能反映所处位置;2、标准化后,不同维度的指标之间可以相互比较;3、指标之间可以相互运算,从而得到综合考察各维度的新榜指数;4、不仅可以用于用户间的比较,也可以用于用户自身的跨期比较。
算法详解
1、选定指标
在的计算中,为兼顾其数量与质量,我们使用总阅读数、最高阅读数、平均阅读数、头条阅读数、总点赞数五个指标来对账号进行评估,其中:
整体指标(总阅读数,R ):指统计周期内所有发布内容的阅读数总和; ∙
优异指标(最高阅读,R m ):是指统计周期内所有发布内容中的单篇最高阅读数; ∙
质量指标(平均阅读数,R a ):统计周期内所有发布内容的阅读数平均值; ∙
主动预判指标(头条阅读,R ℎ):统计周期内位置为头条的内容的阅读总数; ∙ 互动指标(总点赞数,Z):统计周期内所有发布内容的点赞数总和。
2、指标标准化
基于不同维度指标的差异性,我们首先将所得数据标准化,即通过对各维度原始数据与该维度常数的比值计算,得到该样本各项指标的千分化数值。
在新榜指数中,以天为最小计算周期,将常规(1天推送一次,每次最多8篇)的为对象在这一时间段内总阅读数、最高阅读数、平均阅读数、头条阅读数和点赞数共五个指标的
常数分别记为R,̅ R m ̅̅̅̅,R a ̅̅̅̅,R ℎ̅̅̅̅,Z , R ̅。
结合新榜历史数据样本库及平台的发布规则——1个常规的每天最多发布8篇,每次单篇阅读数最高为10万,故而我们记录80万为“总阅读数”这一指标理论上的1000分,对于某些特别账号——例如每天可以推送多次的人民日报、央视新闻,则理论上,在该
指标上可以获得比1000分更高的得分。
故而
点赞超万的美食食谱R,̅=8∗100000=800000; R m ̅̅̅̅=100000,R a ̅̅̅̅=100000,R ℎ̅̅̅̅=100000,Z =8*10000。 在不同的时间周期,即日、周、月、年(n=1,7,30,365)下,以上常数具体数值为:
n ∗R
̅,R m ̅̅̅̅  ,R a ̅̅̅̅,n ∗ R ℎ̅̅̅̅,n ∗ Z
在此基础上,各指标按以下公式进行标准化:
R ‘=ln (R+1)ln (n∗R ̅+1)×1000,
R max ′=
ln (R m +1)ln (R m ̅̅̅̅̅+1)×1000, R a ′=ln (R a +1)ln (R a
̅̅̅̅+1)×1000, R ℎ′=ln (R ℎ+1)
ln (n∗R ℎ̅̅̅̅+1)
×1000, Z ‘=
ln (Z +1)ln (n ∗Z +1)
×1000  注:此处“+1”是为了避免出现类似“ 0 阅读”时而产生无效值
3、指标加权
由于此五项数据影响传播能力的程度不同,我们赋予不同的权重,分别记为ωR ,ωR m ,ωR a ,ωR ℎ,ωZ 。最终,新榜指数的计算公式表述为:
NRI =ωR R ‘+ωR m R m ′+ωR a R a ′+ωR ℎR ℎ′+ωZ Z ‘
目前,我们使用的系数为ωR =0.75,ωR m =0.05,ωR a =0.1,ωR ℎ=0.05,ωZ =0.05。