PRD · 选号系统

达人排序规则升级

基于 6 万次星图真实搜索数据拟合,重塑筛号结果列表页的达人排序逻辑
10.6 万
星图搜索快照
176 万
达人对照样本
6.16 万
不同筛选条件
+24 pp
较 V4 现行版命中率
第一部分

星图排序拟合调研 数据驱动

基于系统已采集的真实星图搜索快照,逆向拟合星图自家的达人排序逻辑,为新规则提供数据基础。

1.1 数据基础与调研规模

数据资产说明规模
星图搜索快照用户在"星图找人"中实际触发的每页搜索结果10.6 万次
达人明细每次快照中达人 ID + 星图原始排序位置176 万行
筛选条件组合价格、CPM、品类标签、性别、年龄、地域、人群画像 等6.16 万种
本次抽样测试集从最近 30 天分层抽样,覆盖 17 类条件组合54 套
对照达人每套用例取星图首页 20 名作为 ground truth1080 名

1.2 核心发现

现行 V4 与星图的相关性
ρ ≈ -0.06
几乎无相关,CPM+返点 65% 权重是主因
PRD 拟合公式声称命中率
81.3%
为训练集天花板,独立样本无法复现
本次独立样本上测得
25.8%
PRD 原 13 维公式直接套用 hit5
关键洞察:对 13 个维度逐一做单维信号验证,发现 PRD 原公式中 6 个维度方向是反的——爆文率、达人地域(一线)、女粉+精妈、精妈+Z 世代、看后搜率、CPM。这些维度在数据上的实际方向与业务直觉相反,是 PRD 系数符号在共线性下的人造结果。

各维度独立信号强度

维度(前端中文名) PRD 方向 实测 ρ 结论
观众集中度(精妈+Z 世代)高→后+0.107方向反 实际"高→前"
观众下沉度高→后+0.101方向正确
粉丝下沉度高→后+0.087方向正确
距上次发视频多→后+0.078方向正确
商业表现(商单数)多→前+0.074方向正确
内容表现(爆文率)高→前-0.064方向反 但接近 0
粉丝集中度(女粉+精妈)高→后-0.077方向反 实际"高→前"
看后搜率高→后-0.178方向反 实际"高→前"
达人地域(一线)是→前-0.021几乎无信号
调性分高→后+0.002完全无信号 建议剔除
CPM 档位高→后-0.001无信号 星图不按 CPM 排
MCN 身份有→后N/A无差异 抽样全有 MCN
调整逻辑:把"方向反"的维度按数据实际方向翻转、把"无信号"的维度删除或降权,得到 V3 拟合规则——线性 z-score 加权和方案的最优组合。

1.3 V3 拟合规则(线性最优)

V3 是本次调研得到的"线性加权方案的天花板",作为 V4 的主排序底座。

排名维度(前端中文名)方向权重业务含义
1商单数+ 高→前25%商业能力最强信号,权重最高
2观众集中度(精妈+Z 世代)+ 高→前19%观看者画像聚焦高消费人群
3粉丝集中度·普通女粉+ 高→前11%女性消费品基础盘
4粉丝集中度·精致妈妈+ 高→前11%女性子群中购买力突出群体
5白领+中产+ 高→前10%新锐白领+资深中产合并
6距上次发视频- 多→后10%近期活跃度
7爆文率+ 高→前8%10W+ 视频占比
8CPM 档位- 高→后6%实测无信号,仅作业务兜底

V3 在 54 套独立测试用例上的表现

前 5 命中率
35.2%
较 V4 现行版 +24pp
前 10 命中率
53.3%
前 50% 池命中
前 15 命中率
75.3%
前 75% 池命中
第二部分

新排序规则 V4 落地方案

在 V3 拟合主排序基础上,叠加"自家身份加权 + 首屏兜底"两个业务定制项,兼顾算法贴合度与运营需求。

2.1 整体架构

主排序底座
V3 的 8 维加权和(数据拟合最优),决定整体排序方向与名次
业务定制层
自家身份加权 + 首屏 ≥1 自家达人 兜底,保障运营基本盘

2.2 主排序权重表

排名维度方向权重
1商单数+ 高→前25%
2观众集中度(精妈+Z 世代)+ 高→前19%
3粉丝集中度·普通女粉+ 高→前11%
4粉丝集中度·精致妈妈+ 高→前11%
5白领+中产+ 高→前10%
6距上次发视频- 多→后10%
7爆文率+ 高→前8%
8CPM 档位- 高→后6%

2.3 自家身份加权

主排序之外,按达人身份额外加分。加权值刻意设计得"较低",避免颠覆主排序、只起到"同等贴合度时优先自家"的作用。

身份加权分影响
自家独家+0.20中位达人约提升 4–5 个名次
自家+0.13中位达人约提升 2–3 个名次
VIP+0.07中位达人约提升 1–2 个名次
合作过 / 其他0不加权
测试验证:加权后整体 hit5 仅下降 0.74pp(35.19% → 34.44%),证明主排序贴合度几乎不受影响;同时自家达人进 Top 5 数从 30 提升到 36(+10.6pp),进 Top 10 数从 44 提升到 47(+5.3pp)。

2.4 首屏兜底策略

即便加权后,部分场景下自家达人本身能力较弱仍可能排到 21+ 名外。兜底策略保障首屏(前 20 名)始终有至少 1 个自家身份达人。

  1. 按 V4 总分(主分 + 身份加权)降序排列所有达人
  2. 取前 20 名作为首屏
  3. 检查首屏中是否包含至少 1 个自家身份达人(自家独家 / 自家 / VIP 任一)
  4. 如果没有:从第 21+ 名中找 V4 分数最高的自家达人,提到首屏第 20 位
  5. 如果整个返回池都没有自家达人:fallback(按原排序输出,不强制造空)

2.5 V4 业务效果数据

指标V3 主排序V4 主+加权变化
前 5 命中率35.19%34.44%-0.74 pp
前 10 命中率53.33%53.15%-0.19 pp
前 15 命中率75.31%75.31%0.00 pp
排序一致性53.49%53.45%-0.04 pp
自家达人进 Top5 数30 / 5736 / 57+10.6 pp
自家达人进 Top10 数44 / 5747 / 57+5.3 pp
第三部分

三版本对比 老 WEB 版 / V4 现行版 / 新 V4 版

把"老 WEB 版"(线上 2.0 之前的版本)、"V4 现行版"(系统当前在跑的 composite_base)、"新 V4 版"(本次重设计)放在同一张桌上,从维度、权重、业务感受三个角度对比。

3.1 维度对比

维度老 WEB 版V4 现行版新 V4 版
历史通过率22.6%
商单数25%25%
CPM 档位19%34.8%6%
返点档位6%30.4%
达人身份(自家/VIP/合作)19%加权+兜底
八大人群占比13%51%(拆4项)
爆文率8%
距上次发视频 / 活跃度13%8.7%10%
播放趋势13%3.5%
触达粉丝量6%

※ 老 WEB 版总分 80 分,权重 = 子项 / 80;V4 现行版总分 115 分,权重 = 子项 / 115;新 V4 版按归一化的 100% 直接展示。

3.2 权重结构对比

维度归类老 WEB 版V4 现行版新 V4 版
商业回报类(商单+CPM+返点)50%65%31%
受众画像类(性别+人群+城市)13%0%51%
内容能力类(爆文+趋势)13%3.5%8%
活跃度类(距上次视频+触达)19%8.7%10%
历史合作类(身份+通过率)19%22.6%加权层

3.3 业务感受对比

业务关注点老 WEB 版V4 现行版新 V4 版
能否复用星图自己的排序逻辑 未验证 ρ = -0.06,几乎无关 ρ = +0.10,弱正相关
是否考虑爆文能力
是否细化人群画像 粗粒度(8 大人群混在一项) 不考虑 拆为 4 个细分维度
自家身份保障 +15 强加权 完全无 轻加权 + 首屏兜底
CPM 是否过度主导 中(19%) 过度(35%) 轻(6%)
返点是否过度主导 低(6%) 过度(30%) 无(已去除)
对达人活跃度敏感
维度数(核心权重项) 7 项 5 项 8 项 + 身份层
覆盖率(系统中有多少达人能算分) 仅 30%(依赖通过率) 100%(不依赖标注)

3.4 综合判断

评估视角老 WEB 版V4 现行版新 V4 版
贴合星图原序★★★★★★
业务可解释性★★★★★★★★★★
自家达人体验★★★★★★★★★
受众画像精细度★★★★★★★
商业回报兼顾★★★★★★★★★★
系统覆盖率★★★★★★★★★★
结论:新 V4 版在贴合星图、业务可解释性、受众精细度、覆盖率四个维度全面领先;自家达人体验通过"轻加权+兜底"两层设计接近老 WEB 版的强保障水平,且不像老 WEB 版那样硬性提升 15 分扰乱主排序。

关键术语对照

术语含义
前 N 命中率系统排序的前 N 名中,有几个在星图原序也是前 N 名(hit5 / hit10 / hit15 分别对应前 5/10/15 名)
排序一致性任取两个达人,系统排序和星图排序方向相同的比例(≥50% 表示比抛硬币好)
Spearman ρ排序相关系数,范围 [-1, +1],越接近 +1 越贴合星图原序
自家身份「自家独家账号」「自家账号」「VIP 达人」三类标签,运营手动维护