PRD · 选号系统
达人排序规则升级
基于 6 万次星图真实搜索数据拟合,重塑筛号结果列表页的达人排序逻辑
第一部分
星图排序拟合调研 数据驱动
基于系统已采集的真实星图搜索快照,逆向拟合星图自家的达人排序逻辑,为新规则提供数据基础。
1.1 数据基础与调研规模
| 数据资产 | 说明 | 规模 |
| 星图搜索快照 | 用户在"星图找人"中实际触发的每页搜索结果 | 10.6 万次 |
| 达人明细 | 每次快照中达人 ID + 星图原始排序位置 | 176 万行 |
| 筛选条件组合 | 价格、CPM、品类标签、性别、年龄、地域、人群画像 等 | 6.16 万种 |
| 本次抽样测试集 | 从最近 30 天分层抽样,覆盖 17 类条件组合 | 54 套 |
| 对照达人 | 每套用例取星图首页 20 名作为 ground truth | 1080 名 |
1.2 核心发现
现行 V4 与星图的相关性
ρ ≈ -0.06
几乎无相关,CPM+返点 65% 权重是主因
PRD 拟合公式声称命中率
81.3%
为训练集天花板,独立样本无法复现
本次独立样本上测得
25.8%
PRD 原 13 维公式直接套用 hit5
关键洞察:对 13 个维度逐一做单维信号验证,发现 PRD 原公式中 6 个维度方向是反的——爆文率、达人地域(一线)、女粉+精妈、精妈+Z 世代、看后搜率、CPM。这些维度在数据上的实际方向与业务直觉相反,是 PRD 系数符号在共线性下的人造结果。
各维度独立信号强度
| 维度(前端中文名) |
PRD 方向 |
实测 ρ |
结论 |
| 观众集中度(精妈+Z 世代) | 高→后 | +0.107 | 方向反 实际"高→前" |
| 观众下沉度 | 高→后 | +0.101 | 方向正确 |
| 粉丝下沉度 | 高→后 | +0.087 | 方向正确 |
| 距上次发视频 | 多→后 | +0.078 | 方向正确 |
| 商业表现(商单数) | 多→前 | +0.074 | 方向正确 |
| 内容表现(爆文率) | 高→前 | -0.064 | 方向反 但接近 0 |
| 粉丝集中度(女粉+精妈) | 高→后 | -0.077 | 方向反 实际"高→前" |
| 看后搜率 | 高→后 | -0.178 | 方向反 实际"高→前" |
| 达人地域(一线) | 是→前 | -0.021 | 几乎无信号 |
| 调性分 | 高→后 | +0.002 | 完全无信号 建议剔除 |
| CPM 档位 | 高→后 | -0.001 | 无信号 星图不按 CPM 排 |
| MCN 身份 | 有→后 | N/A | 无差异 抽样全有 MCN |
调整逻辑:把"方向反"的维度按数据实际方向翻转、把"无信号"的维度删除或降权,得到 V3 拟合规则——线性 z-score 加权和方案的最优组合。
1.3 V3 拟合规则(线性最优)
V3 是本次调研得到的"线性加权方案的天花板",作为 V4 的主排序底座。
| 排名 | 维度(前端中文名) | 方向 | 权重 | 业务含义 |
| 1 | 商单数 | + 高→前 | 25% | 商业能力最强信号,权重最高 |
| 2 | 观众集中度(精妈+Z 世代) | + 高→前 | 19% | 观看者画像聚焦高消费人群 |
| 3 | 粉丝集中度·普通女粉 | + 高→前 | 11% | 女性消费品基础盘 |
| 4 | 粉丝集中度·精致妈妈 | + 高→前 | 11% | 女性子群中购买力突出群体 |
| 5 | 白领+中产 | + 高→前 | 10% | 新锐白领+资深中产合并 |
| 6 | 距上次发视频 | - 多→后 | 10% | 近期活跃度 |
| 7 | 爆文率 | + 高→前 | 8% | 10W+ 视频占比 |
| 8 | CPM 档位 | - 高→后 | 6% | 实测无信号,仅作业务兜底 |
V3 在 54 套独立测试用例上的表现
前 5 命中率
35.2%
较 V4 现行版 +24pp
第二部分
新排序规则 V4 落地方案
在 V3 拟合主排序基础上,叠加"自家身份加权 + 首屏兜底"两个业务定制项,兼顾算法贴合度与运营需求。
2.1 整体架构
主排序底座
V3 的 8 维加权和(数据拟合最优),决定整体排序方向与名次
业务定制层
自家身份加权 + 首屏 ≥1 自家达人 兜底,保障运营基本盘
2.2 主排序权重表
| 排名 | 维度 | 方向 | 权重 |
| 1 | 商单数 | + 高→前 | 25% |
| 2 | 观众集中度(精妈+Z 世代) | + 高→前 | 19% |
| 3 | 粉丝集中度·普通女粉 | + 高→前 | 11% |
| 4 | 粉丝集中度·精致妈妈 | + 高→前 | 11% |
| 5 | 白领+中产 | + 高→前 | 10% |
| 6 | 距上次发视频 | - 多→后 | 10% |
| 7 | 爆文率 | + 高→前 | 8% |
| 8 | CPM 档位 | - 高→后 | 6% |
2.3 自家身份加权
主排序之外,按达人身份额外加分。加权值刻意设计得"较低",避免颠覆主排序、只起到"同等贴合度时优先自家"的作用。
| 身份 | 加权分 | 影响 |
| 自家独家 | +0.20 | 中位达人约提升 4–5 个名次 |
| 自家 | +0.13 | 中位达人约提升 2–3 个名次 |
| VIP | +0.07 | 中位达人约提升 1–2 个名次 |
| 合作过 / 其他 | 0 | 不加权 |
测试验证:加权后整体 hit5 仅下降 0.74pp(35.19% → 34.44%),证明主排序贴合度几乎不受影响;同时自家达人进 Top 5 数从 30 提升到 36(+10.6pp),进 Top 10 数从 44 提升到 47(+5.3pp)。
2.4 首屏兜底策略
即便加权后,部分场景下自家达人本身能力较弱仍可能排到 21+ 名外。兜底策略保障首屏(前 20 名)始终有至少 1 个自家身份达人。
- 按 V4 总分(主分 + 身份加权)降序排列所有达人
- 取前 20 名作为首屏
- 检查首屏中是否包含至少 1 个自家身份达人(自家独家 / 自家 / VIP 任一)
- 如果没有:从第 21+ 名中找 V4 分数最高的自家达人,提到首屏第 20 位
- 如果整个返回池都没有自家达人:fallback(按原排序输出,不强制造空)
2.5 V4 业务效果数据
| 指标 | V3 主排序 | V4 主+加权 | 变化 |
| 前 5 命中率 | 35.19% | 34.44% | -0.74 pp |
| 前 10 命中率 | 53.33% | 53.15% | -0.19 pp |
| 前 15 命中率 | 75.31% | 75.31% | 0.00 pp |
| 排序一致性 | 53.49% | 53.45% | -0.04 pp |
| 自家达人进 Top5 数 | 30 / 57 | 36 / 57 | +10.6 pp |
| 自家达人进 Top10 数 | 44 / 57 | 47 / 57 | +5.3 pp |
第三部分
三版本对比 老 WEB 版 / V4 现行版 / 新 V4 版
把"老 WEB 版"(线上 2.0 之前的版本)、"V4 现行版"(系统当前在跑的 composite_base)、"新 V4 版"(本次重设计)放在同一张桌上,从维度、权重、业务感受三个角度对比。
3.1 维度对比
| 维度 | 老 WEB 版 | V4 现行版 | 新 V4 版 |
| 历史通过率 | 无 | 22.6% | 无 |
| 商单数 | 25% | 无 | 25% |
| CPM 档位 | 19% | 34.8% | 6% |
| 返点档位 | 6% | 30.4% | 无 |
| 达人身份(自家/VIP/合作) | 19% | 无 | 加权+兜底 |
| 八大人群占比 | 13% | 无 | 51%(拆4项) |
| 爆文率 | 无 | 无 | 8% |
| 距上次发视频 / 活跃度 | 13% | 8.7% | 10% |
| 播放趋势 | 13% | 3.5% | 无 |
| 触达粉丝量 | 6% | 无 | 无 |
※ 老 WEB 版总分 80 分,权重 = 子项 / 80;V4 现行版总分 115 分,权重 = 子项 / 115;新 V4 版按归一化的 100% 直接展示。
3.2 权重结构对比
| 维度归类 | 老 WEB 版 | V4 现行版 | 新 V4 版 |
| 商业回报类(商单+CPM+返点) | 50% | 65% | 31% |
| 受众画像类(性别+人群+城市) | 13% | 0% | 51% |
| 内容能力类(爆文+趋势) | 13% | 3.5% | 8% |
| 活跃度类(距上次视频+触达) | 19% | 8.7% | 10% |
| 历史合作类(身份+通过率) | 19% | 22.6% | 加权层 |
3.3 业务感受对比
| 业务关注点 | 老 WEB 版 | V4 现行版 | 新 V4 版 |
| 能否复用星图自己的排序逻辑 |
未验证 |
ρ = -0.06,几乎无关 |
ρ = +0.10,弱正相关 |
| 是否考虑爆文能力 |
否 |
否 |
是 |
| 是否细化人群画像 |
粗粒度(8 大人群混在一项) |
不考虑 |
拆为 4 个细分维度 |
| 自家身份保障 |
+15 强加权 |
完全无 |
轻加权 + 首屏兜底 |
| CPM 是否过度主导 |
中(19%) |
过度(35%) |
轻(6%) |
| 返点是否过度主导 |
低(6%) |
过度(30%) |
无(已去除) |
| 对达人活跃度敏感 |
是 |
弱 |
是 |
| 维度数(核心权重项) |
7 项 |
5 项 |
8 项 + 身份层 |
| 覆盖率(系统中有多少达人能算分) |
中 |
仅 30%(依赖通过率) |
100%(不依赖标注) |
3.4 综合判断
| 评估视角 | 老 WEB 版 | V4 现行版 | 新 V4 版 |
| 贴合星图原序 | ★★ | ★ | ★★★★ |
| 业务可解释性 | ★★★ | ★★ | ★★★★★ |
| 自家达人体验 | ★★★★★ | ★ | ★★★★ |
| 受众画像精细度 | ★★ | ★ | ★★★★★ |
| 商业回报兼顾 | ★★★ | ★★★★ | ★★★ |
| 系统覆盖率 | ★★★ | ★★ | ★★★★★ |
结论:新 V4 版在贴合星图、业务可解释性、受众精细度、覆盖率四个维度全面领先;自家达人体验通过"轻加权+兜底"两层设计接近老 WEB 版的强保障水平,且不像老 WEB 版那样硬性提升 15 分扰乱主排序。
关键术语对照
| 术语 | 含义 |
| 前 N 命中率 | 系统排序的前 N 名中,有几个在星图原序也是前 N 名(hit5 / hit10 / hit15 分别对应前 5/10/15 名) |
| 排序一致性 | 任取两个达人,系统排序和星图排序方向相同的比例(≥50% 表示比抛硬币好) |
| Spearman ρ | 排序相关系数,范围 [-1, +1],越接近 +1 越贴合星图原序 |
| 自家身份 | 「自家独家账号」「自家账号」「VIP 达人」三类标签,运营手动维护 |