达人排序规则升级 PRD

第一部分

星图排序拟合调研数据驱动

基于系统已采集的真实星图搜索快照，逆向拟合星图自家的达人排序逻辑，为新规则提供数据基础。

1.1 数据基础与调研规模

数据资产	说明	规模
星图搜索快照	用户在"星图找人"中实际触发的每页搜索结果	10.6 万次
达人明细	每次快照中达人 ID + 星图原始排序位置	176 万行
筛选条件组合	价格、CPM、品类标签、性别、年龄、地域、人群画像等	6.16 万种
本次抽样测试集	从最近 30 天分层抽样，覆盖 17 类条件组合	54 套
对照达人	每套用例取星图首页 20 名作为 ground truth	1080 名

1.2 核心发现

现行 V4 与星图的相关性

ρ ≈ -0.06

几乎无相关，CPM+返点 65% 权重是主因

PRD 拟合公式声称命中率

81.3%

为训练集天花板，独立样本无法复现

本次独立样本上测得

25.8%

PRD 原 13 维公式直接套用 hit5

关键洞察：对 13 个维度逐一做单维信号验证，发现 PRD 原公式中 6 个维度方向是反的——爆文率、达人地域(一线)、女粉+精妈、精妈+Z 世代、看后搜率、CPM。这些维度在数据上的实际方向与业务直觉相反，是 PRD 系数符号在共线性下的人造结果。

各维度独立信号强度

维度（前端中文名）	PRD 方向	实测 ρ	结论
观众集中度（精妈+Z 世代）	高→后	+0.107	方向反实际"高→前"
观众下沉度	高→后	+0.101	方向正确
粉丝下沉度	高→后	+0.087	方向正确
距上次发视频	多→后	+0.078	方向正确
商业表现（商单数）	多→前	+0.074	方向正确
内容表现（爆文率）	高→前	-0.064	方向反但接近 0
粉丝集中度（女粉+精妈）	高→后	-0.077	方向反实际"高→前"
看后搜率	高→后	-0.178	方向反实际"高→前"
达人地域（一线）	是→前	-0.021	几乎无信号
调性分	高→后	+0.002	完全无信号建议剔除
CPM 档位	高→后	-0.001	无信号星图不按 CPM 排
MCN 身份	有→后	N/A	无差异抽样全有 MCN

调整逻辑：把"方向反"的维度按数据实际方向翻转、把"无信号"的维度删除或降权，得到 V3 拟合规则——线性 z-score 加权和方案的最优组合。

1.3 V3 拟合规则（线性最优）

V3 是本次调研得到的"线性加权方案的天花板"，作为 V4 的主排序底座。

排名	维度（前端中文名）	方向	权重	业务含义
1	商单数	+ 高→前	25%	商业能力最强信号，权重最高
2	观众集中度（精妈+Z 世代）	+ 高→前	19%	观看者画像聚焦高消费人群
3	粉丝集中度·普通女粉	+ 高→前	11%	女性消费品基础盘
4	粉丝集中度·精致妈妈	+ 高→前	11%	女性子群中购买力突出群体
5	白领+中产	+ 高→前	10%	新锐白领+资深中产合并
6	距上次发视频	- 多→后	10%	近期活跃度
7	爆文率	+ 高→前	8%	10W+ 视频占比
8	CPM 档位	- 高→后	6%	实测无信号，仅作业务兜底

V3 在 54 套独立测试用例上的表现

前 5 命中率

35.2%

较 V4 现行版 +24pp

前 10 命中率

53.3%

前 50% 池命中

前 15 命中率

75.3%

前 75% 池命中

第二部分

新排序规则 V4 落地方案

在 V3 拟合主排序基础上，叠加"自家身份加权 + 首屏兜底"两个业务定制项，兼顾算法贴合度与运营需求。

2.1 整体架构

主排序底座

V3 的 8 维加权和（数据拟合最优），决定整体排序方向与名次

业务定制层

自家身份加权 + 首屏 ≥1 自家达人兜底，保障运营基本盘

2.2 主排序权重表

排名	维度	方向	权重
1	商单数	+ 高→前	25%
2	观众集中度（精妈+Z 世代）	+ 高→前	19%
3	粉丝集中度·普通女粉	+ 高→前	11%
4	粉丝集中度·精致妈妈	+ 高→前	11%
5	白领+中产	+ 高→前	10%
6	距上次发视频	- 多→后	10%
7	爆文率	+ 高→前	8%
8	CPM 档位	- 高→后	6%

2.3 自家身份加权

主排序之外，按达人身份额外加分。加权值刻意设计得"较低"，避免颠覆主排序、只起到"同等贴合度时优先自家"的作用。

身份	加权分	影响
自家独家	+0.20	中位达人约提升 4–5 个名次
自家	+0.13	中位达人约提升 2–3 个名次
VIP	+0.07	中位达人约提升 1–2 个名次
合作过 / 其他	0	不加权

测试验证：加权后整体 hit5 仅下降 0.74pp（35.19% → 34.44%），证明主排序贴合度几乎不受影响；同时自家达人进 Top 5 数从 30 提升到 36（+10.6pp），进 Top 10 数从 44 提升到 47（+5.3pp）。

2.4 首屏兜底策略

即便加权后，部分场景下自家达人本身能力较弱仍可能排到 21+ 名外。兜底策略保障首屏（前 20 名）始终有至少 1 个自家身份达人。

按 V4 总分（主分 + 身份加权）降序排列所有达人
取前 20 名作为首屏
检查首屏中是否包含至少 1 个自家身份达人（自家独家 / 自家 / VIP 任一）
如果没有：从第 21+ 名中找 V4 分数最高的自家达人，提到首屏第 20 位
如果整个返回池都没有自家达人：fallback（按原排序输出，不强制造空）

2.5 V4 业务效果数据

指标	V3 主排序	V4 主+加权	变化
前 5 命中率	35.19%	34.44%	-0.74 pp
前 10 命中率	53.33%	53.15%	-0.19 pp
前 15 命中率	75.31%	75.31%	0.00 pp
排序一致性	53.49%	53.45%	-0.04 pp
自家达人进 Top5 数	30 / 57	36 / 57	+10.6 pp
自家达人进 Top10 数	44 / 57	47 / 57	+5.3 pp

第三部分

三版本对比老 WEB 版 / V4 现行版 / 新 V4 版

把"老 WEB 版"（线上 2.0 之前的版本）、"V4 现行版"（系统当前在跑的 composite_base）、"新 V4 版"（本次重设计）放在同一张桌上，从维度、权重、业务感受三个角度对比。

3.1 维度对比

维度	老 WEB 版	V4 现行版	新 V4 版
历史通过率	无	22.6%	无
商单数	25%	无	25%
CPM 档位	19%	34.8%	6%
返点档位	6%	30.4%	无
达人身份（自家/VIP/合作）	19%	无	加权+兜底
八大人群占比	13%	无	51%（拆4项）
爆文率	无	无	8%
距上次发视频 / 活跃度	13%	8.7%	10%
播放趋势	13%	3.5%	无
触达粉丝量	6%	无	无

※ 老 WEB 版总分 80 分，权重 = 子项 / 80；V4 现行版总分 115 分，权重 = 子项 / 115；新 V4 版按归一化的 100% 直接展示。

3.2 权重结构对比

维度归类	老 WEB 版	V4 现行版	新 V4 版
商业回报类（商单+CPM+返点）	50%	65%	31%
受众画像类（性别+人群+城市）	13%	0%	51%
内容能力类（爆文+趋势）	13%	3.5%	8%
活跃度类（距上次视频+触达）	19%	8.7%	10%
历史合作类（身份+通过率）	19%	22.6%	加权层

3.3 业务感受对比

业务关注点	老 WEB 版	V4 现行版	新 V4 版
能否复用星图自己的排序逻辑	未验证	ρ = -0.06，几乎无关	ρ = +0.10，弱正相关
是否考虑爆文能力	否	否	是
是否细化人群画像	粗粒度（8 大人群混在一项）	不考虑	拆为 4 个细分维度
自家身份保障	+15 强加权	完全无	轻加权 + 首屏兜底
CPM 是否过度主导	中（19%）	过度（35%）	轻（6%）
返点是否过度主导	低（6%）	过度（30%）	无（已去除）
对达人活跃度敏感	是	弱	是
维度数（核心权重项）	7 项	5 项	8 项 + 身份层
覆盖率（系统中有多少达人能算分）	中	仅 30%（依赖通过率）	100%（不依赖标注）

3.4 综合判断

评估视角	老 WEB 版	V4 现行版	新 V4 版
贴合星图原序	★★	★	★★★★
业务可解释性	★★★	★★	★★★★★
自家达人体验	★★★★★	★	★★★★
受众画像精细度	★★	★	★★★★★
商业回报兼顾	★★★	★★★★	★★★
系统覆盖率	★★★	★★	★★★★★

结论：新 V4 版在贴合星图、业务可解释性、受众精细度、覆盖率四个维度全面领先；自家达人体验通过"轻加权+兜底"两层设计接近老 WEB 版的强保障水平，且不像老 WEB 版那样硬性提升 15 分扰乱主排序。

关键术语对照

术语	含义
前 N 命中率	系统排序的前 N 名中，有几个在星图原序也是前 N 名（hit5 / hit10 / hit15 分别对应前 5/10/15 名）
排序一致性	任取两个达人，系统排序和星图排序方向相同的比例（≥50% 表示比抛硬币好）
Spearman ρ	排序相关系数，范围 [-1, +1]，越接近 +1 越贴合星图原序
自家身份	「自家独家账号」「自家账号」「VIP 达人」三类标签，运营手动维护

达人排序规则升级

星图排序拟合调研 数据驱动

1.1 数据基础与调研规模

1.2 核心发现

各维度独立信号强度

1.3 V3 拟合规则（线性最优）

V3 在 54 套独立测试用例上的表现

新排序规则 V4 落地方案

2.1 整体架构

主排序底座

业务定制层

2.2 主排序权重表

2.3 自家身份加权

2.4 首屏兜底策略

2.5 V4 业务效果数据

三版本对比 老 WEB 版 / V4 现行版 / 新 V4 版

3.1 维度对比

3.2 权重结构对比

3.3 业务感受对比

3.4 综合判断

关键术语对照

星图排序拟合调研数据驱动

三版本对比老 WEB 版 / V4 现行版 / 新 V4 版