达人排序重构需求文档

〇、背景 P0

现行 AI 选号排序质量持续被吐槽，首屏推出来的达人质量明显跟不上，问题已经传导到客户端。

0.1 品牌客户吐槽

一打开 AI 推荐结果，前几个达人就是垃圾号，当场质疑产品能力
「你们 AI 推的这些是什么？我自己挑都比这准」
品牌方对 AI 选号信心下降，要求人工复核所有推荐

0.2 媒介反馈

第一屏排序质量很差，要翻到第三四页才能挑到能用的号
AI 推荐的「好号」跟媒介经验严重不符
越来越多媒介绕过 AI，直接走星图人工挑号
通过率/返点高的号霸屏，但内容质量、粉丝匹配度都不行

0.3 改动边界

做	不做
重构主排序逻辑：数据驱动公式 + 自家身份加权 + 配额兜底	不动筛选条件、不动现有公式（保留作长尾兜底）、不动前端 UI、不上 ML 模型

一、现状：v4 现行排序怎么做的 P0

现行 v4 主排序按「现行综合分」降序，副排序按粉丝数降序。综合分总分 0–115，五大子项构成：

子项	满分	占比	业务解读
历史通过率	26	22.6%	通过过 = 排前
CPM 档位	40	34.8%	CPM 越低越加分
返点档位	35	30.4%	返点越高越加分
趋势奖励	4	3.5%	通过率上升加分
活跃度	10	8.7%	近期下单越近越加分

三大病灶

通过率 + 返点合计 53%，正中运营吐槽两条红线（「通过 ≠ 质量」「返点不该主导」）
公式只覆盖 30% 达人（17 万达人只 4.5 万有分）
跟市场认可度脱钩：与星图原始排名相关性近乎 0（ρ=-0.06）

二、调研：拟合星图排序 P0

为搞清「真正好的排序应该怎样」，我们用了一个最权威的参考标准 —— 星图（抖音官方达人广告平台）的默认排序。

2.1 数据基础

v4 已经在采集星图搜索结果时记录了每个达人在搜索结果中的位次
已存：65k 搜索快照、100 万行明细
把同一搜索条件下星图的达人位次，跟达人本地特征做相关性分析

2.2 调研规模：跑了 80+ 个本地特征

涵盖：基础属性、粉丝侧八大人群/年龄/城市、观众侧八大人群/年龄/城市、视频聚合、CPM/CPE 档位、商单数据、看后搜、调性分、内容标签等。

2.3 四个核心发现

发现	解读
强信号集中在「人群分布」维度	粉丝侧 + 观众侧的 8 大人群 / 年龄 / 城市分布是最强信号源
几乎所有「人群占比」都是 +ρ	占比高 → 排后。星图要观众分散的大众化达人，不要垂类
视频侧反直觉	商单数、爆文率有信号；平均播放量、互动率、点赞数全是噪声
看后搜率 +0.32	转化型达人扣分，曝光型达人加分（首屏是品牌广告位）

2.4 拟合结果：星图 13 维排序公式

用 6.7 万行星图样本跑多元线性回归（OLS），让数据自己算出每个维度的最优权重：

#	维度	代表特征	方向	权重占比
1	内容表现	爆文率（>10w 播放视频占比）	高→前	22.0%
2	达人地域	是否一线城市	是→前	17.4%
3	观众下沉度	观众四线城市占比	高→后	13.1%
4	商业表现	近 90 天商单数	多→前	11.2%
5	粉丝集中度	女粉 + 精妈占比	高→后	9.5%
6	观众集中度	观众精妈/Z 世代占比	高→后	8.4%
7	时效	距上次发视频天数	多→后	4.7%
8	粉丝下沉度	三四线城市粉丝占比	高→后	4.0%
9	投放类型	看后搜率	高→后	2.9%
10	账号调性	调性分（LLM 自评 0-10）	高→后	2.5%
11	体量	粉丝量 log	多→前	1.6%
12	CPM 档位	CPM 档位	高→后	1.5%
13	商业身份	是否有 MCN	有→后	1.1%

总占比 100%，最大权重「内容表现」（爆文率）22.0%。
拟合质量：前 5 名命中率 0.813（线性模型天花板，非线性树模型可再提 5 点，留作后续优化）。

三、借鉴：老 web 版做对了什么参考

虽然老 web 版的整体排序也有「全局高分但项目不相关」的痛点，但有一件事它做对了：内置「自家达人加权」机制。

3.1 老版 80 分公式

子项	满分
近期商单数	20
达人身份（自家=15 / VIP=10 / 合作过=5）	15
CPM 档位	15
播放趋势	10
八大人群占比	10
返点	5
触达粉丝	5

3.2 关键借鉴：身份加权机制

老版「身份分」占 15/80 = 19% 权重，自家独家固定加 15 分，VIP 加 10 分，合作过加 5 分。这套机制运营熟悉、品牌方认可，新方案要继承这套思路。

四、新排序规则 P0

4.1 综合公式

排序分 = 拟合星图的 13 维公式 + 老 web 版的自家身份加权

4.2 13 维主公式（OLS 拟合最优权重）

排序分 =
 -22.0% × z(爆文率)                   ← 内容表现 [最大权重]
 -17.4% × 是否一线城市                 ← 达人地域
 +13.1% × z(观众四线占比)             ← 观众下沉度
 -11.2% × z(log10商单数)             ← 商业表现
 + 9.5% × z(女粉+精妈占比)            ← 粉丝集中度
 + 8.4% × z(观众精妈/Z世代占比)        ← 观众集中度
 + 4.7% × z(距上次发视频天数)         ← 时效
 + 4.0% × z(三四线粉丝占比)           ← 粉丝下沉度
 + 2.9% × z(看后搜率)                ← 投放类型
 + 2.5% × z(调性分)                  ← 账号调性
 - 1.6% × z(log10粉丝量)             ← 体量
 + 1.5% × z(CPM档位分)               ← CPM 档位
 + 1.1% × MCN 标志                    ← 商业身份

4.3 自家身份加权（借鉴老 web 版）

在主公式分基础上独立叠加：

自家独家

-2.0

自家

-1.5

VIP

-1.0

合作过

-0.5

其他

0

自家独家加权 -2.0 ≈ 主公式最大单项的 13 倍 z-score 偏移，保证自家独家几乎必进首屏。

4.4 配额兜底（关键）

第一页（前 20 名）至少有 1 个自家达人。 光靠加权不够，可能自家达人特征本身差导致排不到首屏。不够时从第 21+ 找最高分的自家达人提到首屏。

4.5 排序优先级

1

13 维主公式分 + 自家身份加权

主排序，越小越靠前

2

配额兜底

首屏 ≥ 1 个自家达人

3

粉丝数

同分时打破平局

权重存配置表，PM 可调；自家加权独立可调，不影响主公式。

五、三版本横向对比业务视角

不看技术细节，运营/PM 一眼看清三套方案的区别。

5.1 谁排前？谁排后？

看什么	老 web 版	现行 v4 版	新方案（推荐）
谁最容易上首屏	商单多 + 自家 VIP	通过率高 + 返点高	一二线粉丝多 + 大众化达人
谁会被往后排	没商单 + 价格虚高	没通过过 + 返点低	三四线粉丝多 + 垂类标签集中
自家独家什么待遇	+15 固定	不区分	强加权 + 配额兜底（首屏必有）
返点权重	6%，轻	30%，重	0%，完全踢出（仅作筛选）
通过率权重	不参与	23%，重	不参与
最大单项权重	25%（商单）	35%（CPM）	22%（爆文率）

5.2 业务感受对比

业务场景	老 web 版	现行 v4 版	新方案
媒介看首屏	「都是熟号」	「前几个全是垃圾」	「跟星图首屏差不多」
品牌客户看首屏	「商业达人多」	「这些号我都没听过」	「都是大牌好号」
自家独家曝光	有，固定加分	看运气	必有，配额保底
调权重需要	改 PHP + 发版	改 Python + 发版	改配置表，不发版

5.3 最高单项权重对比

老 web 版

最高权重

近期商单数

25%

商单多就能霸屏

现行 v4 版

最高权重

CPM 档位

35%

单一维度过度主导

新方案

最高权重

爆文率

22%

能不能出爆款是关键

六、上线 + 验收 P0

6.1 上线步骤

阶段	动作
第 1 天	离线算 13 维权重 + 全库预计算每个达人的排序分
第 2 天	排序逻辑接入 + 自家身份加权 + 配额兜底
第 3 天	测试服跑通，运营盲测 5 个查询
第 4 天	灰度 50% 流量
第 5 天	全量上线

6.2 唯一验收指标

前几屏通过率变化（手动评分 1/2/3 占比）：

位置	上线前	上线后目标
前 1 屏（前 20 名）通过率	待统计	≥ 提升 20%
前 2 屏（前 40 名）通过率	待统计	≥ 提升 15%
前 3 屏（前 60 名）通过率	待统计	≥ 提升 10%

回滚条件：上线后 3 天前 1 屏通过率没提升，立即回滚。

达人排序重构

〇、背景 P0

0.1 品牌客户吐槽

0.2 媒介反馈

0.3 改动边界

一、现状：v4 现行排序怎么做的 P0

三大病灶

二、调研：拟合星图排序 P0

2.1 数据基础

2.2 调研规模：跑了 80+ 个本地特征

2.3 四个核心发现

2.4 拟合结果：星图 13 维排序公式

三、借鉴：老 web 版做对了什么 参考

3.1 老版 80 分公式

3.2 关键借鉴：身份加权机制

四、新排序规则 P0

4.1 综合公式

4.2 13 维主公式（OLS 拟合最优权重）

4.3 自家身份加权（借鉴老 web 版）

4.4 配额兜底（关键）

4.5 排序优先级

五、三版本横向对比 业务视角

5.1 谁排前？谁排后？

5.2 业务感受对比

5.3 最高单项权重对比

六、上线 + 验收 P0

6.1 上线步骤

6.2 唯一验收指标

三、借鉴：老 web 版做对了什么参考

五、三版本横向对比业务视角