达人排序重构

v4 现行排序质量被吐槽 → 我们采集了星图原始排序拟合规律 → 结合老 web 版的自家加权思路 → 出一套新排序规则
Chief · AI 选号工作室 · 2026-04-28 · v4

〇、背景 P0

现行 AI 选号排序质量持续被吐槽,首屏推出来的达人质量明显跟不上,问题已经传导到客户端。

0.1 品牌客户吐槽

0.2 媒介反馈

0.3 改动边界

不做
重构主排序逻辑:数据驱动公式 + 自家身份加权 + 配额兜底不动筛选条件、不动现有公式(保留作长尾兜底)、不动前端 UI、不上 ML 模型

一、现状:v4 现行排序怎么做的 P0

现行 v4 主排序按「现行综合分」降序,副排序按粉丝数降序。综合分总分 0–115,五大子项构成:

子项满分占比业务解读
历史通过率26
22.6%
通过过 = 排前
CPM 档位40
34.8%
CPM 越低越加分
返点档位35
30.4%
返点越高越加分
趋势奖励4
3.5%
通过率上升加分
活跃度10
8.7%
近期下单越近越加分

三大病灶

  1. 通过率 + 返点合计 53%,正中运营吐槽两条红线(「通过 ≠ 质量」「返点不该主导」)
  2. 公式只覆盖 30% 达人(17 万达人只 4.5 万有分)
  3. 跟市场认可度脱钩:与星图原始排名相关性近乎 0(ρ=-0.06)

二、调研:拟合星图排序 P0

为搞清「真正好的排序应该怎样」,我们用了一个最权威的参考标准 —— 星图(抖音官方达人广告平台)的默认排序

2.1 数据基础

2.2 调研规模:跑了 80+ 个本地特征

涵盖:基础属性、粉丝侧八大人群/年龄/城市、观众侧八大人群/年龄/城市、视频聚合、CPM/CPE 档位、商单数据、看后搜、调性分、内容标签 等。

2.3 四个核心发现

发现解读
强信号集中在「人群分布」维度粉丝侧 + 观众侧的 8 大人群 / 年龄 / 城市分布是最强信号源
几乎所有「人群占比」都是 +ρ占比高 → 排后。星图要观众分散的大众化达人,不要垂类
视频侧反直觉商单数、爆文率有信号;平均播放量、互动率、点赞数全是噪声
看后搜率 +0.32转化型达人扣分,曝光型达人加分(首屏是品牌广告位)

2.4 拟合结果:星图 13 维排序公式

用 6.7 万行星图样本跑多元线性回归(OLS),让数据自己算出每个维度的最优权重:

#维度代表特征方向权重占比
1内容表现爆文率(>10w 播放视频占比)高→前
22.0%
2达人地域是否一线城市是→前
17.4%
3观众下沉度观众四线城市占比高→后
13.1%
4商业表现近 90 天商单数多→前
11.2%
5粉丝集中度女粉 + 精妈占比高→后
9.5%
6观众集中度观众精妈/Z 世代占比高→后
8.4%
7时效距上次发视频天数多→后
4.7%
8粉丝下沉度三四线城市粉丝占比高→后
4.0%
9投放类型看后搜率高→后
2.9%
10账号调性调性分(LLM 自评 0-10)高→后
2.5%
11体量粉丝量 log多→前
1.6%
12CPM 档位CPM 档位高→后
1.5%
13商业身份是否有 MCN有→后
1.1%
总占比 100%,最大权重「内容表现」(爆文率)22.0%
拟合质量:前 5 名命中率 0.813(线性模型天花板,非线性树模型可再提 5 点,留作后续优化)。

三、借鉴:老 web 版做对了什么 参考

虽然老 web 版的整体排序也有「全局高分但项目不相关」的痛点,但有一件事它做对了:内置「自家达人加权」机制。

3.1 老版 80 分公式

子项满分
近期商单数20
达人身份(自家=15 / VIP=10 / 合作过=5)15
CPM 档位15
播放趋势10
八大人群占比10
返点5
触达粉丝5

3.2 关键借鉴:身份加权机制

老版「身份分」占 15/80 = 19% 权重,自家独家固定加 15 分,VIP 加 10 分,合作过加 5 分。 这套机制运营熟悉、品牌方认可,新方案要继承这套思路

四、新排序规则 P0

4.1 综合公式

排序分 = 拟合星图的 13 维公式 + 老 web 版的自家身份加权

4.2 13 维主公式(OLS 拟合最优权重)

排序分 =
 -22.0% × z(爆文率)                   ← 内容表现 [最大权重]
 -17.4% × 是否一线城市                 ← 达人地域
 +13.1% × z(观众四线占比)             ← 观众下沉度
 -11.2% × z(log10商单数)             ← 商业表现
 + 9.5% × z(女粉+精妈占比)            ← 粉丝集中度
 + 8.4% × z(观众精妈/Z世代占比)        ← 观众集中度
 + 4.7% × z(距上次发视频天数)         ← 时效
 + 4.0% × z(三四线粉丝占比)           ← 粉丝下沉度
 + 2.9% × z(看后搜率)                ← 投放类型
 + 2.5% × z(调性分)                  ← 账号调性
 - 1.6% × z(log10粉丝量)             ← 体量
 + 1.5% × z(CPM档位分)               ← CPM 档位
 + 1.1% × MCN 标志                    ← 商业身份

4.3 自家身份加权(借鉴老 web 版)

在主公式分基础上独立叠加:

自家独家
-2.0
自家
-1.5
VIP
-1.0
合作过
-0.5
其他
0
自家独家加权 -2.0 ≈ 主公式最大单项的 13 倍 z-score 偏移,保证自家独家几乎必进首屏

4.4 配额兜底(关键)

第一页(前 20 名)至少有 1 个自家达人。 光靠加权不够,可能自家达人特征本身差导致排不到首屏。不够时从第 21+ 找最高分的自家达人提到首屏。

4.5 排序优先级

1
13 维主公式分 + 自家身份加权
主排序,越小越靠前
2
配额兜底
首屏 ≥ 1 个自家达人
3
粉丝数
同分时打破平局

权重存配置表,PM 可调;自家加权独立可调,不影响主公式。

五、三版本横向对比 业务视角

不看技术细节,运营/PM 一眼看清三套方案的区别。

5.1 谁排前?谁排后?

看什么老 web 版现行 v4 版新方案(推荐)
谁最容易上首屏商单多 + 自家 VIP通过率高 + 返点高一二线粉丝多 + 大众化达人
谁会被往后排没商单 + 价格虚高没通过过 + 返点低三四线粉丝多 + 垂类标签集中
自家独家什么待遇+15 固定不区分强加权 + 配额兜底(首屏必有)
返点权重6%,轻30%,重0%,完全踢出(仅作筛选)
通过率权重不参与23%,重不参与
最大单项权重25%(商单)35%(CPM)22%(爆文率)

5.2 业务感受对比

业务场景老 web 版现行 v4 版新方案
媒介看首屏「都是熟号」「前几个全是垃圾」「跟星图首屏差不多」
品牌客户看首屏「商业达人多」「这些号我都没听过」「都是大牌好号」
自家独家曝光有,固定加分看运气必有,配额保底
调权重需要改 PHP + 发版改 Python + 发版改配置表,不发版

5.3 最高单项权重对比

老 web 版
最高权重
近期商单数
25%
商单多就能霸屏
现行 v4 版
最高权重
CPM 档位
35%
单一维度过度主导
新方案
最高权重
爆文率
22%
能不能出爆款是关键

六、上线 + 验收 P0

6.1 上线步骤

阶段动作
第 1 天离线算 13 维权重 + 全库预计算每个达人的排序分
第 2 天排序逻辑接入 + 自家身份加权 + 配额兜底
第 3 天测试服跑通,运营盲测 5 个查询
第 4 天灰度 50% 流量
第 5 天全量上线

6.2 唯一验收指标

前几屏通过率变化(手动评分 1/2/3 占比):

位置上线前上线后目标
前 1 屏(前 20 名)通过率待统计≥ 提升 20%
前 2 屏(前 40 名)通过率待统计≥ 提升 15%
前 3 屏(前 60 名)通过率待统计≥ 提升 10%
回滚条件:上线后 3 天前 1 屏通过率没提升,立即回滚。