现行 AI 选号排序质量持续被吐槽,首屏推出来的达人质量明显跟不上,问题已经传导到客户端。
| 做 | 不做 |
|---|---|
| 重构主排序逻辑:数据驱动公式 + 自家身份加权 + 配额兜底 | 不动筛选条件、不动现有公式(保留作长尾兜底)、不动前端 UI、不上 ML 模型 |
现行 v4 主排序按「现行综合分」降序,副排序按粉丝数降序。综合分总分 0–115,五大子项构成:
| 子项 | 满分 | 占比 | 业务解读 |
|---|---|---|---|
| 历史通过率 | 26 | 通过过 = 排前 | |
| CPM 档位 | 40 | CPM 越低越加分 | |
| 返点档位 | 35 | 返点越高越加分 | |
| 趋势奖励 | 4 | 通过率上升加分 | |
| 活跃度 | 10 | 近期下单越近越加分 |
为搞清「真正好的排序应该怎样」,我们用了一个最权威的参考标准 —— 星图(抖音官方达人广告平台)的默认排序。
涵盖:基础属性、粉丝侧八大人群/年龄/城市、观众侧八大人群/年龄/城市、视频聚合、CPM/CPE 档位、商单数据、看后搜、调性分、内容标签 等。
| 发现 | 解读 |
|---|---|
| 强信号集中在「人群分布」维度 | 粉丝侧 + 观众侧的 8 大人群 / 年龄 / 城市分布是最强信号源 |
| 几乎所有「人群占比」都是 +ρ | 占比高 → 排后。星图要观众分散的大众化达人,不要垂类 |
| 视频侧反直觉 | 商单数、爆文率有信号;平均播放量、互动率、点赞数全是噪声 |
| 看后搜率 +0.32 | 转化型达人扣分,曝光型达人加分(首屏是品牌广告位) |
用 6.7 万行星图样本跑多元线性回归(OLS),让数据自己算出每个维度的最优权重:
| # | 维度 | 代表特征 | 方向 | 权重占比 |
|---|---|---|---|---|
| 1 | 内容表现 | 爆文率(>10w 播放视频占比) | 高→前 | |
| 2 | 达人地域 | 是否一线城市 | 是→前 | |
| 3 | 观众下沉度 | 观众四线城市占比 | 高→后 | |
| 4 | 商业表现 | 近 90 天商单数 | 多→前 | |
| 5 | 粉丝集中度 | 女粉 + 精妈占比 | 高→后 | |
| 6 | 观众集中度 | 观众精妈/Z 世代占比 | 高→后 | |
| 7 | 时效 | 距上次发视频天数 | 多→后 | |
| 8 | 粉丝下沉度 | 三四线城市粉丝占比 | 高→后 | |
| 9 | 投放类型 | 看后搜率 | 高→后 | |
| 10 | 账号调性 | 调性分(LLM 自评 0-10) | 高→后 | |
| 11 | 体量 | 粉丝量 log | 多→前 | |
| 12 | CPM 档位 | CPM 档位 | 高→后 | |
| 13 | 商业身份 | 是否有 MCN | 有→后 |
虽然老 web 版的整体排序也有「全局高分但项目不相关」的痛点,但有一件事它做对了:内置「自家达人加权」机制。
| 子项 | 满分 |
|---|---|
| 近期商单数 | 20 |
| 达人身份(自家=15 / VIP=10 / 合作过=5) | 15 |
| CPM 档位 | 15 |
| 播放趋势 | 10 |
| 八大人群占比 | 10 |
| 返点 | 5 |
| 触达粉丝 | 5 |
排序分 = -22.0% × z(爆文率) ← 内容表现 [最大权重] -17.4% × 是否一线城市 ← 达人地域 +13.1% × z(观众四线占比) ← 观众下沉度 -11.2% × z(log10商单数) ← 商业表现 + 9.5% × z(女粉+精妈占比) ← 粉丝集中度 + 8.4% × z(观众精妈/Z世代占比) ← 观众集中度 + 4.7% × z(距上次发视频天数) ← 时效 + 4.0% × z(三四线粉丝占比) ← 粉丝下沉度 + 2.9% × z(看后搜率) ← 投放类型 + 2.5% × z(调性分) ← 账号调性 - 1.6% × z(log10粉丝量) ← 体量 + 1.5% × z(CPM档位分) ← CPM 档位 + 1.1% × MCN 标志 ← 商业身份
在主公式分基础上独立叠加:
权重存配置表,PM 可调;自家加权独立可调,不影响主公式。
不看技术细节,运营/PM 一眼看清三套方案的区别。
| 看什么 | 老 web 版 | 现行 v4 版 | 新方案(推荐) |
|---|---|---|---|
| 谁最容易上首屏 | 商单多 + 自家 VIP | 通过率高 + 返点高 | 一二线粉丝多 + 大众化达人 |
| 谁会被往后排 | 没商单 + 价格虚高 | 没通过过 + 返点低 | 三四线粉丝多 + 垂类标签集中 |
| 自家独家什么待遇 | +15 固定 | 不区分 | 强加权 + 配额兜底(首屏必有) |
| 返点权重 | 6%,轻 | 30%,重 | 0%,完全踢出(仅作筛选) |
| 通过率权重 | 不参与 | 23%,重 | 不参与 |
| 最大单项权重 | 25%(商单) | 35%(CPM) | 22%(爆文率) |
| 业务场景 | 老 web 版 | 现行 v4 版 | 新方案 |
|---|---|---|---|
| 媒介看首屏 | 「都是熟号」 | 「前几个全是垃圾」 | 「跟星图首屏差不多」 |
| 品牌客户看首屏 | 「商业达人多」 | 「这些号我都没听过」 | 「都是大牌好号」 |
| 自家独家曝光 | 有,固定加分 | 看运气 | 必有,配额保底 |
| 调权重需要 | 改 PHP + 发版 | 改 Python + 发版 | 改配置表,不发版 |
| 阶段 | 动作 |
|---|---|
| 第 1 天 | 离线算 13 维权重 + 全库预计算每个达人的排序分 |
| 第 2 天 | 排序逻辑接入 + 自家身份加权 + 配额兜底 |
| 第 3 天 | 测试服跑通,运营盲测 5 个查询 |
| 第 4 天 | 灰度 50% 流量 |
| 第 5 天 | 全量上线 |
前几屏通过率变化(手动评分 1/2/3 占比):
| 位置 | 上线前 | 上线后目标 |
|---|---|---|
| 前 1 屏(前 20 名)通过率 | 待统计 | ≥ 提升 20% |
| 前 2 屏(前 40 名)通过率 | 待统计 | ≥ 提升 15% |
| 前 3 屏(前 60 名)通过率 | 待统计 | ≥ 提升 10% |