跳转至

1.3 量化全市场选股 / 小市值 / AI 选股

不锚定单一指数的量化策略。看起来更自由,实际上更难。

这一类策略最近 5 年是国内私募量化的高速扩张区,也是争议最大、最容易翻车的区域。


一、这一类策略的画像

1.1 什么是"全市场选股"

严格定义

不以单一指数(沪深 300 / 中证 500 / 中证 1000)为基准,而是在全市场所有可投股票(A 股 5000+ 只)中进行量化选股的多头策略。

与指增的本质区别

维度 指数增强 全市场选股
基准 明确指数 自定义(中证全指 / 偏股基金指数 / 自定义)
跟踪误差 控制在 5-8% 不控制(可能 15%+)
持仓股票池 主要在指数成分股 全市场
风格暴露 与基准接近 自由偏离
选股池规模 300-2000 只 5000+ 只
超额计算 减去基准指数 减去自定义基准(可争议)

一句话:指增是"在框架内做超额",全市场选股是"自己定义框架"。

1.2 主流子类型

(a) 全市场量化多头(无明显风格偏向)

特征: - 平衡选股,不锚定特定市值或风格 - 通常对标"中证全指"或"偏股基金指数" - 持仓数量 100-500 只 - 国内代表:明汯量化精选、衍复全市场等

(b) 小市值 / 微盘策略

特征: - 严格选小市值股票(流通市值 < 50 亿,甚至 < 20 亿) - 持仓极度分散(300-1000 只,避免流动性风险) - 对标中证 2000 / 国证 2000 / 自定义微盘指数 - 国内代表:彬元天源量化("空指增强"实际上就是这类)

为什么"小市值策略"在 2024-2025 年特别热: - 2014-2016 年小市值 vs 大市值的"风格补涨" - 2024-2025 年微盘股 alpha 复苏 - 传统量化指增超额衰减后,资金涌入小市值寻求高收益 - 但小市值的"风格 β"和"管理人 α"极难分离(详见 4 节)

(c) AI 选股 / 端到端神经网络

特征: - 用深度学习(CNN / Transformer / LSTM)从原始数据预测股票收益 - 弱化人工因子设计,依赖模型自主学习 - 训练数据通常包含价量、基本面、舆情、宏观等多源数据 - 国内代表:九坤、明汯部分线、衍复部分线(多家头部都在做)

AI 选股的优劣

优点 缺点
能捕捉非线性关系 可解释性差
处理高维数据有优势 过拟合风险高
可端到端优化 黑盒 → 难于风险管控
边际改进空间大 训练数据有限(A 股历史短)

(d) 多策略 / 组合型

特征: - 把指增、市场中性、CTA 等子策略组合起来 - 通常以"全天候"、"风险平价"等概念包装 - 内部各子策略权重动态调整 - 容易出现"听起来很厉害,归因说不清"的情况


二、关键名词深度拆解

2.1 自定义基准(Custom Benchmark)

定义:管理人自己选择或合成的业绩比较基准,不是市场公认指数。

常见形式: - "中证 800 + 中证 1000 + 中证 2000 加权" - "偏股基金指数"(中证基金指数) - "wind 全 A 等权" - "我们自己的因子选股池"

为什么这是个重要警示信号**:

自定义基准给了管理人操纵超额的空间: - 在不同市场环境下选择对自己有利的基准 - 用低于市场的基准让超额"看起来很高" - 拒绝按公认指数比较

实战例子

某管理人产品 2024 年涨 +15%。 - 对比沪深 300(涨 +15%):超额 0% - 对比中证全指(涨 +12%):超额 3% - 对比"30%沪深300+30%中证500+40%中证1000"自定义基准(涨 +8%):超额 7%

不同基准下"超额"完全不同。基准选择本身就是结果设计

正确处理: - 在合同里明确锁定一个公认基准 - 即使产品名称是"全市场选股",自己用沪深 300 或偏股基金指数做内部参考

尽调追问: - "你们的业绩比较基准是什么?为什么选这个?" - "如果换成沪深 300 / 偏股基金指数对比,超额是多少?" - "你们对内汇报用什么基准?对外路演用什么基准?"

2.2 跟踪误差不受控

含义:全市场选股策略没有跟踪误差约束,意味着产品收益和任何指数都可能差距很大。

对投资人的影响

  • LP 买入时心里有一个"指数基准"(可能是沪深 300)
  • 产品实际收益和这个基准长期偏离时,LP 体感差
  • 即使长期超额好,短期跟踪误差大会触发 LP 心理压力

实例

2024 年沪深 300 涨 +15%,某全市场选股产品涨 +5%。 - LP 想:我买了股票产品,沪深 300 涨这么多,我才赚 5%? - 管理人解释:我们做小市值,今年小市值涨得少,但中长期超额好 - LP 的心智模型和管理人的模型不在同一个频道上

这是全市场选股的根本痛点:长期收益可能更好,但短期波动和指数脱钩让 LP 难持有。

尽调要点:必须在投前和 LP(如果是给 LP 配置的话)讲清楚"短期会偏离指数"。

2.3 风格暴露 / 风格 β(Style Exposure)

定义:产品收益对各风格因子(Size / Value / Quality / Momentum 等)的敏感度。

Barra 因子模型(详见卷二 2.8 + 卷三 3.3):

产品月度收益 = α + Σ βi * Fi + ε

其中 Fi 是 i 风格因子的月度收益,βi 是产品对该因子的暴露系数。

主流风格因子(Barra CNE5 / CNE6):

因子名 含义 国内表现
Size(市值) 小市值 vs 大市值 周期性极强
Beta 股票贝塔(系统风险) 稳定
Momentum 动量 在 A 股偏弱
Residual Volatility 残差波动率 低波异象
Non-linear Size 非线性市值(中盘溢价) 周期性
Book-to-Price 账面价值 / 市值(BP) 偏弱
Liquidity 换手率 中等
Earnings Yield 盈利收益率 中等
Growth 成长 周期性
Leverage 杠杆

全市场策略的风格暴露往往隐藏巨大风险

  • "全市场选股 +50% 收益" → 但其中 +30% 是小市值风格 β
  • 当小市值风格反转,产品立刻 -20%
  • 看似 alpha 实际是 β

这是判断这类策略真假的核心。详见 4 节。

2.4 流动性风险(在小市值策略里被放大)

定义:股票成交量小,大额买卖会显著推高 / 压低价格,造成执行成本。

对小市值 / 微盘策略的特殊影响

  • 微盘股日均成交额 1000 万 - 5000 万
  • 100 亿规模的产品要建仓 100 只微盘股,每只持仓 1 亿
  • 单只 1 亿 vs 日均 3000 万成交额 = 3 个交易日才能建完一只仓
  • 卖出时同样 → 实际 alpha 被冲击成本吃掉

冲击成本(Implementation Cost)的数学

冲击成本(bp)≈ k * sqrt(订单量 / 日均成交量)

k 是市场冲击系数(A 股小盘股约 50-100 bp)。

举例: - 订单量 / 日均成交量 = 0.5(订单是日成交量一半) - 冲击成本 ≈ 50 * sqrt(0.5) = 35 bp

如果一只小市值股票日均成交 3000 万,你想买 1500 万: - 冲击成本约 35 bp = 0.35% - 来回(买入 + 卖出)就是 0.7% - 一年换手 5 次 → 累计冲击成本 3.5%

这是为什么小市值策略容量极小:规模一大,冲击成本吃光超额。

尽调追问: - "你们小市值策略的容量上限怎么估算?冲击成本模型?" - "实盘冲击成本(基点)vs 模型预估?" - "持仓股票的日均成交额分布?最低多少?"

2.5 极度分散持仓(Highly Diversified Positions)

定义:持仓数量极多(500-2000 只),单只股票占比极小(< 0.5%)。

为什么需要

小市值 / 微盘策略必须分散: - 单只小市值股票流动性差 → 持仓占比不能太大(否则冲击成本爆表) - 单只小市值股票个体风险大(退市、停牌)→ 必须分散对冲

典型持仓数量

策略 持仓数量 单只占比
主观多头 30-100 只 1-5%
量化指增 200-500 只 0.2-0.5%
全市场选股 100-500 只 0.2-1%
小市值策略 500-2000 只 < 0.5%
微盘策略 1000-3000 只 < 0.1%

极度分散的含义

  • 本质上是"小市值指数 + 因子加权",而非传统意义的"选股"
  • 个股 alpha 贡献小,风格 β 贡献大
  • 业绩取决于"小市值 vs 大市值"风格,而非"选对了哪几只小市值"

这就引出下一节的核心问题:真假 alpha

2.6 因子拥挤度(Factor Crowding)

定义:多家管理人使用相似因子或策略,导致信号挤占同一批股票。

为什么对小市值策略尤其重要

  • 小市值股票 alpha 容量本来就小
  • 多家管理人都做小市值 → 大家买同一批小盘股 → 推高估值
  • 风格反转时 → 大家同时出货 → 拥挤踩踏

实例:2024 年 1-2 月微盘股雪崩 - 全市场量化微盘策略合计规模约 2000-3000 亿 - 持仓相似度极高(都依赖类似的小市值因子) - 1 月 25 日开始集中赎回 + 减仓 - 微盘指数 5 个交易日跌 -30% - 多家"全市场量化"产品单周回撤 -15% ~ -25%

这是结构性风险,不是单家管理人能控制的。

尽调追问: - "你们对自己策略的拥挤度有监控吗?" - "2024 年 1-2 月微盘股回撤期,你们产品回撤多少?怎么处理的?" - "如果再发生类似事件,你们的应对预案?"


三、超额(α)的拆解

3.1 全市场策略的超额来源

理论上,全市场策略的超额来自两部分

全市场策略 α = 风格暴露收益(风格 β)+ 真 α(个股选择 + 时序信号)

但很多管理人把"风格 β"当成"alpha"卖。这是这类策略最大的认知陷阱。

(a) 风格暴露收益(看起来像 α,实际上是 β)

例子:2024 年小市值风格年化贡献 +20%。一个"全市场选股"产品长期超配小市值,年化收益跑赢沪深 300 + 25%。

  • 表面:管理人"选股能力强",年化 alpha +25%
  • 实际:风格 β 贡献 +20%,真 α 只有 +5%

当小市值风格反转(2025 年某月小市值跌 -15%): - 管理人会回撤 -10% ~ -15% - 投资人会震惊:"不是说 alpha 稳定吗?"

判断方法

用 Barra 模型回归,剥离风格 β 后看残差 α: - 残差 α / 总超额 > 70%:真本事 - 残差 α / 总超额 30-70%:混合,看哪部分主导 - 残差 α / 总超额 < 30%:本质是风格暴露包装

详见卷三 3.3 风格因子归因

(b) 真 α 的来源

剥离风格后剩下的 α,来自:

  1. 个股层面 α:在同一风格内,选对 / 避开个股
  2. 时序信号 α:捕捉短期事件机会
  3. 风格择时 α:不同时点切换风格暴露

第 3 项极难做到(择时类几乎都失败),主要靠 1 + 2。

3.2 小市值策略的特殊归因

小市值策略的真 α 应该来自

  • 个股选择:在 2000+ 微盘股里避开雷股(业绩造假、退市、被立案)
  • 流动性管理:买流动性相对好的微盘
  • 事件捕捉:业绩预告、并购重组等

判断: - 看产品长期表现 vs 中证 2000 / 微盘指数: - 长期跑赢微盘指数 5%+ → 有真 α - 长期与微盘指数贴近 → 本质是被动微盘指数 - 跑输微盘指数 → 选股能力为负

很多"小市值量化"长期表现接近微盘指数,意思是:他们靠"买入持有 + 等待小市值风格 β",没有真正的选股能力。

3.3 AI 选股的归因难题

AI 模型是黑盒,归因极难

判断 AI 选股真假的间接方法

  1. 模型迭代频率:真做 AI 的,每月迭代模型;不做的,一年不动
  2. 特征工程深度:问"输入特征有多少维度?分别是什么类别?"
  3. 过拟合检验:要求看out-of-sample测试结果(用未来数据测过去训练的模型)
  4. 回测 vs 实盘衰减率:AI 模型衰减率 30-50% 是常态,> 60% 很可能过拟合
  5. risk budgeting:AI 模型应该有 portfolio level 风控,不能"模型说什么就买什么"

红旗: - 拒绝讨论模型细节("商业机密") - 回测超额 > 实盘超额 2 倍以上 - 模型一年不更新 - 单一模型贡献全部超额


四、容量天花板

4.1 全市场选股的容量

理论上比指增容量大(选股池更广)。

实际上取决于风格

  • 大盘风格 → 容量大(500-2000 亿)
  • 中盘风格 → 容量中等(200-500 亿)
  • 小市值 / 微盘 → 容量小(30-100 亿)

4.2 小市值策略的容量上限

严格上限整个微盘股市场的容量决定

  • 中证 2000 流通市值约 2-3 万亿
  • 微盘股(< 50 亿市值)合计流通约 1-2 万亿
  • 全行业小市值量化策略合计规模 ≤ 5000 亿是健康上限
  • 单家管理人:50-100 亿很难再扩

实证:彬元天源量化规模 < 5 亿(2026 一季度),还在容量舒服区。如果未来扩到 30-50 亿,超额可能腰斩。

4.3 容量见顶的早期信号

  • 同业拥挤度上升(多家管理人都在小市值)
  • 微盘股估值相对中证 500 创历史高位
  • 单只微盘股的成交额异常上升(量化集体进场推高换手)
  • 最近 3-6 个月超额 vs 历史中位数下滑

五、绩效指标的特殊性

5.1 全市场策略不能只看绝对收益

关键拆解: - 绝对收益 = 选定基准的 β + 风格暴露 + 真 α - 真 α 才是付费的部分

正确指标: - alpha vs 中证全指(最公允) - 风格中性后的 α(用 Barra 模型剥离风格) - 超额 Sharpe(基于"alpha vs 中证全指"序列) - 风格暴露的稳定性(暴露突然变化是风格漂移)

5.2 小市值策略的绩效幻觉

幻觉来源

2024-2025 年小市值风格累计 +60%(年化 +25%+)。任何一只一直持有小市值的产品都会显得很厉害

正确视角

  • 拿产品 vs 中证 2000 全收益指数比较
  • 拿产品 vs 同类小市值策略中位数比较
  • 看产品在小市值风格下行期(2017、2021、2024-Q1)的表现

如果一个小市值策略只在小市值风格上行期跑得好,下行期跌得多,那它本质就是"小市值 β",不是真 α。

5.3 AI 选股的绩效解读

  • 短期业绩不能信(可能是模型刚好踩对节奏)
  • 至少要 24 个月日频数据 + 跨越多个市场环境
  • 关注模型表现是否随市场风格变化而显著变化(应该相对稳定,否则是过拟合)

六、骗术与陷阱

6.1 "全市场选股"包装 "小市值赌博"

话术:"我们做全市场选股,不局限于某个指数,灵活度高。"

真相:实际上 80% 仓位在小市值股票上,本质就是小市值赌博,但用"全市场"模糊掉风格暴露。

识别: - 看持仓的市值分布(如果中位数市值 < 50 亿 = 本质小市值) - 看 Barra 风格暴露(Size 因子暴露 > 1.0 = 严重小市值偏好) - 看产品和小市值指数的相关性(> 0.85 = 本质小市值)

6.2 "AI 加持" 的虚词

话术:"我们用最先进的 Transformer 模型 + 自研因子库,alpha 稳定。"

陷阱: - "最先进的 Transformer" 可能是市面上开源的标准实现 - "自研因子库" 可能就是几十个公开因子的组合 - "alpha 稳定" 可能只是过拟合的回测结果

识别: - 问技术细节(多大模型?多少参数?训练数据量?) - 看实盘 vs 回测衰减率 - 问研发团队(PhD 多少?多少 ML 背景?多少 Quant 背景?) - 看技术投入(IT / GPU 集群规模)

6.3 "回测年化 50%" 的诱惑

陷阱:回测年化 50% 的策略,实盘几乎一定 < 20%。

衰减来源: 1. 过拟合:模型记住了历史,未来不一样 2. 冲击成本:回测假设无成本,实盘有 3. 流动性限制:回测假设无限流动性,实盘限制 4. 机制变化:监管 / 涨跌停 / T+0 试点等 5. 同业拥挤:你做的策略别人也做,超额衰减

正确视角: - 看实盘连续 24 个月+ 的真实业绩 - 回测仅作"是否值得继续看"的初筛

6.4 "微盘股 alpha 永续" 的迷思

话术:2024-2025 年微盘股暴涨,多家管理人说"微盘股 alpha 是结构性的,可以长期持有"。

陷阱

历史数据:

时期 微盘相对沪深300 持续时间
2014-2015 上半年 +120% 18 月
2015 下半年-2018 -55% 30 月
2019-2020 -10% 24 月
2021-2023 +50% 36 月
2024 年 1-2 月 -30% 5 周
2024 年 3 月-2025 +40% 反弹后

结论:微盘股是周期性极强的风格,没有"永续 alpha"

任何说"微盘股可以长期持有"的,要么不懂周期、要么在卖产品。

6.5 "我们风格中性" 的狡辩

话术:"我们策略是风格中性的,alpha 来自纯选股能力。"

陷阱:可能只是回测里风格中性,实盘有显著风格偏好。

识别

要管理人发月度风格暴露报告(Size / Value / Quality 等因子的月度 β 系数)。如果某个因子的 β 持续 > 0.3 或 < -0.3,就不是真正的中性。

6.6 "策略容量很大" 的销售话术

话术:"我们的策略容量很大,预计可以做到 200 亿。"

陷阱:估算容量需要严格的方法论(信号强度 / 冲击成本 / 同业拥挤),很多管理人没有方法论,只有销售目标

识别: - 问"容量怎么估的?方法论是什么?" - 问"你们当前规模 / 容量上限的比例?" - 问"如果规模到容量上限的 80%,你们会不会主动封盘?"

愿意主动封盘的 = 重视 alpha 持续性 不愿意 = 重规模轻 alpha


七、尽调追问清单

A. 策略本质识别

  1. 业绩比较基准:什么基准?为什么选这个?合同里写的是什么?
  2. 风格暴露:Barra 因子暴露(Size / Value / Quality / Momentum)的目标值和实际值?
  3. 市值分布:持仓股票的市值中位数是多少?最小市值多少?分布图?
  4. 持仓股票数量:通常多少只?最多 / 最少?
  5. 跟踪误差(vs 中证全指 / 沪深 300)的实际值?

B. 超额拆解

  1. 超额来源拆分:风格 β / 个股 alpha / 事件 alpha 各占多少?
  2. 风格中性后的 alpha:用 Barra 风格剥离后,残差 alpha 是多少?占总超额比例?
  3. 2024 年 1-2 月微盘回撤期:产品回撤多少?归因?
  4. 不同市场风格下的表现:小盘强 / 大盘强 / 风格切换期的产品表现?

C. 容量与风险

  1. 策略容量估算方法论:你们怎么估容量?关键假设?
  2. 当前规模 vs 容量上限:当前规模是上限的百分之几?
  3. 拥挤度监控:有没有监控同业拥挤度?最近信号 IC 衰减情况?
  4. 极端行情应对:2024 年 1-2 月、2024 年 9 月,你们的应对?

D. AI 选股专项(如果适用)

  1. 模型架构:什么模型?参数量?训练数据量?
  2. 特征工程:输入特征维度?类别?数据源?
  3. 模型迭代频率:多久更新一次?
  4. 过拟合控制:怎么防止过拟合?out-of-sample 测试?
  5. 可解释性:模型重要特征?归因报告能不能解释清楚?
  6. 回测 vs 实盘衰减率

E. 透明度

  1. 月度风格暴露报告:能不能提供?
  2. 月度持仓清单:能不能查看(脱敏即可)?
  3. 第三方归因报告:CMS / 国泰君安 / 中信建投等是否提供?

八、彬元天源量化的实战预演(卷三 3.7 全面拆解)

我们手上有彬元资本的天源量化数据: - 12 个月累计 +59.67% - 超额(vs 中证 2000?或自定义?)+27.12% - Sharpe 3.22(日频) - 周度胜率 81.6% - 规模 < 5 亿

本章已铺垫的关键问题(卷三深挖)

  1. 基准是什么?如果是中证 2000,那 27% 超额还算合理;如果是沪深 300,超额数字虚高。
  2. 27% 超额里的风格 β 占多少?2024-2025 年微盘风格暴涨,简单超配微盘就能拿 15-20% 风格收益。
  3. 真 alpha 是多少?要剥离 Size 因子后看残差。
  4. 5 亿规模能延续多久?小市值策略容量小,扩到 30-50 亿后 alpha 可能腰斩。
  5. 2024 年 1-2 月微盘回撤期表现?这是关键试金石。

九、一句话总结

全市场选股 / 小市值 / AI 选股,本质上都是"风格 β + 真 α"的混合品

我们买的应该是真 α,不是风格 β(因为风格 β 我们可以用 ETF 几乎免费拿到)。

判断这类策略的 3 个核心追问

  1. "剥离风格因子后,残差 alpha 是多少?" —— 没法回答 = 不懂自己的归因 = 不能投
  2. "在你最不擅长的风格环境下,最大回撤是多少?" —— 说"我们风格中性"= 大多在装
  3. "如果规模翻 5 倍,你的 alpha 能保持多少?" —— 说"完全可以"= 不懂容量天花板

这三个问题任何一个答不上来,本质都是"风格赌徒 + 量化外衣",不是真正的量化能力。