AI 选股¶

不锚定单一指数的量化策略。看起来更自由，实际上更难。

这一类策略最近 5 年是国内私募量化的高速扩张区，也是争议最大、最容易翻车的区域。

一、这一类策略的画像¶

1.1 什么是"全市场选股"¶

严格定义：

不以单一指数（沪深 300 / 中证 500 / 中证 1000）为基准，而是在全市场所有可投股票（A 股 5000+ 只）中进行量化选股的多头策略。

与指增的本质区别：

维度	指数增强	全市场选股
基准	明确指数	自定义（中证全指 / 偏股基金指数 / 自定义）
跟踪误差	控制在 5-8%	不控制（可能 15%+）
持仓股票池	主要在指数成分股	全市场
风格暴露	与基准接近	自由偏离
选股池规模	300-2000 只	5000+ 只
超额计算	减去基准指数	减去自定义基准（可争议）

一句话：指增是"在框架内做超额"，全市场选股是"自己定义框架"。

1.2 主流子类型¶

(a) 全市场量化多头（无明显风格偏向）¶

特征： - 平衡选股，不锚定特定市值或风格 - 通常对标"中证全指"或"偏股基金指数" - 持仓数量 100-500 只 - 国内代表：明汯量化精选、衍复全市场等

(b) 小市值 / 微盘策略¶

特征： - 严格选小市值股票（流通市值 < 50 亿，甚至 < 20 亿） - 持仓极度分散（300-1000 只，避免流动性风险） - 对标中证 2000 / 国证 2000 / 自定义微盘指数 - 国内代表：彬元天源量化（"空指增强"实际上就是这类）

为什么"小市值策略"在 2024-2025 年特别热： - 2014-2016 年小市值 vs 大市值的"风格补涨" - 2024-2025 年微盘股 alpha 复苏 - 传统量化指增超额衰减后，资金涌入小市值寻求高收益 - 但小市值的"风格 β"和"管理人 α"极难分离（详见 4 节）

(c) AI 选股 / 端到端神经网络¶

特征： - 用深度学习（CNN / Transformer / LSTM）从原始数据预测股票收益 - 弱化人工因子设计，依赖模型自主学习 - 训练数据通常包含价量、基本面、舆情、宏观等多源数据 - 国内代表：九坤、明汯部分线、衍复部分线（多家头部都在做）

AI 选股的优劣：

优点	缺点
能捕捉非线性关系	可解释性差
处理高维数据有优势	过拟合风险高
可端到端优化	黑盒 → 难于风险管控
边际改进空间大	训练数据有限（A 股历史短）

(d) 多策略 / 组合型¶

特征： - 把指增、市场中性、CTA 等子策略组合起来 - 通常以"全天候"、"风险平价"等概念包装 - 内部各子策略权重动态调整 - 容易出现"听起来很厉害，归因说不清"的情况

二、关键名词深度拆解¶

2.1 自定义基准（Custom Benchmark）¶

定义：管理人自己选择或合成的业绩比较基准，不是市场公认指数。

常见形式： - "中证 800 + 中证 1000 + 中证 2000 加权" - "偏股基金指数"（中证基金指数） - "wind 全 A 等权" - "我们自己的因子选股池"

为什么这是个重要警示信号**：

自定义基准给了管理人操纵超额的空间： - 在不同市场环境下选择对自己有利的基准 - 用低于市场的基准让超额"看起来很高" - 拒绝按公认指数比较

实战例子：

某管理人产品 2024 年涨 +15%。 - 对比沪深 300（涨 +15%）：超额 0% - 对比中证全指（涨 +12%）：超额 3% - 对比"30%沪深300+30%中证500+40%中证1000"自定义基准（涨 +8%）：超额 7%

不同基准下"超额"完全不同。基准选择本身就是结果设计。

正确处理： - 在合同里明确锁定一个公认基准 - 即使产品名称是"全市场选股"，自己用沪深 300 或偏股基金指数做内部参考

尽调追问： - "你们的业绩比较基准是什么？为什么选这个？" - "如果换成沪深 300 / 偏股基金指数对比，超额是多少？" - "你们对内汇报用什么基准？对外路演用什么基准？"

2.2 跟踪误差不受控¶

含义：全市场选股策略没有跟踪误差约束，意味着产品收益和任何指数都可能差距很大。

对投资人的影响：

LP 买入时心里有一个"指数基准"（可能是沪深 300）
产品实际收益和这个基准长期偏离时，LP 体感差
即使长期超额好，短期跟踪误差大会触发 LP 心理压力

实例：

2024 年沪深 300 涨 +15%，某全市场选股产品涨 +5%。 - LP 想：我买了股票产品，沪深 300 涨这么多，我才赚 5%？ - 管理人解释：我们做小市值，今年小市值涨得少，但中长期超额好 - LP 的心智模型和管理人的模型不在同一个频道上

这是全市场选股的根本痛点：长期收益可能更好，但短期波动和指数脱钩让 LP 难持有。

尽调要点：必须在投前和 LP（如果是给 LP 配置的话）讲清楚"短期会偏离指数"。

2.3 风格暴露 / 风格 β（Style Exposure）¶

定义：产品收益对各风格因子（Size / Value / Quality / Momentum 等）的敏感度。

Barra 因子模型（详见卷二 2.8 + 卷三 3.3）：

产品月度收益 = α + Σ βi * Fi + ε

其中 Fi 是 i 风格因子的月度收益，βi 是产品对该因子的暴露系数。

主流风格因子（Barra CNE5 / CNE6）：

因子名	含义	国内表现
Size（市值）	小市值 vs 大市值	周期性极强
Beta	股票贝塔（系统风险）	稳定
Momentum	动量	在 A 股偏弱
Residual Volatility	残差波动率	低波异象
Non-linear Size	非线性市值（中盘溢价）	周期性
Book-to-Price	账面价值 / 市值（BP）	偏弱
Liquidity	换手率	中等
Earnings Yield	盈利收益率	中等
Growth	成长	周期性
Leverage	杠杆	弱

全市场策略的风格暴露往往隐藏巨大风险：

"全市场选股 +50% 收益" → 但其中 +30% 是小市值风格 β
当小市值风格反转，产品立刻 -20%
看似 alpha 实际是 β

这是判断这类策略真假的核心。详见 4 节。

2.4 流动性风险（在小市值策略里被放大）¶

定义：股票成交量小，大额买卖会显著推高 / 压低价格，造成执行成本。

对小市值 / 微盘策略的特殊影响：

微盘股日均成交额 1000 万 - 5000 万
100 亿规模的产品要建仓 100 只微盘股，每只持仓 1 亿
单只 1 亿 vs 日均 3000 万成交额 = 3 个交易日才能建完一只仓
卖出时同样 → 实际 alpha 被冲击成本吃掉

冲击成本（Implementation Cost）的数学：

冲击成本（bp）≈ k * sqrt(订单量 / 日均成交量)

k 是市场冲击系数（A 股小盘股约 50-100 bp）。

举例： - 订单量 / 日均成交量 = 0.5（订单是日成交量一半） - 冲击成本 ≈ 50 * sqrt(0.5) = 35 bp

如果一只小市值股票日均成交 3000 万，你想买 1500 万： - 冲击成本约 35 bp = 0.35% - 来回（买入 + 卖出）就是 0.7% - 一年换手 5 次 → 累计冲击成本 3.5%

这是为什么小市值策略容量极小：规模一大，冲击成本吃光超额。

尽调追问： - "你们小市值策略的容量上限怎么估算？冲击成本模型？" - "实盘冲击成本（基点）vs 模型预估？" - "持仓股票的日均成交额分布？最低多少？"

2.5 极度分散持仓（Highly Diversified Positions）¶

定义：持仓数量极多（500-2000 只），单只股票占比极小（< 0.5%）。

为什么需要：

小市值 / 微盘策略必须分散： - 单只小市值股票流动性差 → 持仓占比不能太大（否则冲击成本爆表） - 单只小市值股票个体风险大（退市、停牌）→ 必须分散对冲

典型持仓数量：

策略	持仓数量	单只占比
主观多头	30-100 只	1-5%
量化指增	200-500 只	0.2-0.5%
全市场选股	100-500 只	0.2-1%
小市值策略	500-2000 只	< 0.5%
微盘策略	1000-3000 只	< 0.1%

极度分散的含义：

本质上是"小市值指数 + 因子加权"，而非传统意义的"选股"
个股 alpha 贡献小，风格 β 贡献大
业绩取决于"小市值 vs 大市值"风格，而非"选对了哪几只小市值"

这就引出下一节的核心问题：真假 alpha。

2.6 因子拥挤度（Factor Crowding）¶

定义：多家管理人使用相似因子或策略，导致信号挤占同一批股票。

为什么对小市值策略尤其重要：

小市值股票 alpha 容量本来就小
多家管理人都做小市值 → 大家买同一批小盘股 → 推高估值
风格反转时 → 大家同时出货 → 拥挤踩踏

实例：2024 年 1-2 月微盘股雪崩 - 全市场量化微盘策略合计规模约 2000-3000 亿 - 持仓相似度极高（都依赖类似的小市值因子） - 1 月 25 日开始集中赎回 + 减仓 - 微盘指数 5 个交易日跌 -30% - 多家"全市场量化"产品单周回撤 -15% ~ -25%

这是结构性风险，不是单家管理人能控制的。

尽调追问： - "你们对自己策略的拥挤度有监控吗？" - "2024 年 1-2 月微盘股回撤期，你们产品回撤多少？怎么处理的？" - "如果再发生类似事件，你们的应对预案？"

三、超额（α）的拆解¶

3.1 全市场策略的超额来源¶

理论上，全市场策略的超额来自两部分：

全市场策略 α = 风格暴露收益（风格 β）+ 真 α（个股选择 + 时序信号）

但很多管理人把"风格 β"当成"alpha"卖。这是这类策略最大的认知陷阱。

(a) 风格暴露收益（看起来像 α，实际上是 β）¶

例子：2024 年小市值风格年化贡献 +20%。一个"全市场选股"产品长期超配小市值，年化收益跑赢沪深 300 + 25%。

表面：管理人"选股能力强"，年化 alpha +25%
实际：风格 β 贡献 +20%，真 α 只有 +5%

当小市值风格反转（2025 年某月小市值跌 -15%）： - 管理人会回撤 -10% ~ -15% - 投资人会震惊："不是说 alpha 稳定吗？"

判断方法：

用 Barra 模型回归，剥离风格 β 后看残差 α： - 残差 α / 总超额 > 70%：真本事 - 残差 α / 总超额 30-70%：混合，看哪部分主导 - 残差 α / 总超额 < 30%：本质是风格暴露包装

详见卷三 3.3 风格因子归因。

(b) 真 α 的来源¶

剥离风格后剩下的 α，来自：

个股层面 α：在同一风格内，选对 / 避开个股
时序信号 α：捕捉短期事件机会
风格择时 α：不同时点切换风格暴露

第 3 项极难做到（择时类几乎都失败），主要靠 1 + 2。

3.2 小市值策略的特殊归因¶

小市值策略的真 α 应该来自：

个股选择：在 2000+ 微盘股里避开雷股（业绩造假、退市、被立案）
流动性管理：买流动性相对好的微盘
事件捕捉：业绩预告、并购重组等

判断： - 看产品长期表现 vs 中证 2000 / 微盘指数： - 长期跑赢微盘指数 5%+ → 有真 α - 长期与微盘指数贴近 → 本质是被动微盘指数 - 跑输微盘指数 → 选股能力为负

很多"小市值量化"长期表现接近微盘指数，意思是：他们靠"买入持有 + 等待小市值风格 β"，没有真正的选股能力。

3.3 AI 选股的归因难题¶

AI 模型是黑盒，归因极难。

判断 AI 选股真假的间接方法：

模型迭代频率：真做 AI 的，每月迭代模型；不做的，一年不动
特征工程深度：问"输入特征有多少维度？分别是什么类别？"
过拟合检验：要求看out-of-sample测试结果（用未来数据测过去训练的模型）
回测 vs 实盘衰减率：AI 模型衰减率 30-50% 是常态，> 60% 很可能过拟合
risk budgeting：AI 模型应该有 portfolio level 风控，不能"模型说什么就买什么"

红旗： - 拒绝讨论模型细节（"商业机密"） - 回测超额 > 实盘超额 2 倍以上 - 模型一年不更新 - 单一模型贡献全部超额

四、容量天花板¶

4.1 全市场选股的容量¶

理论上比指增容量大（选股池更广）。

实际上取决于风格：

大盘风格 → 容量大（500-2000 亿）
中盘风格 → 容量中等（200-500 亿）
小市值 / 微盘 → 容量小（30-100 亿）

4.2 小市值策略的容量上限¶

严格上限：整个微盘股市场的容量决定。

中证 2000 流通市值约 2-3 万亿
微盘股（< 50 亿市值）合计流通约 1-2 万亿
全行业小市值量化策略合计规模 ≤ 5000 亿是健康上限
单家管理人：50-100 亿很难再扩

实证：彬元天源量化规模 < 5 亿（2026 一季度），还在容量舒服区。如果未来扩到 30-50 亿，超额可能腰斩。

4.3 容量见顶的早期信号¶

同业拥挤度上升（多家管理人都在小市值）
微盘股估值相对中证 500 创历史高位
单只微盘股的成交额异常上升（量化集体进场推高换手）
最近 3-6 个月超额 vs 历史中位数下滑

五、绩效指标的特殊性¶

5.1 全市场策略不能只看绝对收益¶

关键拆解： - 绝对收益 = 选定基准的 β + 风格暴露 + 真 α - 真 α 才是付费的部分

正确指标： - alpha vs 中证全指（最公允） - 风格中性后的 α（用 Barra 模型剥离风格） - 超额 Sharpe（基于"alpha vs 中证全指"序列） - 风格暴露的稳定性（暴露突然变化是风格漂移）

5.2 小市值策略的绩效幻觉¶

幻觉来源：

2024-2025 年小市值风格累计 +60%（年化 +25%+）。任何一只一直持有小市值的产品都会显得很厉害。

正确视角：

拿产品 vs 中证 2000 全收益指数比较
拿产品 vs 同类小市值策略中位数比较
看产品在小市值风格下行期（2017、2021、2024-Q1）的表现

如果一个小市值策略只在小市值风格上行期跑得好，下行期跌得多，那它本质就是"小市值 β"，不是真 α。

5.3 AI 选股的绩效解读¶

短期业绩不能信（可能是模型刚好踩对节奏）
至少要 24 个月日频数据 + 跨越多个市场环境
关注模型表现是否随市场风格变化而显著变化（应该相对稳定，否则是过拟合）

六、骗术与陷阱¶

6.1 "全市场选股"包装 "小市值赌博"¶

话术："我们做全市场选股，不局限于某个指数，灵活度高。"

真相：实际上 80% 仓位在小市值股票上，本质就是小市值赌博，但用"全市场"模糊掉风格暴露。

识别： - 看持仓的市值分布（如果中位数市值 < 50 亿 = 本质小市值） - 看 Barra 风格暴露（Size 因子暴露 > 1.0 = 严重小市值偏好） - 看产品和小市值指数的相关性（> 0.85 = 本质小市值）

6.2 "AI 加持" 的虚词¶

话术："我们用最先进的 Transformer 模型 + 自研因子库，alpha 稳定。"

陷阱： - "最先进的 Transformer" 可能是市面上开源的标准实现 - "自研因子库" 可能就是几十个公开因子的组合 - "alpha 稳定" 可能只是过拟合的回测结果

识别： - 问技术细节（多大模型？多少参数？训练数据量？） - 看实盘 vs 回测衰减率 - 问研发团队（PhD 多少？多少 ML 背景？多少 Quant 背景？） - 看技术投入（IT / GPU 集群规模）

6.3 "回测年化 50%" 的诱惑¶

陷阱：回测年化 50% 的策略，实盘几乎一定 < 20%。

衰减来源： 1. 过拟合：模型记住了历史，未来不一样 2. 冲击成本：回测假设无成本，实盘有 3. 流动性限制：回测假设无限流动性，实盘限制 4. 机制变化：监管 / 涨跌停 / T+0 试点等 5. 同业拥挤：你做的策略别人也做，超额衰减

正确视角： - 看实盘连续 24 个月+ 的真实业绩 - 回测仅作"是否值得继续看"的初筛

6.4 "微盘股 alpha 永续" 的迷思¶

话术：2024-2025 年微盘股暴涨，多家管理人说"微盘股 alpha 是结构性的，可以长期持有"。

陷阱：

历史数据：

时期	微盘相对沪深300	持续时间
2014-2015 上半年	+120%	18 月
2015 下半年-2018	-55%	30 月
2019-2020	-10%	24 月
2021-2023	+50%	36 月
2024 年 1-2 月	-30%	5 周
2024 年 3 月-2025	+40%	反弹后

结论：微盘股是周期性极强的风格，没有"永续 alpha"。

任何说"微盘股可以长期持有"的，要么不懂周期、要么在卖产品。

6.5 "我们风格中性" 的狡辩¶

话术："我们策略是风格中性的，alpha 来自纯选股能力。"

陷阱：可能只是回测里风格中性，实盘有显著风格偏好。

识别：

要管理人发月度风格暴露报告（Size / Value / Quality 等因子的月度 β 系数）。如果某个因子的 β 持续 > 0.3 或 < -0.3，就不是真正的中性。

6.6 "策略容量很大" 的销售话术¶

话术："我们的策略容量很大，预计可以做到 200 亿。"

陷阱：估算容量需要严格的方法论（信号强度 / 冲击成本 / 同业拥挤），很多管理人没有方法论，只有销售目标。

识别： - 问"容量怎么估的？方法论是什么？" - 问"你们当前规模 / 容量上限的比例？" - 问"如果规模到容量上限的 80%，你们会不会主动封盘？"

愿意主动封盘的 = 重视 alpha 持续性不愿意 = 重规模轻 alpha

七、尽调追问清单¶

A. 策略本质识别¶

业绩比较基准：什么基准？为什么选这个？合同里写的是什么？
风格暴露：Barra 因子暴露（Size / Value / Quality / Momentum）的目标值和实际值？
市值分布：持仓股票的市值中位数是多少？最小市值多少？分布图？
持仓股票数量：通常多少只？最多 / 最少？
跟踪误差（vs 中证全指 / 沪深 300）的实际值？

B. 超额拆解¶

超额来源拆分：风格 β / 个股 alpha / 事件 alpha 各占多少？
风格中性后的 alpha：用 Barra 风格剥离后，残差 alpha 是多少？占总超额比例？
2024 年 1-2 月微盘回撤期：产品回撤多少？归因？
不同市场风格下的表现：小盘强 / 大盘强 / 风格切换期的产品表现？

C. 容量与风险¶

策略容量估算方法论：你们怎么估容量？关键假设？
当前规模 vs 容量上限：当前规模是上限的百分之几？
拥挤度监控：有没有监控同业拥挤度？最近信号 IC 衰减情况？
极端行情应对：2024 年 1-2 月、2024 年 9 月，你们的应对？

D. AI 选股专项（如果适用）¶

模型架构：什么模型？参数量？训练数据量？
特征工程：输入特征维度？类别？数据源？
模型迭代频率：多久更新一次？
过拟合控制：怎么防止过拟合？out-of-sample 测试？
可解释性：模型重要特征？归因报告能不能解释清楚？
回测 vs 实盘衰减率：

E. 透明度¶

月度风格暴露报告：能不能提供？
月度持仓清单：能不能查看（脱敏即可）？
第三方归因报告：CMS / 国泰君安 / 中信建投等是否提供？

八、彬元天源量化的实战预演（卷三 3.7 全面拆解）¶

我们手上有彬元资本的天源量化数据： - 12 个月累计 +59.67% - 超额（vs 中证 2000？或自定义？）+27.12% - Sharpe 3.22（日频） - 周度胜率 81.6% - 规模 < 5 亿

本章已铺垫的关键问题（卷三深挖）：

基准是什么？如果是中证 2000，那 27% 超额还算合理；如果是沪深 300，超额数字虚高。
27% 超额里的风格 β 占多少？2024-2025 年微盘风格暴涨，简单超配微盘就能拿 15-20% 风格收益。
真 alpha 是多少？要剥离 Size 因子后看残差。
5 亿规模能延续多久？小市值策略容量小，扩到 30-50 亿后 alpha 可能腰斩。
2024 年 1-2 月微盘回撤期表现？这是关键试金石。

九、一句话总结¶

全市场选股 / 小市值 / AI 选股，本质上都是"风格 β + 真 α"的混合品。

我们买的应该是真 α，不是风格 β（因为风格 β 我们可以用 ETF 几乎免费拿到）。

判断这类策略的 3 个核心追问：

"剥离风格因子后，残差 alpha 是多少？" —— 没法回答 = 不懂自己的归因 = 不能投
"在你最不擅长的风格环境下，最大回撤是多少？" —— 说"我们风格中性"= 大多在装
"如果规模翻 5 倍，你的 alpha 能保持多少？" —— 说"完全可以"= 不懂容量天花板

这三个问题任何一个答不上来，本质都是"风格赌徒 + 量化外衣"，不是真正的量化能力。