📖 A 股量化术语词典
62 个 A 股量化研究、数据工程、回测、组合优化、执行与 MCP/API 接入相关术语,中英对照定义,关键术语带方法论详解链接。Self-developed reference for China A-share quantitative research terminology.
📊 数据与口径 / Data & Conventions
A 股(沪深 A 股) · China A-shares
在中国大陆沪深交易所上市的人民币普通股票,包括沪市主板、深市主板、创业板、科创板与北交所。
除权除息 · XDXR / Ex-rights & Ex-dividend → 详解 上市公司送股、转增或派息时,股价相应下调形成非交易性"跳空"。回测和实盘均需复权处理避免错误信号。
前复权 · Forward-adjusted → 详解 以当前价为基准向前调整历史价,常用于看图与近期分析。
后复权 · Backward-adjusted → 详解 以上市首日为基准向后累乘,常用于长周期回测与收益计算。
复权因子 · Adjustment factor
保留原始价的同时记录复权倍数,便于灵活按需还原。
数据契约 · Data contract
字段、单位、复权方式、口径在所有源与所有时点的统一约定。
多源交叉校验 · Multi-source cross-validation → 详解 同一指标用多个独立数据源比对,偏离超阈值自动标记或切换更可靠源。
数据新鲜度 · Data freshness
每类数据有时效阈值;过期即告警,防止陈旧数据导致错误信号。
每一笔成交的撮合时间、价、量记录,微结构分析与大单分类的基础。
集合竞价 · Call auction
A 股开盘前(9:15-9:25)与收盘前(14:57-15:00)的集合撮合,价格揭示参与方意图。
涨跌停 · Daily price limit
A 股普通股票±10%、ST 股±5%、创业板与科创板±20%、北交所±30%。触及涨跌停后交易特征显著变化。
北向资金 · Northbound capital
通过沪深港通流入 A 股的外资,资金流向常被作为情绪与定价指标参考。
龙虎榜 · Dragon List (LHB)
交易所每日公布的异动股营业部明细,反映大资金行为。
F10 · F10 fundamentals → 详解 上市公司基本面信息综合(财报、估值、分红、股本结构等)。
ROE · Return on Equity → 详解 净资产收益率 = 净利润 / 平均归母权益。TTM / 单季年化 / 全年三种口径差异显著,需统一。
📈 因子与 Alpha / Factors & Alpha
Alpha · Alpha
策略相对基准的超额收益,扣除 beta(市场暴露)后的"纯收益"。
Beta · Beta
策略与基准的协方差归一化,反映对市场系统性风险的暴露。
因子 · Factor
解释股票截面或时序收益差异的量化指标(如动量、估值、波动等)。
因子库 · Factor library → 详解 通过严格验证的因子集合;名称、公式、参数属研究 IP 通常不公开。
因子挖掘 · Factor mining → 详解 构造因子候选并过验证流程的研究环节。
动量因子 · Momentum
基于价格趋势延续性的因子(如过去 20 日收益)。
反转因子 · Reversal
基于短期超涨/超跌均值回复的因子。
微结构因子 · Microstructure factor → 详解 从逐笔、盘口、大单分类等高频信号提取的因子。
资金流因子 · Money-flow factor
基于主力净流入、北向资金、龙虎榜等资金行为的因子。
IC / 信息系数 · IC / Information Coefficient
因子预测值与实际下期收益的截面相关系数。绝对值越大预测力越强,通常 |IC|>0.03 视为有效。
IR / 信息比率 · IR / Information Ratio
IC 均值 / IC 标准差,反映因子的稳定性。IR > 0.5 被认为不错。
因子共线性 · Multi-collinearity → 详解 多因子之间高度相关,导致模型权重不稳定 / 看似多因子实只 5-10 个独立维度。
因子正交化 · Orthogonalization
把一个因子对另一个因子的残差作为新因子,提取"增量信息"。
ML 合成因子 · ML-synthesized factor
用梯度提升、神经网络等模型将多个原始因子非线性组合的合成因子。
🛡️ 回测与防过拟合 / Backtesting & Anti-overfitting
用历史数据模拟策略表现的研究环节。回测口径数字绝不等于实盘。
样本外 OOS · Out-of-Sample
训练/挖掘时未见过的数据段;OOS 表现接近 IS(in-sample)是策略稳健的最低门槛。
过拟合 · Overfitting
策略在历史数据上拟合了噪声而非真实信号;扣成本/换样本即失效。
多重检验 · Multiple testing
试了 N 个变体,即使全是随机,最高的那个看起来也"显著"。必须用 DSR 等校正。
CPCV · Combinatorial Purged Cross-Validation → 详解 时间序列友好的交叉验证:将时序切块组合训练/测试,并 purge/embargo 防信息泄漏。比单次留出更稳健。
DSR / 校正夏普 · Deflated Sharpe Ratio → 详解 对"试了多少次"做显式校正后的真实显著性;DSR 显著的因子远比裸 Sharpe 高的可信。
Sharpe Ratio · Sharpe Ratio
(年化超额收益)/(年化波动)。常被高估,需用 DSR 校正。
Calmar Ratio · Calmar Ratio
年化收益 / 最大回撤,衡量赚钱性与痛苦度的比。
最大回撤 · Maximum Drawdown
策略净值从峰值到谷底的最大跌幅。
胜率 · Hit Rate
正收益期数占总期数比例。单看胜率不够,需结合赔率。
交易成本 gate · Cost gate
策略须扣除冲击成本+手续费+滑点后仍为正才进候选池。换手越高这关越致命。
滑点 · Slippage
下单价 vs 成交价的偏差,微结构与流动性的体现。
冲击成本 · Market impact
大单瞬间打入推动价格的成本,与单笔大小、市场流动性相关。
⚖️ 组合与执行 / Portfolio & Execution
组合优化 · Portfolio optimization → 详解 将因子打分转为可执行权重,处理约束(行业/风险/换手)与目标(收益/方差)。
行业中性 · Industry-neutral → 详解 强制组合在各行业上的暴露贴近基准,剥离行业 beta,留下因子 alpha。
风险归因 · Risk attribution
把组合收益/波动分解到行业、风格、残差等风险源,判断收益的真实来源。
Barra 模型 · Barra (style factors)
把股票收益用 10 个左右风格因子(Size/Value/Momentum/Quality...)解释的多因子风险模型。
把母单按规则拆成多个子单的执行方式(TWAP/VWAP/POV/IS),降低冲击成本与暴露。
TWAP · Time-Weighted Average Price
按时间均匀拆分母单,适合不抢时间的稳定执行。
VWAP · Volume-Weighted Average Price
按市场成交量分布拆分,目标是接近 VWAP 价。
POV · Percent of Volume
盯住一段窗口的市场成交量比例下单。
IS · Implementation Shortfall
在冲击成本与时间风险之间最优化的执行算法。
T+1 · T+1 settlement
A 股股票当日买入次日才能卖,执行算法需适配本地规则。
实时风控 · Real-time risk control → 详解 执行层的最后防线:单股回撤/组合波动/数据异常触发熔断或拒单。
熔断 · Circuit breaker
策略/执行链路任一环节异常时立即停止新交易,等待人工确认。
🔌 接入与工程 / Access & Engineering
API · Application Programming Interface → 详解 程序化调用接口,通常 HTTP REST + JSON + token 鉴权。
MCP · Model Context Protocol → 详解 Anthropic 主推的开放标准,让 LLM(Claude/GPT)直接发现并调用一组工具。量化数据 + MCP 让研究员用自然语言取数。
REST vs MCP · REST API vs MCP → 详解 REST 适合程序化批量与生产策略;MCP 适合研究员对话探索与 LLM agent。
情感分析 · Sentiment analysis → 详解 把财经新闻量化成利好/利空/中性打分,构造事件驱动因子。
词典法情感 · Lexicon-based sentiment → 详解 用金融情感词典加权打分;透明可审计、零延迟、零成本,但准确率有限。
板块轮动 · Sector rotation
不同行业/概念板块的相对强弱周期性轮动,可作为板块层因子。
概念板块 · Concept board
市场对热点主题(AI、新能源、半导体...)的标签化分组,炒作驱动明显。
自研 · Self-developed
由我们自主设计、实现、运维的技术栈,可深度定制 + 数据契约可控。