Add recent three-year T0.5 statistics report

Request:
- Summarize recent three-year HK IPO T0.5 coverage and statistics.

Changes:
- Added a Chinese Markdown report that separates true subscription-period T0.5 snapshots from external final public oversubscription history.
- Reported current true T0.5 coverage, active future T0.5 rows, final heat proxy buckets, and top recent high-heat IPOs.
- Documented model implications for short T2/D1 exits and future T0.5 sampling.

Verification:
- Ran git diff --check.
- Reconciled counts against data/hk_ipo.sqlite with read-only SQLite queries.

Next useful context:
- True historical T0.5 coverage is currently zero for listed IPOs in 2023-06-15 to 2026-06-15 because T0.5 snapshots only started on 2026-06-15.
- external_ipo_history.public_oversubscription_times is a post-hoc heat proxy, not an original T0.5 input.
This commit is contained in:
2026-06-15 16:13:49 +00:00
parent 943eab27cb
commit 5e35242a76
@@ -0,0 +1,104 @@
# 2026-06-15 最近三年 IPO T0.5 统计
## 统计口径
- 统计区间:`2023-06-15``2026-06-15`,按上市日期筛选。
- 数据截至:
- `ipo_master``2026-06-15T18:20:00Z`
- `ipo_market_heat``2026-06-15T18:40:00Z`
- `external_ipo_history``2026-06-15T19:10:00Z`
- `price_performance``2026-06-15T10:00:00Z`
- 真实 T0.5:申购期间抓取的非官方市场热度快照,例如券商聚合孖展认购倍数,来源表为 `ipo_market_heat`
- 后验代理:上市后可见的最终公开认购倍数,来源表为 `external_ipo_history.public_oversubscription_times`。它可以用来校准热度和 D1 表现的关系,但不能当作原始 T0.5 输入。
## 结论摘要
严格意义上,最近三年已上市 IPO 没有历史 T0.5 快照样本。
| 指标 | 数量 | 说明 |
| --- | ---: | --- |
| 仓库内最近三年已上市 IPO | 291 | `ipo_master.listing_date` 在统计区间内 |
| 最近三年已上市 IPO 的真实 T0.5 快照 | 0 | `ipo_market_heat` 快照从 `2026-06-15` 才开始归档 |
| 当前已归档真实 T0.5 快照 | 5 | 全部是未来上市标的,还没有 D1 标签 |
| 最近三年 `ipohk` 外部历史样本 | 99 | 可用于后验热度代理,不是 T0.5 |
| 最近三年外部样本中有最终公开认购倍数 | 93 | 可做分桶观察 |
| 最近三年外部样本中有仓库 D1 标签 | 89 | 用 `price_performance.stage='D1'``return_pct` |
这个结果意味着:历史上不能复原“当时 T0.5 孖展倍数”,只能从现在开始持续采样。过去三年的最终公开认购倍数可以帮助我们理解“热度强弱最终对应的 D1 胜率”,但它是后验信息,不能倒灌进 T0/T0.5 决策。
## 当前真实 T0.5 快照
这些是已经进入 `ipo_market_heat` 的真实 T0.5 样本,但它们上市日在 `2026-06-15` 之后,所以不属于最近三年已上市历史回测样本。
| 股票 | 中文名 | 上市日期 | 观察时间 | 来源 | T0.5 孖展倍数 |
| --- | --- | --- | --- | --- | ---: |
| `01392` | 深圳海清智元科技股份有限公司 | `2026-06-22` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 2195.84x |
| `06067` | 深圳市星源材质科技股份有限公司 | `2026-06-23` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 109.20x |
| `06132` | 华健未来(成都)科技股份有限公司 | `2026-06-23` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 135.39x |
| `02335` | 陕西麦科奥特医药科技股份有限公司 | `2026-06-24` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 4.78x |
| `06106` | 上海仙工智能科技股份有限公司 | `2026-06-24` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 48.07x |
读法:这 5 条可以作为未来 T0.5 复盘的第一批冻结样本。等 T1、T2、D1 出来后,可以检查“当时观察到的孖展热度”是否提高了 T2/D1 卖出的胜率判断。
## 后验代理:最终公开认购倍数分桶
下表使用最近三年内能匹配到仓库主表的 `external_ipo_history.public_oversubscription_times` 分桶,并用仓库自己的 D1 标签做结果观察。它不是 T0.5 回测,只是热度代理校准。
| 最终公开认购倍数 | 样本数 | 有 D1 标签 | 平均一手中签率 | D1 正收益率 | 平均 D1 收益 |
| --- | ---: | ---: | ---: | ---: | ---: |
| `>=5000x` | 18 | 18 | 1.58% | 83.3% | 101.74% |
| `1000-5000x` | 36 | 32 | 3.19% | 93.8% | 62.29% |
| `100-1000x` | 23 | 21 | 7.35% | 61.9% | 8.77% |
| `10-100x` | 10 | 7 | 19.24% | 28.6% | -23.04% |
| `<10x` | 6 | 5 | 65.41% | 40.0% | -15.59% |
| `missing` | 6 | 6 | 7.16% | 33.3% | -10.11% |
当前最有用的信号不是精确倍数,而是区间:
- 最终热度超过 `1000x` 的样本,D1 胜率和平均 D1 收益都显著更好。
- 最终热度在 `100-1000x` 的样本仍有正收益概率,但收益弹性明显下降。
- 最终热度低于 `100x` 后,D1 结果明显不稳定,尤其 `10-100x``<10x` 的平均 D1 收益为负。
- 热度越高,一手中签率越低。`>=5000x` 桶的一手中签率均值只有 1.58%`1000-5000x` 桶也只有 3.19%。这类标的更像“小概率中签、高弹性卖出”的交易。
## 最近三年最终公开认购倍数 Top 20
这张表只用于观察“最终热度极强”的历史案例,不能当成当时 T0.5 可见信息。
| 排名 | 股票 | 中文名 | 上市日期 | 最终公开认购倍数 | 一手中签率 | 外部首日涨跌 |
| ---: | --- | --- | --- | ---: | ---: | ---: |
| 1 | `06871` | 翼菲科技 | `2026-05-18` | 14855x | 3.00% | 76.23% |
| 2 | `08610` | BBSB INTL | `2026-01-13` | 10745x | 0.05% | 11.67% |
| 3 | `02685` | 量化派 | `2025-11-27` | 9366x | 0.60% | 88.78% |
| 4 | `06872` | 丹诺医药-B | `2026-05-22` | 9015x | 0.80% | 178.73% |
| 5 | `01609` | 天星医疗 | `2026-05-05` | 7823x | 1.50% | 118.27% |
| 6 | `02539` | 乐摩科技 | `2025-12-03` | 7324x | 0.80% | 36.25% |
| 7 | `07666` | 剂泰科技-P | `2026-05-13` | 6910x | 0.14% | 126.67% |
| 8 | `02693` | 金岩高岭新材 | `2025-12-03` | 6876x | 0.03% | 2.19% |
| 9 | `01511` | 驭势科技 | `2026-05-20` | 6777x | 5.00% | 4.64% |
| 10 | `01236` | 乐动机器人 | `2026-05-11` | 6707x | 0.80% | 127.62% |
| 11 | `02630` | 旺山旺水-B | `2025-11-06` | 6238x | 1.68% | 145.73% |
| 12 | `01879` | 曦智科技-P | `2026-04-28` | 5784x | 6.00% | 383.62% |
| 13 | `02723` | 深演智能 | `2026-05-27` | 5480x | 1.00% | 265.77% |
| 14 | `09609` | 海伟股份 | `2025-11-28` | 5426x | 1.00% | 22.97% |
| 15 | `02649` | 优乐赛共享 | `2026-03-09` | 5297x | 0.04% | 43.64% |
| 16 | `02546` | 智汇矿业 | `2025-12-19` | 5248x | 1.00% | 90.69% |
| 17 | `02706` | 海致科技集团 | `2026-02-13` | 5065x | 0.06% | 242.20% |
| 18 | `01021` | 华沿机器人 | `2026-03-30` | 5059x | 5.00% | 8.24% |
| 19 | `02687` | 卓越睿新 | `2025-12-08` | 4813x | 1.00% | 87.26% |
| 20 | `06636` | 极视角 | `2026-03-30` | 4591x | 10.00% | 150.00% |
## 对模型的建议
1. 保持 `T0.5``T1` 分离。T0.5 是申购期间快照,T1 是正式分配结果,二者不能互相填充。
2. 从现在开始固定采样 T0.5:至少保留 `early``mid``final` 三个观察点,并记录 `observed_at`、来源、原始页面路径和倍数。
3. T0.5 不要直接替代基本面评分。更适合做 watchlist 升降级:强 T0 + 强 T0.5 才是优先组合;弱 T0 + 极强 T0.5 需要防止纯情绪交易。
4. 对短线退出模型来说,T0.5 的目标变量应仍然是 T2 或 D1 卖出结果,而不是 D5/D20/D60。
5. 历史最终公开认购倍数可以作为校准锚点:如果未来真实 T0.5 在截止前接近 `1000x+`,可以提高 D1 正收益先验;但如果只是申购早期高热,需要等待后续采样验证持续性。
## 数据来源
- 真实 T0.5 原始页面:`data/raw/market_heat/vbkr_ipo_hk_index_20260615T184000Z.html`
- 真实 T0.5 结构化快照:`data/snapshots/ipo_market_heat.csv`
- 外部历史原始数据:`data/raw/external_history/ipohk_listed_20260615T191000Z.json`
- 外部历史结构化快照:`data/snapshots/external_ipo_history.csv`
- 仓库 D1 标签:`price_performance` 表,`stage='D1'`