From 0e91879c4d9f713b2403ab65b84e0c7fb5da5bb7 Mon Sep 17 00:00:00 2001 From: geometrybase Date: Mon, 22 Jun 2026 15:43:01 +0000 Subject: [PATCH] d --- ...2026-06-15_01392_T0_prospectus_analysis.md | 95 ------------ ...2026-06-15_02335_T0_prospectus_analysis.md | 97 ------------ ...2026-06-15_06067_T0_prospectus_analysis.md | 97 ------------ ...2026-06-15_06106_T0_prospectus_analysis.md | 96 ------------ ...2026-06-15_06132_T0_prospectus_analysis.md | 96 ------------ reports/2026-06-15_analysis_model_v0.md | 103 ------------- reports/2026-06-15_historical_data_audit.md | 145 ------------------ ...6-06-15_selected_T0_5_market_heat_trial.md | 71 --------- ...6-06-15_selected_T0_horizontal_analysis.md | 104 ------------- ...026-06-15_t0_5_historical_model_rebuild.md | 58 ------- .../2026-06-15_t0_5_recent3y_statistics.md | 104 ------------- reports/2026-06-15_t1_demand_text_backfill.md | 50 ------ 12 files changed, 1116 deletions(-) delete mode 100644 reports/2026-06-15_01392_T0_prospectus_analysis.md delete mode 100644 reports/2026-06-15_02335_T0_prospectus_analysis.md delete mode 100644 reports/2026-06-15_06067_T0_prospectus_analysis.md delete mode 100644 reports/2026-06-15_06106_T0_prospectus_analysis.md delete mode 100644 reports/2026-06-15_06132_T0_prospectus_analysis.md delete mode 100644 reports/2026-06-15_analysis_model_v0.md delete mode 100644 reports/2026-06-15_historical_data_audit.md delete mode 100644 reports/2026-06-15_selected_T0_5_market_heat_trial.md delete mode 100644 reports/2026-06-15_selected_T0_horizontal_analysis.md delete mode 100644 reports/2026-06-15_t0_5_historical_model_rebuild.md delete mode 100644 reports/2026-06-15_t0_5_recent3y_statistics.md delete mode 100644 reports/2026-06-15_t1_demand_text_backfill.md diff --git a/reports/2026-06-15_01392_T0_prospectus_analysis.md b/reports/2026-06-15_01392_T0_prospectus_analysis.md deleted file mode 100644 index d82d22f..0000000 --- a/reports/2026-06-15_01392_T0_prospectus_analysis.md +++ /dev/null @@ -1,95 +0,0 @@ -# 01392 深圳海清智元科技股份有限公司 IPO 分析报告 - -## 摘要 - -- 股票代码:`01392` -- 公司:深圳海清智元科技股份有限公司(Shenzhen HQVT Technology Co., Ltd.) -- 分析阶段:`T0_prospectus` -- 报告生成时间:`2026-06-15T16:00:00Z` -- 模型数据时间:`2026-06-15T16:00:00Z` -- 规则版本:`ipo_score_v0` -- 规则路径:`rules/ipo_score_v0.yaml` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出。 -- 结论代码:`positive_watch` -- 执行动作:正面观察,但需要等 T1 确认后再决定 T2/D1 退出仓位。 -- T0 分数:`5` -- 分数分桶:`t0_5_to_7` -- 历史校准 D1 正收益概率:73.3%,样本数 105 - -## 阶段日期表 - -| 阶段 | 本 IPO 对应日期 | 含义 | -| --- | --- | --- | -| `T0_prospectus` | 2026-06-11 至 2026-06-16 | 申购前/申购中阶段;只使用招股书和发行条款。 | -| `T1_allotment` | 2026-06-18 | 分配结果日;使用公开认购热度、国际配售热度和分配事实。 | -| `T2_grey_market` | 2026-06-19,预计 D1 前一交易日 | 上市前暗盘窗口;只有存在可靠且可执行的数据源时才作为卖出依据。 | -| `D1` | 2026-06-22 | 正式上市首日;T2 数据不可用或不可靠时的默认卖出窗口。 | - -## 基础事实 - -| 字段 | 数值 | -| --- | --- | -| 板块 | Main Board | -| 状态 | open_for_subscription | -| 上市日期 | 2026-06-22 | -| 申购期 | 2026-06-11 至 2026-06-16 | -| 分配结果日期 | 2026-06-18 | -| 上市方式 | 未记录 | -| 行业 | Multispectral AI technology | -| 保荐人 | 未记录 | -| 发行价 | HK$7.20 | -| 发行规模 | HK$613.2m | -| 市值 | HK$5,574.3m | -| 每手股数 | 500 | -| 最低认购金额 | HK$3,636.31 | -| 初始公开发售比例 | 10.0% | -| 超额配股权股数 | 未记录 | - -## 短线退出模型推断 - -- D1 正收益概率:73.3% -- D1 涨幅不低于 10% 概率:51.4% -- 同分桶历史 D1 平均收益:40.1% -- 同分桶历史 D1 中位收益:13.2% -- T2 暗盘卖出收益暂未建模,直到项目确认可靠暗盘数据源。 -- D5/D20/D60 只作为复盘标签,不是持仓目标。 - -## 评分拆解 - -| 评分项 | 分数 | 原因代码 | -| --- | ---: | --- | -| 发行规模 | 1 | `300m_to_800m` | -| 初始公开发售比例 | 1 | `5pct_to_10pct` | -| 最低认购金额 | 2 | `3500_to_10000` | -| 发行价 | 1 | `5_to_30` | -| 超额配股权 | 0 | `missing_or_zero` | - -## 正面因素 - -- 最低认购金额:+2 (`3500_to_10000`)。 -- 发行规模:+1 (`300m_to_800m`)。 -- 初始公开发售比例:+1 (`5pct_to_10pct`)。 -- 发行价:+1 (`5_to_30`)。 - -## 风险与缺口 - -- 没有明显负向评分项。 -- 本阶段必需字段没有明显空缺。 -- T2 暗盘信号暂未使用,因为项目还没有批准可复现的数据源。 -- 上市后的 D5/D20/D60 表现只用于后续复盘,不是本模型的持仓周期目标。 - -## 触发条件 - -- 上调:T1 认购热度显著更强、分配稀缺性更好,或出现有规则支持的新正面催化。 -- 下调:公开或国际需求偏弱、供给过大、关键字段质量不足,或市场窗口明显转差。 - -## 退出计划 - -- 如果申购并获配,且 T2 暗盘数据可靠且可执行,优先按 T2 暗盘卖出计划处理。 -- 如果 T2 不可用或不可靠,默认使用 D1 作为卖出窗口。 -- 不把 D5/D20/D60 作为本模型的计划持仓周期。 -- 后续记录 D1/D5/D20/D60 结果时,只作为复盘标签,不作为倒推预测输入。 - -## 来源路径 - -- `data/raw/01392/prospectus_2026-06-11_2026061100015.pdf` diff --git a/reports/2026-06-15_02335_T0_prospectus_analysis.md b/reports/2026-06-15_02335_T0_prospectus_analysis.md deleted file mode 100644 index edb42fe..0000000 --- a/reports/2026-06-15_02335_T0_prospectus_analysis.md +++ /dev/null @@ -1,97 +0,0 @@ -# 02335 陕西麦科奥特医药科技股份有限公司 IPO 分析报告 - -## 摘要 - -- 股票代码:`02335` -- 公司:陕西麦科奥特医药科技股份有限公司(Shaanxi Micot Pharmaceutical Technology Co., Ltd.) -- 分析阶段:`T0_prospectus` -- 报告生成时间:`2026-06-15T17:30:00Z` -- 模型数据时间:`2026-06-15T17:30:00Z` -- 规则版本:`ipo_score_v0` -- 规则路径:`rules/ipo_score_v0.yaml` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出。 -- 结论代码:`strong_watch` -- 执行动作:T0 强关注,仍需等待 T1 认购热度确认后执行 T2/D1 退出纪律。 -- T0 分数:`9` -- 分数分桶:`t0_gte_8` -- 历史校准 D1 正收益概率:76.4%,样本数 72 - -## 阶段日期表 - -| 阶段 | 本 IPO 对应日期 | 含义 | -| --- | --- | --- | -| `T0_prospectus` | 2026-06-15 至 2026-06-18 | 申购前/申购中阶段;只使用招股书和发行条款。 | -| `T1_allotment` | 2026-06-23 | 分配结果日;使用公开认购热度、国际配售热度和分配事实。 | -| `T2_grey_market` | 2026-06-23 分配结果公布后 / D1 前一交易日 | 上市前暗盘窗口;只有存在可靠且可执行的数据源时才作为卖出依据。 | -| `D1` | 2026-06-24 | 正式上市首日;T2 数据不可用或不可靠时的默认卖出窗口。 | - -## 基础事实 - -| 字段 | 数值 | -| --- | --- | -| 板块 | Main Board | -| 状态 | open_for_subscription | -| 上市日期 | 2026-06-24 | -| 申购期 | 2026-06-15 至 2026-06-18 | -| 分配结果日期 | 2026-06-23 | -| 上市方式 | 未记录 | -| 行业 | Clinical-stage biotechnology / peptide drugs | -| 保荐人 | 未记录 | -| 发行价(T0最高发售价) | HK$21.00 | -| 发行规模 | HK$1,219.1m | -| 市值 | HK$6,966.5m | -| 每手股数 | 200 | -| 最低认购金额 | HK$4,242.36 | -| 初始公开发售比例 | 10.0% | -| 超额配股权股数 | 8,708,160 | - -## 短线退出模型推断 - -- D1 正收益概率:76.4% -- D1 涨幅不低于 10% 概率:47.2% -- 同分桶历史 D1 平均收益:28.6% -- 同分桶历史 D1 中位收益:9.6% -- T2 暗盘卖出收益暂未建模,直到项目确认可靠暗盘数据源。 -- D5/D20/D60 只作为复盘标签,不是持仓目标。 - -## 评分拆解 - -| 评分项 | 分数 | 原因代码 | -| --- | ---: | --- | -| 发行规模 | 4 | `800m_to_2000m` | -| 初始公开发售比例 | 1 | `5pct_to_10pct` | -| 最低认购金额 | 2 | `3500_to_10000` | -| 发行价 | 1 | `5_to_30` | -| 超额配股权 | 1 | `present` | - -## 正面因素 - -- 发行规模:+4 (`800m_to_2000m`)。 -- 最低认购金额:+2 (`3500_to_10000`)。 -- 初始公开发售比例:+1 (`5pct_to_10pct`)。 -- 发行价:+1 (`5_to_30`)。 -- 超额配股权:+1 (`present`)。 - -## 风险与缺口 - -- 没有明显负向评分项。 -- 本阶段必需字段没有明显空缺。 -- T0 使用招股书最高发售价 HK$21.00;招股书披露的发行区间为 HK$18.20 至 HK$21.00,最终发行价需等 T1 分配结果公告确认。 -- T2 暗盘信号暂未使用,因为项目还没有批准可复现的数据源。 -- 上市后的 D5/D20/D60 表现只用于后续复盘,不是本模型的持仓周期目标。 - -## 触发条件 - -- 上调:T1 认购热度显著更强、分配稀缺性更好,或出现有规则支持的新正面催化。 -- 下调:公开或国际需求偏弱、供给过大、关键字段质量不足,或市场窗口明显转差。 - -## 退出计划 - -- 如果申购并获配,且 T2 暗盘数据可靠且可执行,优先按 T2 暗盘卖出计划处理。 -- 如果 T2 不可用或不可靠,默认使用 D1 作为卖出窗口。 -- 不把 D5/D20/D60 作为本模型的计划持仓周期。 -- 后续记录 D1/D5/D20/D60 结果时,只作为复盘标签,不作为倒推预测输入。 - -## 来源路径 - -- `data/raw/02335/prospectus_2026-06-15_2026061500009.pdf` diff --git a/reports/2026-06-15_06067_T0_prospectus_analysis.md b/reports/2026-06-15_06067_T0_prospectus_analysis.md deleted file mode 100644 index c5563a1..0000000 --- a/reports/2026-06-15_06067_T0_prospectus_analysis.md +++ /dev/null @@ -1,97 +0,0 @@ -# 06067 深圳市星源材质科技股份有限公司 IPO 分析报告 - -## 摘要 - -- 股票代码:`06067` -- 公司:深圳市星源材质科技股份有限公司(Shenzhen Senior Technology Material Co., Ltd.) -- 分析阶段:`T0_prospectus` -- 报告生成时间:`2026-06-15T17:05:00Z` -- 模型数据时间:`2026-06-15T17:05:00Z` -- 规则版本:`ipo_score_v0` -- 规则路径:`rules/ipo_score_v0.yaml` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出。 -- 结论代码:`strong_watch` -- 执行动作:T0 强关注,仍需等待 T1 认购热度确认后执行 T2/D1 退出纪律。 -- T0 分数:`8` -- 分数分桶:`t0_gte_8` -- 历史校准 D1 正收益概率:76.4%,样本数 72 - -## 阶段日期表 - -| 阶段 | 本 IPO 对应日期 | 含义 | -| --- | --- | --- | -| `T0_prospectus` | 2026-06-12 至 2026-06-17 | 申购前/申购中阶段;只使用招股书和发行条款。 | -| `T1_allotment` | 2026-06-22 | 分配结果日;使用公开认购热度、国际配售热度和分配事实。 | -| `T2_grey_market` | 2026-06-22 分配结果公布后 / D1 前一交易日 | 上市前暗盘窗口;只有存在可靠且可执行的数据源时才作为卖出依据。 | -| `D1` | 2026-06-23 | 正式上市首日;T2 数据不可用或不可靠时的默认卖出窗口。 | - -## 基础事实 - -| 字段 | 数值 | -| --- | --- | -| 板块 | Main Board | -| 状态 | open_for_subscription | -| 上市日期 | 2026-06-23 | -| 申购期 | 2026-06-12 至 2026-06-17 | -| 分配结果日期 | 2026-06-22 | -| 上市方式 | 未记录 | -| 行业 | Lithium-ion battery separators | -| 保荐人 | 未记录 | -| 发行价(T0最高发售价) | HK$8.98 | -| 发行规模 | HK$1,342.7m | -| 市值 | HK$26,653.3m | -| 每手股数 | 500 | -| 最低认购金额 | HK$4,535.28 | -| 初始公开发售比例 | 10.0% | -| 超额配股权股数 | 0 | - -## 短线退出模型推断 - -- D1 正收益概率:76.4% -- D1 涨幅不低于 10% 概率:47.2% -- 同分桶历史 D1 平均收益:28.6% -- 同分桶历史 D1 中位收益:9.6% -- T2 暗盘卖出收益暂未建模,直到项目确认可靠暗盘数据源。 -- D5/D20/D60 只作为复盘标签,不是持仓目标。 - -## 评分拆解 - -| 评分项 | 分数 | 原因代码 | -| --- | ---: | --- | -| 发行规模 | 4 | `800m_to_2000m` | -| 初始公开发售比例 | 1 | `5pct_to_10pct` | -| 最低认购金额 | 2 | `3500_to_10000` | -| 发行价 | 1 | `5_to_30` | -| 超额配股权 | 0 | `missing_or_zero` | - -## 正面因素 - -- 发行规模:+4 (`800m_to_2000m`)。 -- 最低认购金额:+2 (`3500_to_10000`)。 -- 初始公开发售比例:+1 (`5pct_to_10pct`)。 -- 发行价:+1 (`5_to_30`)。 - -## 风险与缺口 - -- 没有明显负向评分项。 -- 本阶段必需字段没有明显空缺。 -- T0 使用招股书最高发售价,最终发行价需等 T1 分配结果公告确认。 -- 招股书注明国际发售没有超额配股权,因此本报告按 0 股处理。 -- T2 暗盘信号暂未使用,因为项目还没有批准可复现的数据源。 -- 上市后的 D5/D20/D60 表现只用于后续复盘,不是本模型的持仓周期目标。 - -## 触发条件 - -- 上调:T1 认购热度显著更强、分配稀缺性更好,或出现有规则支持的新正面催化。 -- 下调:公开或国际需求偏弱、供给过大、关键字段质量不足,或市场窗口明显转差。 - -## 退出计划 - -- 如果申购并获配,且 T2 暗盘数据可靠且可执行,优先按 T2 暗盘卖出计划处理。 -- 如果 T2 不可用或不可靠,默认使用 D1 作为卖出窗口。 -- 不把 D5/D20/D60 作为本模型的计划持仓周期。 -- 后续记录 D1/D5/D20/D60 结果时,只作为复盘标签,不作为倒推预测输入。 - -## 来源路径 - -- `data/raw/06067/prospectus_2026-06-12_2026061200031.pdf` diff --git a/reports/2026-06-15_06106_T0_prospectus_analysis.md b/reports/2026-06-15_06106_T0_prospectus_analysis.md deleted file mode 100644 index dace0cc..0000000 --- a/reports/2026-06-15_06106_T0_prospectus_analysis.md +++ /dev/null @@ -1,96 +0,0 @@ -# 06106 上海仙工智能科技股份有限公司 IPO 分析报告 - -## 摘要 - -- 股票代码:`06106` -- 公司:上海仙工智能科技股份有限公司(Shanghai Seer Intelligent Technology Co., Ltd.) -- 分析阶段:`T0_prospectus` -- 报告生成时间:`2026-06-15T15:00:00Z` -- 模型数据时间:`2026-06-15T14:04:34Z` -- 规则版本:`ipo_score_v0` -- 规则路径:`rules/ipo_score_v0.yaml` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出。 -- 结论代码:`strong_watch` -- 执行动作:T0 强关注,仍需等待 T1 认购热度确认后执行 T2/D1 退出纪律。 -- T0 分数:`11` -- 分数分桶:`t0_gte_8` -- 历史校准 D1 正收益概率:76.4%,样本数 72 - -## 阶段日期表 - -| 阶段 | 本 IPO 对应日期 | 含义 | -| --- | --- | --- | -| `T0_prospectus` | 2026-06-15 至 2026-06-18 | 申购前/申购中阶段;只使用招股书和发行条款。 | -| `T1_allotment` | 2026-06-23 | 分配结果日;使用公开认购热度、国际配售热度和分配事实。 | -| `T2_grey_market` | 2026-06-23 分配结果公布后 | 上市前暗盘窗口;只有存在可靠且可执行的数据源时才作为卖出依据。 | -| `D1` | 2026-06-24 | 正式上市首日;T2 数据不可用或不可靠时的默认卖出窗口。 | - -## 基础事实 - -| 字段 | 数值 | -| --- | --- | -| 板块 | Main Board | -| 状态 | open_for_subscription | -| 上市日期 | 2026-06-24 | -| 申购期 | 2026-06-15 至 2026-06-18 | -| 分配结果日期 | 2026-06-23 | -| 上市方式 | 未记录 | -| 行业 | Industrial intelligent robots / robot controllers | -| 保荐人 | 未记录 | -| 发行价 | HK$101.60 | -| 发行规模 | HK$1,066.5m | -| 市值 | HK$11,226.5m | -| 每手股数 | 50 | -| 最低认购金额 | HK$5,131.24 | -| 初始公开发售比例 | 5.0% | -| 超额配股权股数 | 1,574,550 | - -## 短线退出模型推断 - -- D1 正收益概率:76.4% -- D1 涨幅不低于 10% 概率:47.2% -- 同分桶历史 D1 平均收益:28.6% -- 同分桶历史 D1 中位收益:9.6% -- T2 暗盘卖出收益暂未建模,直到项目确认可靠暗盘数据源。 -- D5/D20/D60 只作为复盘标签,不是持仓目标。 - -## 评分拆解 - -| 评分项 | 分数 | 原因代码 | -| --- | ---: | --- | -| 发行规模 | 4 | `800m_to_2000m` | -| 初始公开发售比例 | 3 | `lte_5pct` | -| 最低认购金额 | 2 | `3500_to_10000` | -| 发行价 | 1 | `gte_100` | -| 超额配股权 | 1 | `present` | - -## 正面因素 - -- 发行规模:+4 (`800m_to_2000m`)。 -- 初始公开发售比例:+3 (`lte_5pct`)。 -- 最低认购金额:+2 (`3500_to_10000`)。 -- 发行价:+1 (`gte_100`)。 -- 超额配股权:+1 (`present`)。 - -## 风险与缺口 - -- 没有明显负向评分项。 -- 本阶段必需字段没有明显空缺。 -- T2 暗盘信号暂未使用,因为项目还没有批准可复现的数据源。 -- 上市后的 D5/D20/D60 表现只用于后续复盘,不是本模型的持仓周期目标。 - -## 触发条件 - -- 上调:T1 认购热度显著更强、分配稀缺性更好,或出现有规则支持的新正面催化。 -- 下调:公开或国际需求偏弱、供给过大、关键字段质量不足,或市场窗口明显转差。 - -## 退出计划 - -- 如果申购并获配,且 T2 暗盘数据可靠且可执行,优先按 T2 暗盘卖出计划处理。 -- 如果 T2 不可用或不可靠,默认使用 D1 作为卖出窗口。 -- 不把 D5/D20/D60 作为本模型的计划持仓周期。 -- 后续记录 D1/D5/D20/D60 结果时,只作为复盘标签,不作为倒推预测输入。 - -## 来源路径 - -- `data/raw/06106/prospectus_candidate_2026-06-15.pdf` diff --git a/reports/2026-06-15_06132_T0_prospectus_analysis.md b/reports/2026-06-15_06132_T0_prospectus_analysis.md deleted file mode 100644 index df4b66e..0000000 --- a/reports/2026-06-15_06132_T0_prospectus_analysis.md +++ /dev/null @@ -1,96 +0,0 @@ -# 06132 华健未来(成都)科技股份有限公司 IPO 分析报告 - -## 摘要 - -- 股票代码:`06132` -- 公司:华健未来(成都)科技股份有限公司(HJ Science Co., Ltd.) -- 分析阶段:`T0_prospectus` -- 报告生成时间:`2026-06-15T16:00:00Z` -- 模型数据时间:`2026-06-15T16:00:00Z` -- 规则版本:`ipo_score_v0` -- 规则路径:`rules/ipo_score_v0.yaml` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出。 -- 结论代码:`strong_watch` -- 执行动作:T0 强关注,仍需等待 T1 认购热度确认后执行 T2/D1 退出纪律。 -- T0 分数:`10` -- 分数分桶:`t0_gte_8` -- 历史校准 D1 正收益概率:76.4%,样本数 72 - -## 阶段日期表 - -| 阶段 | 本 IPO 对应日期 | 含义 | -| --- | --- | --- | -| `T0_prospectus` | 2026-06-12 至 2026-06-17 | 申购前/申购中阶段;只使用招股书和发行条款。 | -| `T1_allotment` | 2026-06-22 | 分配结果日;使用公开认购热度、国际配售热度和分配事实。 | -| `T2_grey_market` | 2026-06-22 分配结果公布后 / D1 前一交易日 | 上市前暗盘窗口;只有存在可靠且可执行的数据源时才作为卖出依据。 | -| `D1` | 2026-06-23 | 正式上市首日;T2 数据不可用或不可靠时的默认卖出窗口。 | - -## 基础事实 - -| 字段 | 数值 | -| --- | --- | -| 板块 | Main Board | -| 状态 | open_for_subscription | -| 上市日期 | 2026-06-23 | -| 申购期 | 2026-06-12 至 2026-06-17 | -| 分配结果日期 | 2026-06-22 | -| 上市方式 | 未记录 | -| 行业 | Clinical-stage biotechnology | -| 保荐人 | 未记录 | -| 发行价 | HK$81.80 | -| 发行规模 | HK$1,112.5m | -| 市值 | HK$6,020.4m | -| 每手股数 | 100 | -| 最低认购金额 | HK$8,262.49 | -| 初始公开发售比例 | 10.0% | -| 超额配股权股数 | 2,040,000 | - -## 短线退出模型推断 - -- D1 正收益概率:76.4% -- D1 涨幅不低于 10% 概率:47.2% -- 同分桶历史 D1 平均收益:28.6% -- 同分桶历史 D1 中位收益:9.6% -- T2 暗盘卖出收益暂未建模,直到项目确认可靠暗盘数据源。 -- D5/D20/D60 只作为复盘标签,不是持仓目标。 - -## 评分拆解 - -| 评分项 | 分数 | 原因代码 | -| --- | ---: | --- | -| 发行规模 | 4 | `800m_to_2000m` | -| 初始公开发售比例 | 1 | `5pct_to_10pct` | -| 最低认购金额 | 2 | `3500_to_10000` | -| 发行价 | 2 | `30_to_100` | -| 超额配股权 | 1 | `present` | - -## 正面因素 - -- 发行规模:+4 (`800m_to_2000m`)。 -- 最低认购金额:+2 (`3500_to_10000`)。 -- 发行价:+2 (`30_to_100`)。 -- 初始公开发售比例:+1 (`5pct_to_10pct`)。 -- 超额配股权:+1 (`present`)。 - -## 风险与缺口 - -- 没有明显负向评分项。 -- 本阶段必需字段没有明显空缺。 -- T2 暗盘信号暂未使用,因为项目还没有批准可复现的数据源。 -- 上市后的 D5/D20/D60 表现只用于后续复盘,不是本模型的持仓周期目标。 - -## 触发条件 - -- 上调:T1 认购热度显著更强、分配稀缺性更好,或出现有规则支持的新正面催化。 -- 下调:公开或国际需求偏弱、供给过大、关键字段质量不足,或市场窗口明显转差。 - -## 退出计划 - -- 如果申购并获配,且 T2 暗盘数据可靠且可执行,优先按 T2 暗盘卖出计划处理。 -- 如果 T2 不可用或不可靠,默认使用 D1 作为卖出窗口。 -- 不把 D5/D20/D60 作为本模型的计划持仓周期。 -- 后续记录 D1/D5/D20/D60 结果时,只作为复盘标签,不作为倒推预测输入。 - -## 来源路径 - -- `data/raw/06132/prospectus_2026-06-12_2026061200083.pdf` diff --git a/reports/2026-06-15_analysis_model_v0.md b/reports/2026-06-15_analysis_model_v0.md deleted file mode 100644 index 180fe51..0000000 --- a/reports/2026-06-15_analysis_model_v0.md +++ /dev/null @@ -1,103 +0,0 @@ -# HK IPO Analysis Model v0 - -- Model version: `ipo_score_v0` -- Analysis as of: `2026-06-22T13:57:38Z` -- Rule file: `rules/ipo_score_v0.yaml` -- Dataset: `data/snapshots/analysis_model_v0_dataset.csv` - -## What This Model Does - -This is the first analyst model built from the downloaded archive. It creates a repeatable feature table, scores each IPO using stage-safe rules, and calibrates the score buckets against archived D1 sell outcomes. It is intentionally transparent: the output includes every score component and the archived source paths used for each ticker. - -The model is built for a short IPO allocation trade: sell in T2 grey market when reliable executable data exists, or sell on D1 otherwise. It does not use grey-market data in v0 because T2 currently has no approved reproducible source. It also does not use post-listing returns as inputs; D1 is the primary sell label, while D5/D20/D60 are review labels only. - -## Data Inventory - -- IPO rows scored: 311 -- Rows with D1 labels: 274 -- Rows with structured T1 demand fields: 293 -- Rows with prospectus source path: 311 -- Rows with allotment source path: 293 -- Rows with offer size: 311 -- Rows with public oversubscription: 283 -- Rows with international oversubscription: 278 -- Rows with market heat snapshots: 18 -- Rows with T0.5 margin heat snapshots: 5 -- Rows with T0.95 late-order heat snapshots: 13 -- Rows with T0.5 margin heat and D1 labels: 0 -- Rows with T0.95 late-order heat and D1 labels: 0 -- Rows matched to external ipohk history: 102 -- Rows with external final oversubscription: 95 -- Rows with external final oversubscription and D1 labels: 85 -- Rows pending T1 structure: 18 (01191, 01688, 01956, 02272, 02335, 02667, 02672, 02697, 03661, 03952, 06067, 06106, 06132, 06228, 06715, 06915, 09630, 09637) -- T1 field-level blanks: public oversubscription 10, international oversubscription 15, valid applications 6, successful applications 18 - -## T0 Calibration - -T0 uses only prospectus-stage structure: offer size, initial public offer percentage, minimum subscription amount, offer price band, and over-allotment availability. - -| Bucket | N | D1 positive | D1 >= 10% | Avg D1 return | Median D1 return | -| --- | ---: | ---: | ---: | ---: | ---: | -| t0_1_to_4 | 60 | 63.3% | 40.0% | 9.6 | 3.1 | -| t0_5_to_7 | 105 | 73.3% | 51.4% | 40.1 | 13.2 | -| t0_gte_8 | 73 | 76.7% | 47.9% | 29.9 | 9.8 | -| t0_lt_1 | 36 | 58.3% | 33.3% | 12.8 | 2.3 | - -## T1 Calibration - -T1 adds allotment-stage demand: public subscription, international placing demand, valid application count, application success rate, and HK public offer reallocation. - -| Bucket | N | D1 positive | D1 >= 10% | Avg D1 return | Median D1 return | -| --- | ---: | ---: | ---: | ---: | ---: | -| total_0_to_9 | 68 | 58.8% | 30.9% | 3.3 | 0.2 | -| total_10_to_17 | 29 | 55.2% | 34.5% | 13.9 | 1.5 | -| total_18_to_25 | 49 | 75.5% | 51.0% | 31.3 | 13.4 | -| total_gte_26 | 60 | 95.0% | 88.3% | 87.3 | 83.3 | -| total_lt_0 | 68 | 61.8% | 23.5% | 0.4 | 1.0 | - -## T0.5 Market Heat - -T0.5 uses archived subscription-period margin heat snapshots. T0.95 is the near-deadline subset that is still actionable before the user's order cutoff. These are non-official live signals and are kept separate from T1 allotment demand. The current archive is not yet a historical training set: it has too few rows and no D1 labels for calibration. - -- Total market heat rows: 18 -- T0.5 margin rows: 5 -- T0.5 rows with D1 labels: 0 -- T0.95 late-order heat rows: 13 -- T0.95 rows with D1 labels: 0 - -## External Final Heat Proxy - -The ipohk history archive adds final public oversubscription, one-lot win rate, grey-market return, and first-day return where available. These fields are useful for coverage checks and post-hoc calibration, but they are not T0.5 inputs because they are final or near-final history. - -- External history rows matched into this dataset: 102 -- Matched rows with final oversubscription: 95 -- Matched rows with final oversubscription and D1 labels: 85 - -| Bucket | N | D1 positive | D1 >= 10% | Avg D1 return | Median D1 return | -| --- | ---: | ---: | ---: | ---: | ---: | -| external_os_1000x_to_5000x | 33 | 93.9% | 78.8% | 60.4 | 44.2 | -| external_os_100x_to_1000x | 21 | 61.9% | 38.1% | 8.8 | 4.2 | -| external_os_10x_to_100x | 7 | 28.6% | 14.3% | -23.0 | -21.9 | -| external_os_gte_5000x | 18 | 83.3% | 72.2% | 101.7 | 89.7 | -| external_os_lt_10x | 6 | 50.0% | 16.7% | 4.7 | -4.1 | - -## Current Read - -After the T1 demand text backfill, the strongest v0 T1 bucket is `total_gte_26` with 60 historical D1 observations and a 95.0% D1 positive rate. The model is most useful after allotment results are available; T0 is a watchlist filter rather than a final subscription call. - -The high-conviction bucket remains clearly differentiated, but the middle and low score buckets are still not monotonic. This refresh keeps the v0 score formula unchanged and updates empirical calibration only; future rule changes should come from reviewed prediction cards rather than overfitting this historical sample. - -## Usage - -1. Run `scripts/build_analysis_dataset.py` after archivist updates the database. -2. Use `t0_score` for prospectus-stage watchlisting. -3. Use `total_score`, `decision_band`, and `calibrated_d1_positive_rate` for T1-stage subscription cards. -4. Frame live decisions around a T2 or D1 sell, not long-term holding. -5. Treat D5/D20/D60 columns as review labels only, never as prediction inputs or holding targets. - -## Known Gaps - -- T1 is structurally complete for listed rows; residual field-level NULLs remain when the archived source does not explicitly state a demand field. -- Industry and issuer fundamentals are not sufficiently structured for model input. -- T2 grey-market signal is blocked pending an approved source. -- Extreme D1 returns should be audited before they drive rule changes. diff --git a/reports/2026-06-15_historical_data_audit.md b/reports/2026-06-15_historical_data_audit.md deleted file mode 100644 index c419bf0..0000000 --- a/reports/2026-06-15_historical_data_audit.md +++ /dev/null @@ -1,145 +0,0 @@ -# Historical Data Completeness Audit - -Audit date: 2026-06-15 -Audit target: Full historical Hong Kong IPO archive in `data/hk_ipo.sqlite` -Stage scope: T0, T1, T2, D1, D5, D20, D60, source integrity, PDF extracted text, and analysis-dataset readiness -Audit status: fail for full historical completeness; pass for source integrity and PDF-derived evidence completeness - -## Summary - -The archive is internally consistent at the raw-source and snapshot level, and the previous PDF extracted-text blind spot is now closed. The current archive is not yet complete enough to call the historical dataset fully analysis-ready across all intended stages. - -Main blockers: - -- T1 structured demand is incomplete: 137 tickers have allotment-results sources archived but no parsed `ipo_demand` row. -- T2 grey-market data remains unresolved: 291 listed tickers are blocked pending a reproducible source strategy. -- Due post-listing performance gaps remain: 18 D1, 18 D5, 18 D20, and 17 D60 tasks are open. - -Major non-blocking gaps: - -- Industry labels are mostly missing: 285 of 293 `ipo_master` rows are blank. -- Market-cap fields are mostly missing: 285 of 293 `offering_terms` rows are blank. -- Net proceeds are missing for 108 of 293 `offering_terms` rows. - -## Data Integrity - -Pass. - -- SQLite `PRAGMA integrity_check`: `ok`. -- SQLite foreign-key check: 0 violations. -- DB row counts match CSV snapshots for `ipo_master`, `offering_terms`, `ipo_demand`, `price_performance`, `new_listing_report_entries`, `source_refs`, `data_gaps`, `sync_runs`, `ticker_sync_state`, and `sync_tasks`. -- `source_refs`: 1,149 rows. -- Source path and file checks: 0 bad paths, 0 missing files, 0 null hashes, 0 hash mismatches. -- Source file extensions: 557 `.pdf`, 29 `.htm`, 273 `.json`, 290 `.xlsx`. - -## PDF Derived Evidence - -Pass. - -- PDF `source_refs`: 557. -- Extracted-text manifest rows: 557. -- Manifest status counts: 557 `ok`. -- Duplicate manifest source IDs: 0. -- Missing manifest rows for PDFs: 0. -- Orphan manifest rows: 0. -- Bad manifest PDF/text paths: 0. -- Missing extracted-text files: 0. -- PDF hash mismatches: 0. -- Text hash mismatches: 0. -- Zero or empty extractions: 0. -- Incremental extractor rerun result: 557 processed, 557 skipped unchanged, 557 manifest rows. - -This check is now required in `.codex/skills/hk-ipo-audit/SKILL.md` so future broad historical audits must reconcile PDF raw sources, extracted text, manifest rows, and hashes. - -## Stage Completeness - -IPO master sample: - -- Total IPO rows: 293. -- Status counts: 291 listed, 1 open for subscription, 1 pending listing. - -T0 prospectus: - -- `T0_prospectus`: 293 complete. -- Offering terms rows: 293. -- No IPO is missing an `offering_terms` row. -- Offer price is present for all 293 rows. - -T1 allotment: - -- `T1_allotment`: 291 complete, 2 pending not due. -- Pending-not-due tickers: `06106` due 2026-06-23, `06675` due 2026-06-16. -- Allotment result sources: 291 total, including 262 PDF and 29 HTM sources. -- `ipo_demand`: 154 rows across 154 tickers. -- T1 complete but no structured demand row: 137 tickers. -- Source-only T1 gaps by source format: 108 PDF, 29 HTM. -- Demand rows with missing fields: public oversubscription 10, valid applications 6, successful applications 7, international oversubscription 1. - -T2 grey market: - -- `T2_grey_market`: 291 blocked, 2 pending not due. -- `data_gaps`: 291 grey-market gaps. -- This remains a blocking completeness issue unless T2 is explicitly excluded from a model or analysis stage. - -Post-listing performance: - -- D1: 273 complete, 18 pending due, 2 pending not due. -- D5: 272 complete, 18 pending due, 3 pending not due. -- D20: 267 complete, 18 pending due, 8 pending not due. -- D60: 251 complete, 17 pending due, 25 pending not due. -- Existing `price_performance` rows have 0 missing core price fields. - -## Field Sufficiency - -Major gaps remain for richer qualitative and valuation analysis: - -- `ipo_master.industry_label` missing: 285 of 293. -- `ipo_master.application_start_date` missing: 45 of 293. -- `ipo_master.application_end_date` missing: 1 of 293. -- `ipo_master.allotment_results_expected_date` missing: 31 of 293. -- `offering_terms.board_lot` missing: 18 of 293. -- `offering_terms.min_subscription_amount_hkd` missing: 19 of 293. -- `offering_terms.global_offer_shares` missing: 11 of 293. -- `offering_terms.hk_offer_shares_initial` missing: 17 of 293. -- `offering_terms.international_offer_shares_initial` missing: 33 of 293. -- `offering_terms.public_offer_pct_initial` missing: 23 of 293. -- `offering_terms.market_cap_hkd_m` missing: 285 of 293. -- `offering_terms.net_proceeds_hkd_m` missing: 108 of 293. -- `offering_terms.issued_shares_upon_listing` missing: 45 of 293. - -## Analysis Dataset Readiness - -The v0 analysis dataset is structurally usable but not fully sufficient for T1/T2-aware feedback. - -- Dataset rows: 293. -- Missing `total_score`: 0. -- Missing prospectus source path: 0. -- Missing allotment source path: 2, matching the two pending-not-due T1 tickers. -- `has_structured_t1`: 154 yes, 139 no. -- Blank `t1_add_score`: 139. -- Blank `total_score_bucket`: 139. -- Missing D1 return: 20. -- Missing industry label: 285. -- Missing market cap: 285. - -Decision bands are populated for all rows, but many rows are effectively T0-only or T0-plus-partial-context because structured T1, T2, industry, and valuation fields are incomplete. - -## Required Fixes - -1. Route to `archivist`: use extracted PDF text and HTM raw notices to parse missing T1 demand facts for the 137 source-only allotment rows. -2. Route to `archivist`: decide and document a reproducible T2 grey-market source strategy, or formally exclude T2 from the v0 model scope. -3. Route to `archivist`: retry or source the open due D1/D5/D20/D60 price-performance tasks. -4. Route to `archivist`: backfill industry labels, market cap, net proceeds, issued shares, and missing offering-term fields. -5. Re-run `analyst` only after the relevant archive gaps are closed or explicitly marked out of scope for the model version being evaluated. - -## Audit Skill Self-Correction - -The prior audit skill failed to make derived evidence a mandatory check, which allowed archived PDFs without extracted text to pass unnoticed. The skill now requires broad historical audits to reconcile: - -- PDF `source_refs` -- `data/snapshots/extracted_text_manifest.csv` -- `data/extracted_text/` files -- PDF hashes -- extracted text hashes - -Missing derived text or manifest mismatches are now blocker issues for historical-data completeness. diff --git a/reports/2026-06-15_selected_T0_5_market_heat_trial.md b/reports/2026-06-15_selected_T0_5_market_heat_trial.md deleted file mode 100644 index 9d26385..0000000 --- a/reports/2026-06-15_selected_T0_5_market_heat_trial.md +++ /dev/null @@ -1,71 +0,0 @@ -# 2026-06-15 新股 T0.5 市场热度试算报告 - -## 摘要 - -- 覆盖标的:`01392` 深圳海清智元科技股份有限公司、`02335` 陕西麦科奥特医药科技股份有限公司、`06067` 深圳市星源材质科技股份有限公司、`06106` 上海仙工智能科技股份有限公司、`06132` 华健未来(成都)科技股份有限公司。 -- 分析阶段:`T0_5_market_heat`,在原 T0 招股书结构分基础上加入申购期间市场热度快照。 -- 热度数据时间:`2026-06-15T18:40:00Z` -- 热度来源:华盛证券新股列表,页面注明数据内容来源于捷利交易宝,且最终认购数据以港交所披露的配售结果为准。 -- 规则版本:`ipo_score_v0_5_market_heat_trial` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出。 - -本报告是试算,不改写原来的 T0 结论。T0.5 倍数是非官方、会滚动变化的市场热度信号,不能等同于 T1 分配结果里的官方公开认购倍数。 - -## T0.5 试算排序 - -| 排名 | 股票 | 中文名 | T0 分数 | T0.5 孖展倍数 | T0.5 加分 | T0+T0.5 | 试算结论 | PM 判断 | -| ---: | --- | --- | ---: | ---: | ---: | ---: | --- | --- | -| 1 | `06132` | 华健未来(成都)科技股份有限公司 | 10 | 135.39x | +3 | 13 | `high_heat_watch` | T0 结构已经强,T0.5 热度也进入 100x 以上,当前综合最稳。 | -| 2 | `01392` | 深圳海清智元科技股份有限公司 | 5 | 2195.84x | +6 | 11 | `active_watch` | T0 结构一般,但近截止前热度极强,属于热度显著补强。 | -| 3 | `06067` | 深圳市星源材质科技股份有限公司 | 8 | 109.20x | +3 | 11 | `active_watch` | T0 结构不错,T0.5 也过 100x,热度能部分抵消无超额配股权。 | -| 4 | `06106` | 上海仙工智能科技股份有限公司 | 11 | 48.07x | 0 | 11 | `active_watch` | T0 结构最佳,但申购刚开始,当前热度未到 100x;需要 2026-06-16/17 复采样。 | -| 5 | `02335` | 陕西麦科奥特医药科技股份有限公司 | 9 | 4.78x | -3 | 6 | `wait_for_T1` | T0 结构尚可,但首日热度偏弱,暂时从强关注降到等待确认。 | - -读法:`T0+T0.5` 不是最终申购分。它只回答“招股书结构 + 当前市场热度”这一刻怎么看。最终是否申购仍要等 T1 的官方公开认购倍数、国际配售、中签率和回拨结果。 - -## T0.5 评分规则 - -| T0.5 孖展倍数 | 加分 | 含义 | -| --- | ---: | --- | -| 缺失 | 0 | 没有可复现快照,不做判断。 | -| < 10x | -3 | 当前公开热度弱,需等待 T1 或回避。 | -| 10x 至 100x | 0 | 有热度但未形成强确认。 | -| 100x 至 1000x | +3 | 市场热度明显。 | -| 1000x 至 5000x | +6 | 市场热度很强,但要留意临近截止偏差。 | -| >= 5000x | +8 | 极强热度,需要重点复核口径和资金拥挤风险。 | - -## 生命周期偏差 - -| 股票 | 申购开始 | 热度源显示截止 | 生命周期判断 | 解读 | -| --- | --- | --- | --- | --- | -| `01392` | 2026-06-11 | 2026-06-16 10:00 | 接近截止 | 2195.84x 更接近尾段热度,可信度较高,但可能也反映资金拥挤。 | -| `06067` | 2026-06-12 | 2026-06-17 10:00 | 中后段 | 109.20x 是有效补强,仍需看最后一天是否继续放大。 | -| `06132` | 2026-06-12 | 2026-06-17 10:00 | 中后段 | 135.39x 与 T0 高分同向,当前综合最强。 | -| `06106` | 2026-06-15 | 2026-06-18 10:00 | 早段 | 48.07x 不算弱,但与中后段标的不能直接横比;需要复采样。 | -| `02335` | 2026-06-15 | 2026-06-18 10:00 | 早段 | 4.78x 首日偏弱,若后续不能快速放大,T1 风险较高。 | - -不同标的处在不同申购生命周期,不能只按倍数机械排序。`06106` 和 `02335` 都是 2026-06-15 才开始申购,低于 2026-06-12 或 2026-06-11 开始申购的标的,需要在 2026-06-16 和 2026-06-17 再采样。 - -## 相比原 T0 结论的变化 - -- `06132`:维持强关注,并升为 T0.5 综合首选。结构与热度同向。 -- `01392`:从 T0 的 `positive_watch` 升为 `active_watch`。这是热度驱动,不是结构改善。 -- `06067`:维持 `active_watch`。100x 以上热度让它比纯 T0 阶段更有确认度。 -- `06106`:结构仍然最好,但 T0.5 当前只给中性热度;不能因为首日 48.07x 就降级,关键是复采样。 -- `02335`:T0 结构分不差,但 T0.5 首日热度弱,暂时降为等待 T1 或等待后续热度明显改善。 - -## 当前执行建议 - -- `06132`:若 T1 官方认购和国际配售继续强,优先级最高。 -- `01392`:热度很强,但 T0 结构不如前三只,若获配应严格按 T2/D1 卖出,不把热度当长期理由。 -- `06067`:若最后一天热度继续上升,优先级可接近 `06132`;若停滞,则回到结构中性偏强。 -- `06106`:2026-06-16/17 必须复采样。若孖展倍数上破 100x,凭 T0 结构优势可重新回到首选组。 -- `02335`:除非后续热度明显改善,或 T1 官方需求强于当前 T0.5 读数,否则不应排在前列。 - -## 数据来源 - -- 结构分来源:`reports/2026-06-15_selected_T0_horizontal_analysis.md` -- T0.5 规则:`rules/ipo_score_v0_5_market_heat_trial.yaml` -- 原始热度快照:`data/raw/market_heat/vbkr_ipo_hk_index_20260615T184000Z.html` -- 结构化热度快照:`data/snapshots/ipo_market_heat.csv` -- 数据库表:`ipo_market_heat` diff --git a/reports/2026-06-15_selected_T0_horizontal_analysis.md b/reports/2026-06-15_selected_T0_horizontal_analysis.md deleted file mode 100644 index 6ddd9ef..0000000 --- a/reports/2026-06-15_selected_T0_horizontal_analysis.md +++ /dev/null @@ -1,104 +0,0 @@ -# 2026-06-15 新股 T0 横向分析报告 - -## 摘要 - -- 覆盖标的:`01392` 深圳海清智元科技股份有限公司、`02335` 陕西麦科奥特医药科技股份有限公司、`06067` 深圳市星源材质科技股份有限公司、`06106` 上海仙工智能科技股份有限公司、`06132` 华健未来(成都)科技股份有限公司。 -- 分析阶段:全部按 `T0_prospectus` 处理,只使用招股书与发行条款,不使用未来 T1/T2/D1 事实。 -- 数据时间:`2026-06-15T18:20:00Z` -- 规则版本:`ipo_score_v0` -- 策略周期:短线 IPO 申购交易;优先在可靠 T2 暗盘卖出,否则默认 D1 卖出,不以 D5/D20/D60 作为持仓目标。 - -## 总排序 - -| 排名 | 股票 | 中文名 | T0 结论 | T0 分数 | 同分桶 D1 正收益概率 | PM 判断 | -| ---: | --- | --- | --- | ---: | ---: | --- | -| 1 | `06106` | 上海仙工智能科技股份有限公司 | `strong_watch` | 11 | 76.4% | 结构最好,5% 初始公开发售比例给稀缺性加分,T1 若热度确认可作为首选。 | -| 2 | `06132` | 华健未来(成都)科技股份有限公司 | `strong_watch` | 10 | 76.4% | 发行结构强,价格带较高,生物科技属性需要 T1 热度验证。 | -| 3 | `02335` | 陕西麦科奥特医药科技股份有限公司 | `strong_watch` | 9 | 76.4% | 结构分不错,发行区间价仍待 T1 确认,生物科技赛道弹性与不确定性并存。 | -| 4 | `06067` | 深圳市星源材质科技股份有限公司 | `strong_watch` | 8 | 76.4% | 发行规模合适,但无超额配股权且市值最大,短线弹性需靠 T1 需求补强。 | -| 5 | `01392` | 深圳海清智元科技股份有限公司 | `positive_watch` | 5 | 73.3% | T0 条款不弱但结构优势较少,适合等 T1 再决定是否参与。 | - -当前 T0 横向结论:`06106` 是最干净的 T0 结构首选;`06132` 与 `02335` 属于强关注但要接受生物科技题材波动;`06067` 是强关注里的偏保守候选;`01392` 更适合等待 T1 热度确认。 - -## 阶段日期 - -| 股票 | T0 申购窗口 | T1 分配结果 | T2 暗盘窗口 | D1 上市日 | -| --- | --- | --- | --- | --- | -| `01392` | 2026-06-11 至 2026-06-16 | 2026-06-18 | 2026-06-19,预计 D1 前一交易日 | 2026-06-22 | -| `06067` | 2026-06-12 至 2026-06-17 | 2026-06-22 | 2026-06-22 分配结果公布后 / D1 前一交易日 | 2026-06-23 | -| `06132` | 2026-06-12 至 2026-06-17 | 2026-06-22 | 2026-06-22 分配结果公布后 / D1 前一交易日 | 2026-06-23 | -| `02335` | 2026-06-15 至 2026-06-18 | 2026-06-23 | 2026-06-23 分配结果公布后 / D1 前一交易日 | 2026-06-24 | -| `06106` | 2026-06-15 至 2026-06-18 | 2026-06-23 | 2026-06-23 分配结果公布后 / D1 前一交易日 | 2026-06-24 | - -## 发行结构对比 - -| 股票 | 行业 | 发行价口径 | 发行规模 | 市值 | 初始公开比例 | 每手金额 | 超额配股权 | -| --- | --- | --- | ---: | ---: | ---: | ---: | ---: | -| `06106` | 工业智能机器人 / 机器人控制器 | HK$101.60 | HK$1,066.5m | HK$11,226.5m | 5.0% | HK$5,131.24 | 1,574,550 | -| `06132` | 临床阶段生物科技 | HK$81.80 | HK$1,112.5m | HK$6,020.4m | 10.0% | HK$8,262.49 | 2,040,000 | -| `02335` | 临床阶段生物科技 / 多肽药物 | T0 最高发售价 HK$21.00 | HK$1,219.1m | HK$6,966.5m | 10.0% | HK$4,242.36 | 8,708,160 | -| `06067` | 锂电池隔膜 | T0 最高发售价 HK$8.98 | HK$1,342.7m | HK$26,653.3m | 10.0% | HK$4,535.28 | 0 | -| `01392` | 多光谱 AI 技术 | HK$7.20 | HK$613.2m | HK$5,574.3m | 10.0% | HK$3,636.31 | 未记录 | - -结构上,`06106` 的 5% 初始公开发售比例最突出,是 T0 分数高于其他标的的核心原因。`06132`、`02335`、`06067` 的发行规模都落在模型偏好的 HK$800m-HK$2,000m 区间。`01392` 发行规模较小,T0 结构分不如其他四只。 - -## 评分拆解 - -| 股票 | 发行规模 | 公开比例 | 每手金额 | 发行价 | 超额配股权 | T0 分数 | -| --- | ---: | ---: | ---: | ---: | ---: | ---: | -| `06106` | +4 | +3 | +2 | +1 | +1 | 11 | -| `06132` | +4 | +1 | +2 | +2 | +1 | 10 | -| `02335` | +4 | +1 | +2 | +1 | +1 | 9 | -| `06067` | +4 | +1 | +2 | +1 | 0 | 8 | -| `01392` | +1 | +1 | +2 | +1 | 0 | 5 | - -分数本身不是最终申购指令。T0 分数只能说明发行条款是否具备短线弹性基础;真正决定申购强弱的下一步是 T1 的公开认购倍数、有效申请数、成功率、国际配售热度和是否回拨。 - -## 分组判断 - -**第一组:优先观察** - -`06106`:T0 结构最强,公开发售比例只有 5%,发行规模处于模型偏好区间。T1 若出现高倍公开认购和较低中签率,它最容易从 `strong_watch` 进入高优先级申购候选。 - -**第二组:强关注但看 T1 热度** - -`06132` 与 `02335`:两只都是生物科技相关,发行结构都不错,但题材交易弹性和风险偏好更依赖当时市场窗口。若 T1 需求强,短线表现可能被放大;若 T1 热度一般,T0 高分不能单独支撑积极申购。 - -**第三组:结构稳但弹性要验证** - -`06067`:发行规模和每手金额较友好,但市值明显大于其他标的,且招股书注明无超额配股权。它不是弱标的,但相对更需要 T1 认购热度来证明短线资金愿意买单。 - -**第四组:等待确认** - -`01392`:T0 不是回避,但优势项主要来自每手金额、公开比例和发行价,发行规模加分较弱。更适合在 2026-06-18 的 T1 结果出来后再决定是否参与。 - -## T1 后升级条件 - -- `06106`:公开认购倍数显著高、有效申请数高、中签率低,且国际配售不弱。 -- `06132`:公开与国际需求同时强,尤其需要证明高发行价没有压制认购。 -- `02335`:最终发行价若不高于区间上限太多且需求强,优先级可上调。 -- `06067`:需要用公开认购和国际需求抵消无超额配股权、市值偏大的结构劣势。 -- `01392`:需要明显超预期的公开认购热度,否则维持观察而非主动优先。 - -## T1 后降级条件 - -- 公开认购倍数弱,或有效申请数不足。 -- 国际配售认购低于预期,或最终定价/配售结构显示机构需求不足。 -- 中签率过高,说明分配稀缺性不足。 -- T2 暗盘没有可靠数据源,且 D1 前市场窗口明显转弱。 - -## 执行纪律 - -- 不把任何一只作为长期持仓结论;本报告只服务 T2/D1 短线退出。 -- 如果获配且 T2 暗盘价格可靠、可执行,优先在 T2 处理。 -- 如果 T2 暗盘不可用或不可靠,默认 D1 卖出。 -- D5/D20/D60 后续只用于复盘和模型反馈,不作为本次申购持仓目标。 - -## 来源路径 - -- `data/raw/01392/prospectus_2026-06-11_2026061100015.pdf` -- `data/raw/02335/prospectus_2026-06-15_2026061500009.pdf` -- `data/raw/02335/prospectus_zh_2026-06-15_2026061500010_c.pdf` -- `data/raw/06067/prospectus_2026-06-12_2026061200031.pdf` -- `data/raw/06106/prospectus_candidate_2026-06-15.pdf` -- `data/raw/06132/prospectus_2026-06-12_2026061200083.pdf` diff --git a/reports/2026-06-15_t0_5_historical_model_rebuild.md b/reports/2026-06-15_t0_5_historical_model_rebuild.md deleted file mode 100644 index b7e6916..0000000 --- a/reports/2026-06-15_t0_5_historical_model_rebuild.md +++ /dev/null @@ -1,58 +0,0 @@ -# 2026-06-15 T0.5 历史数据与模型重建说明 - -## 结论 - -这次已经把可复现的历史数据接进模型,但不能把它称为“全部历史 T0.5 孖展倍数”。 - -- 真实 `T0_5_market_heat`:目前只有华盛/捷利页面的实时快照,已归档 5 条当前申购标的。 -- 历史结构化数据:`ipohk` 可提供 807 条历史上市数据,其中包括最终超购倍数、一手中签率、暗盘涨幅和首日涨幅。 -- 关键限制:`ipohk` 的“超购倍数”是最终或接近最终结果,不是申购过程中的 T0.5 孖展快照,不能倒灌进 T0.5。 - -所以,本次模型重建采用两层处理: - -1. `t0_5_*` 字段:真实申购期间孖展热度,只来自可归档快照。 -2. `external_*` 字段:历史最终热度与结果参照,只用于覆盖检查和后验校准。 - -## 本次新增数据 - -| 数据集 | 行数 | 用途 | 阶段安全性 | -| --- | ---: | --- | --- | -| `ipo_market_heat` | 5 | 当前申购标的 T0.5 孖展热度 | 可用于 T0.5,但历史样本不足 | -| `external_ipo_history` | 807 | 历史最终超购、中签率、暗盘、首日表现 | 后验参照,不可用于 T0/T0.5 决策 | -| `analysis_model_v0_dataset.csv` | 297 | 主模型训练/分析数据集 | 已加入 T0.5 与 external 字段 | - -## 重建后模型覆盖 - -- 主模型 IPO 行数:297 -- D1 标签:273 -- 真实 T0.5 孖展快照:5 -- 真实 T0.5 且有 D1 标签:0 -- 匹配到 `ipohk` 历史记录:102 -- 匹配到 `ipohk` 最终超购倍数:95 -- `ipohk` 最终超购倍数且有 D1 标签:85 - -## 如何读模型结果 - -真实 T0.5 目前还不能做统计回测,因为 5 条都是当前未上市标的,没有 D1 结果。 - -`ipohk` 历史最终超购倍数可以用来验证一个方向:高最终热度是否对应更好的 D1 胜率。但它不能回答“当时申购中途看到的孖展倍数是否有效”,因为它不是当时的冻结快照。 - -## 已更新文件 - -- 原始历史数据:`data/raw/external_history/ipohk_listed_20260615T191000Z.json` -- 结构化历史数据:`data/snapshots/external_ipo_history.csv` -- 主模型数据集:`data/snapshots/analysis_model_v0_dataset.csv` -- 模型报告:`reports/2026-06-15_analysis_model_v0.md` -- 历史归档脚本:`scripts/archive_ipohk_history.py` - -## 下一步 - -真正让 T0.5 进入可回测模型,需要从今天开始持续采样申购期快照。 - -建议采样节奏: - -- T0.5 early:申购首日收盘附近。 -- T0.5 mid:申购中段。 -- T0.5 final:截止前半天或截止前一晚。 - -未来每只 IPO 至少保留一到三个冻结快照,等 T1/T2/D1 出来后再做 `heat_miss`、`structure_miss` 和 `market_window_miss` 复盘。 diff --git a/reports/2026-06-15_t0_5_recent3y_statistics.md b/reports/2026-06-15_t0_5_recent3y_statistics.md deleted file mode 100644 index c334ee1..0000000 --- a/reports/2026-06-15_t0_5_recent3y_statistics.md +++ /dev/null @@ -1,104 +0,0 @@ -# 2026-06-15 最近三年 IPO T0.5 统计 - -## 统计口径 - -- 统计区间:`2023-06-15` 至 `2026-06-15`,按上市日期筛选。 -- 数据截至: - - `ipo_master`:`2026-06-15T18:20:00Z` - - `ipo_market_heat`:`2026-06-15T18:40:00Z` - - `external_ipo_history`:`2026-06-15T19:10:00Z` - - `price_performance`:`2026-06-15T10:00:00Z` -- 真实 T0.5:申购期间抓取的非官方市场热度快照,例如券商聚合孖展认购倍数,来源表为 `ipo_market_heat`。 -- 后验代理:上市后可见的最终公开认购倍数,来源表为 `external_ipo_history.public_oversubscription_times`。它可以用来校准热度和 D1 表现的关系,但不能当作原始 T0.5 输入。 - -## 结论摘要 - -严格意义上,最近三年已上市 IPO 没有历史 T0.5 快照样本。 - -| 指标 | 数量 | 说明 | -| --- | ---: | --- | -| 仓库内最近三年已上市 IPO | 291 | `ipo_master.listing_date` 在统计区间内 | -| 最近三年已上市 IPO 的真实 T0.5 快照 | 0 | `ipo_market_heat` 快照从 `2026-06-15` 才开始归档 | -| 当前已归档真实 T0.5 快照 | 5 | 全部是未来上市标的,还没有 D1 标签 | -| 最近三年 `ipohk` 外部历史样本 | 99 | 可用于后验热度代理,不是 T0.5 | -| 最近三年外部样本中有最终公开认购倍数 | 93 | 可做分桶观察 | -| 最近三年外部样本中有仓库 D1 标签 | 89 | 用 `price_performance.stage='D1'` 的 `return_pct` | - -这个结果意味着:历史上不能复原“当时 T0.5 孖展倍数”,只能从现在开始持续采样。过去三年的最终公开认购倍数可以帮助我们理解“热度强弱最终对应的 D1 胜率”,但它是后验信息,不能倒灌进 T0/T0.5 决策。 - -## 当前真实 T0.5 快照 - -这些是已经进入 `ipo_market_heat` 的真实 T0.5 样本,但它们上市日在 `2026-06-15` 之后,所以不属于最近三年已上市历史回测样本。 - -| 股票 | 中文名 | 上市日期 | 观察时间 | 来源 | T0.5 孖展倍数 | -| --- | --- | --- | --- | --- | ---: | -| `01392` | 深圳海清智元科技股份有限公司 | `2026-06-22` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 2195.84x | -| `06067` | 深圳市星源材质科技股份有限公司 | `2026-06-23` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 109.20x | -| `06132` | 华健未来(成都)科技股份有限公司 | `2026-06-23` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 135.39x | -| `02335` | 陕西麦科奥特医药科技股份有限公司 | `2026-06-24` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 4.78x | -| `06106` | 上海仙工智能科技股份有限公司 | `2026-06-24` | `2026-06-15T18:40:00Z` | `VBKR/Jieli` | 48.07x | - -读法:这 5 条可以作为未来 T0.5 复盘的第一批冻结样本。等 T1、T2、D1 出来后,可以检查“当时观察到的孖展热度”是否提高了 T2/D1 卖出的胜率判断。 - -## 后验代理:最终公开认购倍数分桶 - -下表使用最近三年内能匹配到仓库主表的 `external_ipo_history.public_oversubscription_times` 分桶,并用仓库自己的 D1 标签做结果观察。它不是 T0.5 回测,只是热度代理校准。 - -| 最终公开认购倍数 | 样本数 | 有 D1 标签 | 平均一手中签率 | D1 正收益率 | 平均 D1 收益 | -| --- | ---: | ---: | ---: | ---: | ---: | -| `>=5000x` | 18 | 18 | 1.58% | 83.3% | 101.74% | -| `1000-5000x` | 36 | 32 | 3.19% | 93.8% | 62.29% | -| `100-1000x` | 23 | 21 | 7.35% | 61.9% | 8.77% | -| `10-100x` | 10 | 7 | 19.24% | 28.6% | -23.04% | -| `<10x` | 6 | 5 | 65.41% | 40.0% | -15.59% | -| `missing` | 6 | 6 | 7.16% | 33.3% | -10.11% | - -当前最有用的信号不是精确倍数,而是区间: - -- 最终热度超过 `1000x` 的样本,D1 胜率和平均 D1 收益都显著更好。 -- 最终热度在 `100-1000x` 的样本仍有正收益概率,但收益弹性明显下降。 -- 最终热度低于 `100x` 后,D1 结果明显不稳定,尤其 `10-100x` 和 `<10x` 的平均 D1 收益为负。 -- 热度越高,一手中签率越低。`>=5000x` 桶的一手中签率均值只有 1.58%,`1000-5000x` 桶也只有 3.19%。这类标的更像“小概率中签、高弹性卖出”的交易。 - -## 最近三年最终公开认购倍数 Top 20 - -这张表只用于观察“最终热度极强”的历史案例,不能当成当时 T0.5 可见信息。 - -| 排名 | 股票 | 中文名 | 上市日期 | 最终公开认购倍数 | 一手中签率 | 外部首日涨跌 | -| ---: | --- | --- | --- | ---: | ---: | ---: | -| 1 | `06871` | 翼菲科技 | `2026-05-18` | 14855x | 3.00% | 76.23% | -| 2 | `08610` | BBSB INTL | `2026-01-13` | 10745x | 0.05% | 11.67% | -| 3 | `02685` | 量化派 | `2025-11-27` | 9366x | 0.60% | 88.78% | -| 4 | `06872` | 丹诺医药-B | `2026-05-22` | 9015x | 0.80% | 178.73% | -| 5 | `01609` | 天星医疗 | `2026-05-05` | 7823x | 1.50% | 118.27% | -| 6 | `02539` | 乐摩科技 | `2025-12-03` | 7324x | 0.80% | 36.25% | -| 7 | `07666` | 剂泰科技-P | `2026-05-13` | 6910x | 0.14% | 126.67% | -| 8 | `02693` | 金岩高岭新材 | `2025-12-03` | 6876x | 0.03% | 2.19% | -| 9 | `01511` | 驭势科技 | `2026-05-20` | 6777x | 5.00% | 4.64% | -| 10 | `01236` | 乐动机器人 | `2026-05-11` | 6707x | 0.80% | 127.62% | -| 11 | `02630` | 旺山旺水-B | `2025-11-06` | 6238x | 1.68% | 145.73% | -| 12 | `01879` | 曦智科技-P | `2026-04-28` | 5784x | 6.00% | 383.62% | -| 13 | `02723` | 深演智能 | `2026-05-27` | 5480x | 1.00% | 265.77% | -| 14 | `09609` | 海伟股份 | `2025-11-28` | 5426x | 1.00% | 22.97% | -| 15 | `02649` | 优乐赛共享 | `2026-03-09` | 5297x | 0.04% | 43.64% | -| 16 | `02546` | 智汇矿业 | `2025-12-19` | 5248x | 1.00% | 90.69% | -| 17 | `02706` | 海致科技集团 | `2026-02-13` | 5065x | 0.06% | 242.20% | -| 18 | `01021` | 华沿机器人 | `2026-03-30` | 5059x | 5.00% | 8.24% | -| 19 | `02687` | 卓越睿新 | `2025-12-08` | 4813x | 1.00% | 87.26% | -| 20 | `06636` | 极视角 | `2026-03-30` | 4591x | 10.00% | 150.00% | - -## 对模型的建议 - -1. 保持 `T0.5` 和 `T1` 分离。T0.5 是申购期间快照,T1 是正式分配结果,二者不能互相填充。 -2. 从现在开始固定采样 T0.5:至少保留 `early`、`mid`、`final` 三个观察点,并记录 `observed_at`、来源、原始页面路径和倍数。 -3. T0.5 不要直接替代基本面评分。更适合做 watchlist 升降级:强 T0 + 强 T0.5 才是优先组合;弱 T0 + 极强 T0.5 需要防止纯情绪交易。 -4. 对短线退出模型来说,T0.5 的目标变量应仍然是 T2 或 D1 卖出结果,而不是 D5/D20/D60。 -5. 历史最终公开认购倍数可以作为校准锚点:如果未来真实 T0.5 在截止前接近 `1000x+`,可以提高 D1 正收益先验;但如果只是申购早期高热,需要等待后续采样验证持续性。 - -## 数据来源 - -- 真实 T0.5 原始页面:`data/raw/market_heat/vbkr_ipo_hk_index_20260615T184000Z.html` -- 真实 T0.5 结构化快照:`data/snapshots/ipo_market_heat.csv` -- 外部历史原始数据:`data/raw/external_history/ipohk_listed_20260615T191000Z.json` -- 外部历史结构化快照:`data/snapshots/external_ipo_history.csv` -- 仓库 D1 标签:`price_performance` 表,`stage='D1'` diff --git a/reports/2026-06-15_t1_demand_text_backfill.md b/reports/2026-06-15_t1_demand_text_backfill.md deleted file mode 100644 index ff261dc..0000000 --- a/reports/2026-06-15_t1_demand_text_backfill.md +++ /dev/null @@ -1,50 +0,0 @@ -# T1 Demand Text Backfill - -Run date: 2026-06-15 -Archive mode: `t1_demand_text_backfill` -Target: T1 allotment rows with archived allotment-results sources but missing `ipo_demand` - -## Result - -The T1 source-only demand gap was closed. - -- Initial source-only T1 demand gaps: 137. -- `ipo_demand` rows before backfill: 154. -- `ipo_demand` rows after backfill: 291. -- T1 complete rows without `ipo_demand`: 0. -- T1 pending-not-due rows: 2 (`06106`, `06675`). - -## Source Handling - -- Existing extracted PDF text supplied most of the backfill. -- Old HKEX HTML allotment-result pages were followed to their linked Summary PDFs. -- Clarification or supplemental notices that had been selected as allotment-results sources were corrected by archiving the primary allotment-results announcement from the same HKEX title-search window. -- New allotment-result PDF sources archived: 38. -- PDF source refs after backfill: 595. -- Extracted-text manifest rows after backfill: 595. -- Extracted-text manifest status: 595 `ok`. - -## Field Policy - -Only explicitly disclosed demand fields were stored. - -No missing demand field was inferred from share counts or other derived calculations. For example, where a Summary PDF disclosed valid applications, public subscription, international placee count, and final share counts but omitted successful applicants or international subscription level, the omitted fields were left null. - -## Verification - -- SQLite integrity check: `ok`. -- Foreign-key violations: 0. -- DB row counts match CSV snapshots for `ipo_master`, `offering_terms`, `ipo_demand`, `source_refs`, `sync_runs`, `ticker_sync_state`, and `sync_tasks`. -- `source_refs`: 1,187 rows, 0 bad paths, 0 missing files, 0 hash mismatches. -- PDF manifest reconciliation: 595 PDF sources, 595 manifest rows, 0 missing manifest rows, 0 orphan manifest rows, 0 missing text files, 0 PDF hash mismatches, 0 text hash mismatches. -- Incremental empty rerun selected 0 source-only gaps and wrote 0 rows. - -## Remaining Non-T1 Gaps - -The T1 structural gap is closed, but historical completeness is still not fully complete: - -- T2 grey-market remains blocked for 291 listed tickers pending a reproducible source strategy. -- Price-performance open tasks remain for D1/D5/D20/D60. -- Context fields such as industry label, market cap, and net proceeds remain incomplete. - -The v0 analysis dataset should be regenerated by `analyst` before using the new T1 demand facts for scoring or calibration.