2  数据获取与下载

2.1 股票行情数据

使用 baostock 的 query_history_k_data_plus() 接口下载 10 只股票 2020-01-01 至今的后复权日度行情,字段包括:日期、开盘价、收盘价、最高价、最低价、成交量、成交额。

每只股票均获得 1515 个交易日的完整数据,无缺失。

下载函数内置日志记录功能,每次下载的结果自动写入 download_log.txt,格式如下:

[2026-04-08 09:10:12] SUCCESS  stock_600036  shape=(1515, 7)
[2026-04-08 09:10:15] SUCCESS  stock_601398  shape=(1515, 7)
...

2.2 市场指数数据

下载两个指数的日度数据:

  • 沪深 300(000300):CAPM 分析的市场基准,必选
  • 中证 500(000905):覆盖中小盘股票,与沪深 300 互补,用于观察大小盘风格差异

两个指数均获得 1515 行数据,与个股交易日完全对齐。

2.3 宏观经济指标

下载两项月度宏观指标:

指标 来源 记录数 选择理由
CPI 同比增速 akshare macro_china_cpi_yearly() 70 条 反映物价水平,与货币政策和股市估值密切相关
M2 同比增速 akshare macro_china_money_supply() 74 条 衡量广义货币供应量,增速上升代表流动性宽松,理论上利好股市

2.4 财务指标

通过 baostock 的 query_profit_data() 获取 10 只股票 2020-2024 年共 5 个年度的财务数据,包括:

  • 净资产收益率(ROE):衡量股东权益回报效率
  • 净利润率:衡量盈利质量

数据以长格式(Long format)存储:每行为一只股票一个年度的一个指标,字段为 code, year, indicator, value,共 100 条记录。

2.5 下载日志

所有下载事件均记录在 download_log.txt 中,包含时间戳、状态(SUCCESS/FAILED)、数据标识和数据维度,便于追溯和复现。