Python 获取金融数据
在 Python 中,要进行量化分析,需要先获取金融数据,Python 中有多个库可以用于获取金融市场数据。
本站实例演示用到的库为 yfinance。
安装如下:
pip install yfinance
yfinance 库使用 yf.download() 函数下载金融数据的函数。
以下是它的基本语法格式:
yf.download(tickers, start=None, end=None, actions=False, threads=True)
参数说明:
tickers:
- 说明: 要下载数据的股票、指数、基金等金融工具的代码。
- 类型: 字符串(单个代码)或列表(多个代码)。
- 示例: "AAPL"、["AAPL", "GOOGL"]。
start:
- 说明: 下载数据的开始日期。
- 类型: 字符串(日期格式:"YYYY-MM-DD")。
- 默认值: None,表示从可获取的最早日期开始。
- 示例: "2020-01-01"。
end:
- 说明: 下载数据的结束日期。
- 类型: 字符串(日期格式:"YYYY-MM-DD")。
- 默认值: None,表示到可获取的最新日期结束。
- 示例: "2022-01-01"。
actions:
- 说明: 是否包括股票分红、拆股等信息。
- 类型: 布尔值。
- 默认值: False。
- 示例:
actions=True
。
threads:
- 说明: 是否使用多线程下载数据。
- 类型: 布尔值。
- 默认值: True。
- 示例:
threads=False
。
在 yfinance 中,中国 A 股的股票代码需要加上交易所的后缀,上海证券交易所(SSE)的后缀是 .SS,深圳证券交易所(SZSE)的后缀是 .SZ。
以下是一个使用 yfinance 获取贵州茅台(600519.SS)股票数据的简单实例:
import yfinance as yf
# 上海证券交易所,茅台公司股票代码
symbol = "600519.SS"
# 或者,深圳证券交易所,泸州老窖公司股票代码
# luzhou_laojiao_szse = yf.Ticker('000568.SZ')
# 获取茅台公司股票数据
maotai_data = yf.download(symbol, start="2022-01-01", end="2023-11-01")
# 打印数据的前几行
print(maotai_data.head())
以上代码我们使用 yfinance 的 download 函数获取了贵州茅台(600519.SS)的股票数据,时间范围是从 2022 年 1 月 1 日到 2023 年 11 月 1 日。返回的数据是一个包含日期(Date)、开盘价(Open)、最高价(High)、最低价(Low)、收盘价(Close)、成交量(Volume)和调整后的收盘价(Adj Close)等信息的 Pandas DataFrame。
Pandas DataFrame 内容可以参考:Pandas 数据结构 - DataFrame
执行以上代码,输出结果如下:
# python3 mt.py [*********************100%%**********************] 1 of 1 completed Open High Low Close Adj Close Volume Date 2022-01-04 2055.00000 2068.949951 2014.000000 2051.229980 1973.508057 3384262 2022-01-05 2045.00000 2065.000000 2018.000000 2024.000000 1947.309937 2839551 2022-01-06 2022.01001 2036.000000 1938.510010 1982.219971 1907.112793 5179475 2022-01-07 1975.00000 1988.880005 1939.319946 1942.000000 1868.416870 2981669 2022-01-10 1928.01001 1977.000000 1917.550049 1966.000000 1891.507568 2962670
Ticker 类
yfinance Ticker 类 用于获取特定金融工具的信息和实时数据。
Ticker
类构造函数:
- 用法:
yf.Ticker('AAPL')
- 描述:创建一个
Ticker
对象,代表特定股票或金融资产。在括号内传入股票代码(例如:'AAPL')。
history
方法:
- 用法:
ticker.history(period='1d', interval='1m')
- 描述:获取历史价格数据。
period
参数指定时间跨度,可以是'1d'
(一天)、'1mo'
(一个月)、'1y'
(一年)等;interval
参数指定时间间隔,可以是'1m'
(一分钟)、'1d'
(一天)、'1wk'
(一周)等。
info
属性:
- 用法:
ticker.info
- 描述:获取有关股票的基本信息,如公司名称、行业、市值等。
dividends
属性:
- 用法:
ticker.dividends
- 描述:获取分红数据,返回一个包含日期和分红金额的 DataFrame。
splits
属性:
- 用法:
ticker.splits
- 描述:获取拆股数据,返回一个包含日期和拆股比例的 DataFrame。
recommendations
属性:
- 用法:
ticker.recommendations
- 描述:获取股票的推荐信息,返回一个包含日期和推荐信息的 DataFrame。
major_holders
属性:
- 用法:
ticker.major_holders
- 描述:获取股票的主要持有者信息,返回一个包含主要股东和其持股比例的 DataFrame。
sustainability
属性:
- 用法:
ticker.sustainability
- 描述:获取股票的可持续性信息,返回一个包含环境、社会和治理(ESG)指标的 DataFrame。
actions
属性:
- 用法:
ticker.actions
- 描述:获取股票的行动数据,包括拆股、分红等。
calendar
属性:
- 用法:
ticker.calendar
- 描述:获取公司的财务日历信息,如报告季度财报的日期等。
以下代码使用了 yfinance 库中的 Ticker 类来获取 Microsoft 公司(股票代码:MSFT)的股票信息,包括基本信息、历史市场数据、股利、拆股、财务报表等:
import yfinance as yf
# 创建 Ticker 对象,表示对 Microsoft 公司的股票数据进行操作
msft = yf.Ticker("MSFT")
# 获取所有的股票信息
msft.info
# 获取历史市场数据,这里是过去一个月的数据
hist = msft.history(period="1mo")
# 显示历史数据的元信息(需要先调用 history() 函数)
msft.history_metadata
# 显示公司行为信息(股利、拆股、资本收益)
msft.actions
msft.dividends
msft.splits
msft.capital_gains # 仅适用于共同基金和交易所交易基金(etfs)
# 显示股票股数
msft.get_shares_full(start="2022-01-01", end=None)
# 显示财务报表:
# - 收入表
msft.income_stmt
msft.quarterly_income_stmt
# - 资产负债表
msft.balance_sheet
msft.quarterly_balance_sheet
# - 现金流量表
msft.cashflow
msft.quarterly_cashflow
# 若要查看更多选项,请参考 `Ticker.get_income_stmt()`
# 显示股东信息
msft.major_holders
msft.institutional_holders
msft.mutualfund_holders
# 显示未来和历史的盈利日期,返回最多未来4个季度和过去8个季度的数据,默认情况下。
# 注意:如果需要更多信息,可以使用 msft.get_earnings_dates(limit=XX),其中 XX 为增加的限制参数。
msft.earnings_dates
# 显示国际证券识别码(ISIN) - *实验性功能*
# ISIN = International Securities Identification Number
msft.isin
# 显示期权到期日期
msft.options
# 显示新闻
msft.news
# 获取特定到期日的期权链
opt = msft.option_chain('YYYY-MM-DD')
# 数据可通过 opt.calls, opt.puts 获取
获取多个股票数据
以下代码使用 yfinance 库初始化了一个包含多个股票代码的 Tickers 对象,并通过该对象访问了不同股票的信息、历史数据和行为:
import yfinance as yf
# 初始化包含多个股票代码的 Tickers 对象
tickers = yf.Tickers('msft aapl goog')
# 使用示例,访问每个股票的信息
tickers.tickers['MSFT'].info # 获取 Microsoft 公司(MSFT)的基本信息
tickers.tickers['AAPL'].history(period="1mo") # 获取 Apple 公司(AAPL)过去一个月的历史数据
tickers.tickers['GOOG'].actions # 获取 Google 公司(GOOG)的行为信息(股利、拆股等)
下载历史数据
以下代码使用 yfinance 库下载了标普 500 ETF(SPY)和苹果公司(AAPL)过去一个月的历史市场数据:
import yfinance as yf
# 使用 yfinance 下载标普500 ETF(SPY)和苹果公司(AAPL)的历史市场数据
data = yf.download("SPY AAPL", period="1mo")
period="1mo" 参数表示下载的时间范围是过去一个月。
更多金融库
以下是一些主要用于获取金融数据的库:
yfinance
- 官方网站: yfinance
- 简介: yfinance 是一个用于获取Yahoo Finance数据的库。它提供简单的API,允许用户获取股票、指数等金融数据。
- 安装:
pip install yfinance
Tushare
- 官方网站: Tushare
- 简介: Tushare 是一个开放的金融数据平台,提供了丰富的股票、期货、基金等金融市场数据的接口。它支持Python,提供了易于使用的API。
- 安装:
pip install tushare
pandas-datareader
- 官方网站: pandas-datareader
- 简介: pandas-datareader 是一个从多个在线数据源(如Yahoo Finance、Google Finance等)获取金融数据的库。
- 安装:
pip install pandas-datareader
- 官方网站: baostock
baostock
- 官方网站: baostock
- 简介: baostock 是一个免费提供A股、港股、期权等金融数据的库。它提供了Python接口,方便用户获取数据。
- 安装:
pip install baostock
alpha_vantage
- 官方网站: alpha_vantage
- 简介: alpha_vantage 提供了一个简单的API,可以用来获取股票、外汇等金融数据。它还支持一些技术指标的计算。
- 安装:
pip install alpha_vantage
quandl
- 官方网站: Quandl
- 简介: Quandl 提供了来自各种来源的金融和经济数据。它提供了Python库,方便用户获取数据。
- 安装:
pip install quandl
ccxt
- 官方网站: ccxt
- 简介: ccxt 是一个用于交易和获取金融数据的开源库,支持多个交易所的数据获取。
- 安装:
pip install ccxt
AKShare
- 官方网站: AKShare
- 简介: AKShare 是基于 Python 的财经数据接口库,目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、数据清洗到数据落地的一套工具,主要用于学术研究目的。
- 安装:
pip install akshare