向 OHLC 索取投标资料
原文: https://www.backtrader.com/blog/posts/2016-04-14-bidask-data-to-ohlc/bidask-data-to-ohlc/
最近,backtrader 通过实现行重写执行了一次从 ohlc land 的逃逸,这允许重新定义整个层次结构,例如,具有只包含 bid、ask 和 datetime 行的数据提要。
(此处为 OHLC 陆地的原始逃生)
这就引出了如何可视化这些数据的问题,这是以OHLC格式(无论是bar还是candlestick格式)最有效地实现的
需要采取的步骤:
- 
定义一个可以读取给定 bid/ask格式的数据馈送加载器
- 
决定将值分配给哪些字段,即: open、high、low和close(可能还有volume
- 
决定重采样方案 
源数据(10 行买卖数据):
Date,Time,Symbol,Status,Bid,Ask,Bid Vol,Ask Vol
01/03/16,23:43:11,EUR/JPY,D,,130.520,,1000000
01/03/16,23:43:27,EUR/JPY,D,,130.520,,2000000
01/03/16,23:49:19,EUR/JPY,D,,130.510,,500000
01/03/16,23:49:22,EUR/JPY,D,,130.530,,1500000
01/03/16,23:49:25,EUR/JPY,D,,130.540,,750000
01/03/16,23:49:27,EUR/JPY,D,,130.550,,900000
01/03/16,23:51:25,EUR/JPY,D,,130.500,,1200000
01/03/16,23:52:27,EUR/JPY,D,,130.495,,1100000
01/03/16,23:53:25,EUR/JPY,D,,130.480,,600000
01/03/16,23:54:27,EUR/JPY,D,,130.470,,900000 
之后:
- 
读取数据不会是一个大问题,因为最终结果必须是 OHLC,而这就是内置数据提要在解析后提供的内容。因为它是csv的另一个变体。我们甚至可以重用 GenericCSVData现有的提要。感谢上帝,它是通用
- 
每行只有一个价格元素和一个成交量元素,价格分配很明确:将价格分配给四个价格元素,将成交量分配给成交量 
- 
当涉及到重采样时,而不是向上采样到更大的时间范围,关键是条数,即:压缩 而内置的重采样器已经可以提供相同的时间段但经过压缩 
通过GenericCSVData将数据转换成 OHLC 格式:
 data = btfeeds.GenericCSVData(
        dataname=args.data,
        dtformat='%d/%m/%y',
        # tmformat='%H%M%S',  # already the default value
        # datetime=0,  # position at default
        time=1,  # position of time
        open=5,  # position of open
        high=5,
        low=5,
        close=5,
        volume=7,
        openinterest=-1,  # -1 for not present
        timeframe=bt.TimeFrame.Ticks) 
有些参数甚至不需要更改,即:
- 
tmformat:因为提要中的时间已经与默认格式匹配
- 
datetime:因为日期在 csv 流的第一个位置
其他人:
- 
time=1:表示时间与date不在一个字段中,且不在该字段的哪个位置
- 
open=5(与high、low、close相同):流中哪个字段将作为价格来源
- 
volume=7:同上
- 
openinterest=-1:负值表示该字段不存在
一旦数据在板上,就只需对其重新采样:
 cerebro.resampledata(data,
                         timeframe=bt.TimeFrame.Ticks,
                         compression=args.compression) 
我们提供与数据携带的TimeFrame.Ticks相同的timeframe,以确保数据没有上采样。compression作为来自命令行的参数,因此:compression=args.compression
执行示例:
$ ./bidask-to-ohlc.py --compression 2
2016-03-01 23:43:27,130.52,130.52,130.52,130.52,3000000.0
2016-03-01 23:49:22,130.51,130.53,130.53,130.53,2000000.0
2016-03-01 23:49:27,130.54,130.55,130.55,130.55,1650000.0
2016-03-01 23:52:27,130.5,130.5,130.5,130.495,2300000.0
2016-03-01 23:54:27,130.48,130.48,130.48,130.47,1500000.0 
不出所料,由于2被分配到压缩,我们已经从出价/询问格式变为OHLC格式,从10变为5行数据。
backtrader不能创造奇迹也就不足为奇了,使用一个不是原始行总数除数的压缩因子,它将产生rows / compression + 1新行:
$ ./bidask-to-ohlc.py --compression 3
2016-03-01 23:49:19,130.52,130.52,130.52,130.51,3500000.0
2016-03-01 23:49:27,130.53,130.55,130.55,130.55,3150000.0
2016-03-01 23:53:25,130.5,130.5,130.5,130.48,2900000.0
2016-03-01 23:54:27,130.47,130.47,130.47,130.47,900000.0 
在本例中为10 / 3 = 3.33333,这就是4行被传递的原因。
当然,现在手上拿着OHLC就可以绘制结果了。由于数据量少、数据方差低,以及matplotlib内部如何处理这种情况,因此图表并不十分好看。
样本代码(包含在backtrader的来源中)
from __future__ import (absolute_import, division, print_function,)
#                        unicode_literals)
import argparse
import datetime
import backtrader as bt
import backtrader.feeds as btfeeds
class St(bt.Strategy):
    def next(self):
        print(','.join(str(x) for x in [
            self.data.datetime.datetime(),
            self.data.open[0], self.data.high[0],
            self.data.high[0], self.data.close[0],
            self.data.volume[0]]))
def runstrat():
    args = parse_args()
    cerebro = bt.Cerebro()
    data = btfeeds.GenericCSVData(
        dataname=args.data,
        dtformat='%d/%m/%y',
        # tmformat='%H%M%S',  # already the default value
        # datetime=0,  # position at default
        time=1,  # position of time
        open=5,  # position of open
        high=5,
        low=5,
        close=5,
        volume=7,
        openinterest=-1,  # -1 for not present
        timeframe=bt.TimeFrame.Ticks)
    cerebro.resampledata(data,
                         timeframe=bt.TimeFrame.Ticks,
                         compression=args.compression)
    cerebro.addstrategy(St)
    cerebro.run()
    if args.plot:
        cerebro.plot(style='bar')
def parse_args():
    parser = argparse.ArgumentParser(
        formatter_class=argparse.ArgumentDefaultsHelpFormatter,
        description='BidAsk to OHLC')
    parser.add_argument('--data', required=False,
                        default='../../datas/bidask2.csv',
                        help='Data file to be read in')
    parser.add_argument('--compression', required=False, default=2, type=int,
                        help='How much to compress the bars')
    parser.add_argument('--plot', required=False, action='store_true',
                        help='Plot the vars')
    return parser.parse_args()
if __name__ == '__main__':
    runstrat() 


