
摘要
我们采用随机森林(random forests)与LSTM神经网络(更准确地说是CuDNNLSTM)作为训练方法,评估其在1993年1月至2018年12月期间对标准普尔500指数成分股日内价格方向变动进行样本外预测的有效性,以支持日内交易策略。我们引入了一种多特征设定,不仅包含相对于收盘价的收益率,还纳入了相对于开盘价的收益率以及日内收益率等多维特征。在交易策略方面,我们以Krauss等(2017)以及Fischer与Krauss(2018)的研究作为基准。在每个交易日,我们买入预测上涨概率最高的10只股票,同时做空预测下跌概率最低的10只股票,以实现超越市场表现的日内收益,且所有持仓均赋予相等的资金权重。实证结果表明,在扣除交易成本前,采用LSTM网络的多特征设定可获得每日0.64%的收益率,而随机森林模型则达到每日0.54%的收益率。相较之下,Fischer与Krauss(2018)及Krauss等(2017)所采用的单一特征设定(仅包含相对于收盘价的每日收益率)的对应日均收益率分别为0.41%(LSTM)和0.39%(随机森林),因此本研究提出的多特征设定在预测性能上显著优于前述基准方法。