طراحی مدل برای آربیتراژ آماری سهام با استفاده از شبکه‌های عصبی عمیق، جنگل‌های تصادفی و درخت‌‌های با شیب تقویت‌شده

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری، گروه مدیریت صنعتی و مالی، دانشکده مدیریت و حسابداری، پردیس فارابی، دانشگاه تهران، قم، ایران.

2 استادیار، گروه مدیریت صنعتی و مالی، دانشکده مدیریت و حسابداری، پردیس فارابی، دانشگاه تهران، قم، ایران.

3 استاد دانشکده مدیریت، دانشگاه تهران، تهران، ایران

4 استادیار، گروه مدیریت صنعتی و مالی، دانشکده مدیریت و حسابداری، پردیس فارابی، دانشگاه تهران

چکیده

آربیتراژ آماری، استراتژی‌ رایج سرمایه‌گذاری در بازارهای ناکاراست که نسبت به بازار خنثی بوده و بدون نیاز به سرمایه اولیه از هر دو جهت بازار کسب سود می‌کند. این تحقیق برآن است تا ضمن طراحی مدل‌های مناسب برای آربیتراژ آماری سهام با استفاده از الگوریتم شبکه‌های عصبی عمیق، جنگل‌های تصادفی، درخت با شیب تقویت شده و ترکیب ساده این مدل‌ها، به تحلیل و بررسی بازده و ریسک مدل‌های طراحی شده بپردازد. بدین منظور از اطلاعات همه شرکت‌های عضو بورس اوراق بهادار تهران از 1385 تا 1396 برای ایجاد سیگنال‌های معاملاتی استفاده شده است. طراحی مدل‌های تحقیق و کدنویسی‌های مربوطه و همچنین آزمون فرضیات تحقیق که با t-test مورد تحلیل قرار گرفته‌ در نرم‌افزار R انجام شده است. یافته‌های تحقیق نشان‌دهنده آن است که بیشترین مقدار بازده 24/4 درصد در هر روز برای k=5 است (بدون هزینه معاملات) که متعلق به مدل ترکیبی ساده (ENS) است. همچنین کمترین میزان ارزش در معرض ریسک (45/4%-) و کمترین مقدار ریزش مورد انتظار(57/5%-) برای k=20 متعلق به مدل شبکه عصبی عمیق(DNN) و بالاترین مقدار نسبت بازده به انحراف معیار 072/1 است که متعلق به مدل RAF به ازاءk=20 می‌باشد. علاوه برآن نتایج تحقیق نشان می‌دهند بازده‌های اخیر سهم قدرت پیش‌بینی‌کنندگی بالاتری در مقایسه با بازده‌های قبل‌تر دارند.

کلیدواژه‌ها


عنوان مقاله [English]

Model design for stock statistical arbitrage using deep neural networks, random forests and gradient-boosted trees

نویسندگان [English]

  • Foroozan Kamari 1
  • Alireza Saranj 2
  • Reza Tehrani 3
  • Meisam Shahbazi 4
1 Department of Industrial Management and Finance, Faculty of Management and Accounting, College of Farabi, University of Tehran
2 Assistant Professor, Department of Industrial Management and Finance, Faculty of Management and Accounting,College of Farabi, University of Tehran.
3 Faculty of Management, University of Tehran
4 Assistant Prof., Department of Industrial Management and Finance, Faculty of Management and Accounting, College of Farabi, University of Tehran
چکیده [English]

Statistical arbitrage is a common investing strategy in inefficient markets which is market neutral and profits from both sides of the market without the need for initial capital. This research aims at designing suitable models for stock statistical arbitrage using deep neural network, random forest, gradient-boosted trees and equal-weighted ensemble of these methods whilst analyzes the returns and risks of the designed models. For this purpose, the information of all listed companies in Tehran Stock Exchange from 1385 until 1396 has been used to generate trading signals. The design of the research models and required coding also the testing of the research hypotheses which is analyzed by t-test were performed in R software. The research findings show that the highest daily return is 4.24% for k = 5 (prior transaction costs) which is for the simple equal-weighted ensemble (ENS). Also deep neural network (DNN) has the lowest value at risk (- 4.45%) and the lowest expected shortfall (- 5.57%) for k = 20. The highest value of the return to standard deviation ratio is 1.072 which belongs to the RAF model for k = 20. Moreover, research results show that recent returns have higher predictive power than previous returns.

کلیدواژه‌ها [English]

  • Statistical arbitrage
  • deep learning
  • Random forests
  • gradient-boosted trees
  • Ensemble learning
[1]       GoodarziM, YakidehK, MahfooziG (1395). "Stock portfolio optimization by integrating data envelopment analysis and Horwitz decision making", Medern research in decision making, Volume 1, No. 4.(in persian)
[2]       ZamaniA, KhanzadiM, AmeliM, SarhadiM (1396)." The Framework for Using Risk Management in Fuzzy Environment for Implementation of Engineering Value Development Projects". Management research in Iran, Volume 21, No. 3.(in persian)
[3]       TehraniR, NoorbakhshA (1390). "Investment Management", Publisher: knowledge look. (In Persian)
[4]       ForooshbastaniA, GhasemiA (1391). "Random control approach to optimize paired trading", 3th conference of financial mathemathics and applications, Semnan University. (In Persian)
[5]       Avellaneda, M, Lee, J (2008). Statistical Arbitrage in the U.S. Equities        Market.Quantitative Finance, 10(7), 761–782.
[6]       AhmadzahehA, YavariK, SalehabadiA, EsiayitafreshiM (1393). "Statistical Arbitrage test in Tehran stock exchange", Quarterly journal of Economic policies and researches, No. 70. (In Persian)
[7]       Krauss, C, Anh Do, Xuan, H, N. (2017).Deep neural networks, gradient-boosted trees, random forests: Statistical arbitrage on the S&P 500. European Journal of Operational Research 689–702. Elsevier.
[8]       AbbasianA, ZoolfaghariM (1392). "Dynamic Analysis of weak Level Efficiency in Tehran Stock Exchange by Kalman Filter", Quarterly journal of Economic policies and researches. No.65, pp. 231-254. (in persian)
[9]       RasekhiS, KhanalipoorA (1388). "Empirical analysis of fluctuations and stock market efficiency (Case study: Tehran stock exchange)". Quarterly journal of Iranian Economic Research, pp. 29-75.(in persian)
[10]    Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The elements of statistical learning: Data mining, inference, and prediction. Springer series in statistics (2nd).New York: Springer.
[11]    AfsarA, HalilF (1396). "Stock portfolio optimization by the combined approach   of Thecnical analysis and data mining. Medern research in decision making, Volume 2, No. 2.(in persian)
[12]    AsgariM, AbooZ (1391). "Evaluating the Effectiveness of paired Trading Strategy on Coin Future Contracts Using Combination of co-integration and Random Approaches". 3th conference of financial mathemathics and applications. Semnan University. (in persian)
[13]    JalilianG, AsgriM (1394). "Design and implementation of pairs trading strategy software for using in the capital market". Financial management strategy, No. 11, pp.111-127. (in persian) 
[14]    [14] PakizehK, HabibiS (1395). "Comparison of Profitability of Paired trading Strategy between different classes of assets". Asset management and financing, Volume 5, No. 4, pp. 69-88. (in persian)
[15]    Takeuchi, L., & Lee, Y.-Y. A. (2013). "Applying deeplearningtoenhancemomentum trading strategies in stocks". Stanford University. Working paper.
[16]    Moritz, B., & Zimmermann, T. (2014). "Deep conditional portfolio sorts: The relation between past and future stock returns". Working paper, Ludwig Maximilian University Munich and Harvard University.
[17]    Dixon, M, Klabjan, D, & Bang, J. H. (2015). "Implementing deep neural networks for financial market prediction on the Intel Xeon Phi". In Proceedings of the eighth workshop on high performance computational finance (pp. 1–6 Elsevier.
[18]    ValipoorKH, SafiieA, AkbarzadehZ, GhasemniaN (1395). "Assessing and predicting sustainable production using the approach Multi-Degree Fuzzy Compound and Artificial Neural Network". Management research in Iran, Volume 20, No. 1.(in persian)
[19]    Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R (2014).Dropout: A simple way to prevent neural networks from overfitting. Journal of Machine Learning Research, 15(1), 1929–1958.
[20]    H2O (2016).H2O documentation.http://h2o release.s3.amazonaws.com/h2o/ rel-tibshirani/3/docs-website/h2o-docs/index.html and http://docs.h2o.ai.
[21]    Friedman, J. H. (2002). Stochastic gradient boosting. Computational Statistics & DataAnalysis, 38(4), 367–378.
[22]    Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32.
[23]    Dietterich, T. G. (2000). Ensemble methods in machine learning. In Multiple classifier systems (pp. 1–15). Springer.
[24]    Timmermann, A. (2006). Chapter 4 forecast combinations. In G. Elliott, C. W. J. Granger, & A. Timmermann (Eds.), Handbook of economic forecasting: vol. 1 (pp. 135–196). Elsevier. doi:10.1016/S1574-0706(05)01004-9.
[25]    Genre, V., Kenny, G., Meyler, A., & Timmermann, A. (2013). Combining expert forecasts: Can anything beat the simple average? International Journal of Forecasting.–121-108(1) 29.