Лінгвістичний підхід до прогнозування часових рядів
DOI:
https://doi.org/10.35681/1560-9189.2022.24.1.262673Ключові слова:
часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критерій подібності, кореляція, лінійна регресіяАнотація
Запропоновано методи прогнозування динамічних часових рядів (у тому числі й нестаціонарних), що базуються на лінгвістичному підході, а саме: дослідженні входжень і повторюваності так званих N-грам, які застосовуються в комп’ютерній лінгвістиці при створенні статистичних перекладачів, виявленні плагіату, дублікатів документів. На відміну від застосування в лінгвістиці, метод може бути розширений урахуванням кореляцій послідовностей сталих словосполучень, а також трендів. При цьому запропоновані методи не вимагають поперед-нього дослідження та визначення характеристик часових рядів і склад-ного налаштування вхідних параметрів моделі прогнозування. Запропоновані методи дозволяють з високим рівнем автоматизації здійснювати короткострокові та середньострокові прогнози динамічних часових рядів, яким притаманні тренди та циклічність, зокрема, рядів динаміки публікацій у системах контент-моніторингу. Суттєвою перевагою підходу є відсутність вимог до стаціонарності часових рядів і мала кількість параметрів налаштування.
Посилання
Lande D., Subach I., Puchkov A. A System for Analysis of Big Data from Social Media. Information & Security: An International Journal. 2020. 47. No. 1. P. 44–61. DOI: https://doi.org/10.11610/isij.4703
Yuzefovych V.V., Tsybul's'ka Ye.O. Pidkhid do formuvannya informatsiynoho resursu yedynoho informatsiynoho prostoru systemy orhanizatsiynoho upravlinnya. Zbirnyk dopovidey XXI Mizhnarodnoyi naukovo-praktychnoyi konferentsiyi «Informatsiyni tekhnolohiyi ta bezpeka». 9 hrudnya 2021. S. 185–192 (ITB-2021).
Nielsen A. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O’Reilly Media, Inc., 2020. 504 p. ISBN 978-1-492-04165-8.
Sornette D. Why Stock Markets Crash: Critical Events in Complex Financial Systems. Princeton University Press, 2004. DOI: https://doi.org/10.23943/princeton/ 9780691175959.001.0001.
Sornette D., Becke S. Financial Market and Systemic Risks. in Market Risk and Financial Markets Modeling. Berlin, Heidelberg: Springer-Verlag, 2012. DOI: https://doi.org/10.1007/978-3-642-27931-7.
Li Xiaochen. Comparison and Analysis Between Holt Exponential Smoothing and Brown Exponential Smoothing Used for Freight Turnover Forecasts // In Conference proc.: Intelligent System Design and Engineering Applications (ISDEA), 2013. Third International Conference. 2013. DOI: 10.1109/ISDEA.2012.112
Yohana James Mgale, Yunxian Yan, Shauri Timothy. A Comparative Study of ARIMA and Holt-Winters Exponential Smoothing Models for Rice Price Forecasting in Tanzania. Open Access Library Journal. 2021. No. 8. P. 1–9. DOI: https://doi.org/10.4236/oalib.1107381.
Rahman M.M., Kabir M.F., Huda M.N. A corpus based n-gram hybrid approach of bengali to english machine translation. In 2018 21st International Conference of Computer and Information Technology (ICCIT). IEEE, 2018. P. 1-6. DOI: https://doi.org/10.1109/ICCITECHN.2018.8631938.
Lande D., Shnurko-Tabakova E. OSINT as a part of cyber defense system // Theoretical and Applied Cybersecurity, 2019. No. 1. P. 103–108. DOI: https://doi.org/10.20535/tacs.2664-29132019. 1.169091.