Лінгвістичний підхід до прогнозування часових рядів
DOI:
https://doi.org/10.35681/1560-9189.2022.24.1.262673Ключові слова:
часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критерій подібності, кореляція, лінійна регресіяАнотація
Запропоновано методи прогнозування динамічних часових рядів (у тому числі й нестаціонарних), що базуються на лінгвістичному підході, а саме: дослідженні входжень і повторюваності так званих N-грам, які застосовуються в комп’ютерній лінгвістиці при створенні статистичних перекладачів, виявленні плагіату, дублікатів документів. На відміну від застосування в лінгвістиці, метод може бути розширений урахуванням кореляцій послідовностей сталих словосполучень, а також трендів. При цьому запропоновані методи не вимагають поперед-нього дослідження та визначення характеристик часових рядів і склад-ного налаштування вхідних параметрів моделі прогнозування. Запропоновані методи дозволяють з високим рівнем автоматизації здійснювати короткострокові та середньострокові прогнози динамічних часових рядів, яким притаманні тренди та циклічність, зокрема, рядів динаміки публікацій у системах контент-моніторингу. Суттєвою перевагою підходу є відсутність вимог до стаціонарності часових рядів і мала кількість параметрів налаштування.
Посилання
D. Lande, I. Subach, and A. Puchkov, "A System for Analysis of Big Data from Social Media", Information & Security: An International Journal, vol. 47, no. 1, pp. 44–61, 2020. doi: 10.11610/isij.4703.
V. V. Yuzefovych and Ye. O. Tsybulska, "Pidkhid do formuvannya informatsiynoho resursu yedynoho informatsiynoho prostoru systemy orhanizatsiynoho upravlinnya", in Zbirnyk dopovidey XXI Mizhnarodnoyi naukovo-praktychnoyi konferentsiyi "Informatsiyni tekhnolohiyi ta bezpeka" (ITB-2021), Dec. 9, 2021, pp. 185–192.
A. Nielsen, Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O'Reilly Media, Inc., 2020, pp. 504.
D. Sornette, Why Stock Markets Crash: Critical Events in Complex Financial Systems. Princeton University Press, 2004. doi: 10.23943/princeton/9780691175959.001.0001.
D. Sornette and S. Becke, "Financial Market and Systemic Risks", in Market Risk and Financial Markets Modeling, Berlin, Heidelberg: Springer-Verlag, 2012. doi: 10.1007/978-3-642-27931-7.
X. Li, "Comparison and Analysis Between Holt Exponential Smoothing and Brown Exponential Smoothing Used for Freight Turnover Forecasts", in Conference proc.: Intelligent System Design and Engineering Applications (ISDEA), 2013. Third International Conference, 2013. doi: 10.1109/ISDEA.2012.112.
Y. J. Mgale, Y. Yan, and T. Shauri, "A Comparative Study of ARIMA and Holt-Winters Exponential Smoothing Models for Rice Price Forecasting in Tanzania", Open Access Library Journal, vol. 8, pp. 1–9, 2021. doi: 10.4236/oalib.1107381.
M. M. Rahman, M. F. Kabir, and M. N. Huda, "A corpus-based n-gram hybrid approach of Bengali to English machine translation", in 2018 21st International Conference of Computer and Information Technology (ICCIT), IEEE, 2018, pp. 1-6. doi: 10.1109/ICCITECHN.2018.8631938.
D. Lande and E. Shnurko-Tabakova, "OSINT as a part of cyber defense system", Theoretical and Applied Cybersecurity, vol. 1, pp. 103–108, 2019. doi: 10.20535/tacs.2664-29132019.1.169091.