Лінгвістичний підхід до прогнозування часових рядів

Автор(и)

  • Д. В. Ланде Інститут проблем реєстрації інформації НАН України, Україна
  • В. В. Юзефович Інститут проблем реєстрації інформації НАН України, Україна

DOI:

https://doi.org/10.35681/1560-9189.2022.24.1.262673

Ключові слова:

часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критерій подібності, кореляція, лінійна регресія

Анотація

Запропоновано методи прогнозування динамічних часових рядів (у тому числі й нестаціонарних), що базуються на лінгвістичному підході, а саме: дослідженні входжень і повторюваності так званих N-грам, які застосовуються в комп’ютерній лінгвістиці при створенні статистичних перекладачів, виявленні плагіату, дублікатів документів. На відміну від застосування в лінгвістиці, метод може бути розширений урахуванням кореляцій послідовностей сталих словосполучень, а також трендів. При цьому запропоновані методи не вимагають поперед-нього дослідження та визначення характеристик часових рядів і склад-ного налаштування вхідних параметрів моделі прогнозування. Запропоновані методи дозволяють з високим рівнем автоматизації здійснювати короткострокові та середньострокові прогнози динамічних часових рядів, яким притаманні тренди та циклічність, зокрема, рядів динаміки публікацій у системах контент-моніторингу. Суттєвою перевагою підходу є відсутність вимог до стаціонарності часових рядів і мала кількість параметрів налаштування.

Посилання

D. Lande, I. Subach, and A. Puchkov, "A System for Analysis of Big Data from Social Media", Information & Security: An International Journal, vol. 47, no. 1, pp. 44–61, 2020. doi: 10.11610/isij.4703.

V. V. Yuzefovych and Ye. O. Tsybulska, "Pidkhid do formuvannya informatsiynoho resursu yedynoho informatsiynoho prostoru systemy orhanizatsiynoho upravlinnya", in Zbirnyk dopovidey XXI Mizhnarodnoyi naukovo-praktychnoyi konferentsiyi "Informatsiyni tekhnolohiyi ta bezpeka" (ITB-2021), Dec. 9, 2021, pp. 185–192.

A. Nielsen, Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O'Reilly Media, Inc., 2020, pp. 504.

D. Sornette, Why Stock Markets Crash: Critical Events in Complex Financial Systems. Princeton University Press, 2004. doi: 10.23943/princeton/9780691175959.001.0001.

D. Sornette and S. Becke, "Financial Market and Systemic Risks", in Market Risk and Financial Markets Modeling, Berlin, Heidelberg: Springer-Verlag, 2012. doi: 10.1007/978-3-642-27931-7.

X. Li, "Comparison and Analysis Between Holt Exponential Smoothing and Brown Exponential Smoothing Used for Freight Turnover Forecasts", in Conference proc.: Intelligent System Design and Engineering Applications (ISDEA), 2013. Third International Conference, 2013. doi: 10.1109/ISDEA.2012.112.

Y. J. Mgale, Y. Yan, and T. Shauri, "A Comparative Study of ARIMA and Holt-Winters Exponential Smoothing Models for Rice Price Forecasting in Tanzania", Open Access Library Journal, vol. 8, pp. 1–9, 2021. doi: 10.4236/oalib.1107381.

M. M. Rahman, M. F. Kabir, and M. N. Huda, "A corpus-based n-gram hybrid approach of Bengali to English machine translation", in 2018 21st International Conference of Computer and Information Technology (ICCIT), IEEE, 2018, pp. 1-6. doi: 10.1109/ICCITECHN.2018.8631938.

D. Lande and E. Shnurko-Tabakova, "OSINT as a part of cyber defense system", Theoretical and Applied Cybersecurity, vol. 1, pp. 103–108, 2019. doi: 10.20535/tacs.2664-29132019.1.169091.

##submission.downloads##

Опубліковано

2022-06-07

Номер

Розділ

Математичні методи обробки даних