Лінгвістичний підхід до прогнозування часових рядів

Автор(и)

  • Д. В. Ланде Інститут проблем реєстрації інформації НАН України, Ukraine
  • В. В. Юзефович Інститут проблем реєстрації інформації НАН України, Ukraine

DOI:

https://doi.org/10.35681/1560-9189.2022.24.1.262673

Ключові слова:

часовий ряд, прогнозування, метод N-грам, квантування, тренд, модель, критерій подібності, кореляція, лінійна регресія

Анотація

Запропоновано методи прогнозування динамічних часових рядів (у тому числі й нестаціонарних), що базуються на лінгвістичному підході, а саме: дослідженні входжень і повторюваності так званих N-грам, які застосовуються в комп’ютерній лінгвістиці при створенні статистичних перекладачів, виявленні плагіату, дублікатів документів. На відміну від застосування в лінгвістиці, метод може бути розширений урахуванням кореляцій послідовностей сталих словосполучень, а також трендів. При цьому запропоновані методи не вимагають поперед-нього дослідження та визначення характеристик часових рядів і склад-ного налаштування вхідних параметрів моделі прогнозування. Запропоновані методи дозволяють з високим рівнем автоматизації здійснювати короткострокові та середньострокові прогнози динамічних часових рядів, яким притаманні тренди та циклічність, зокрема, рядів динаміки публікацій у системах контент-моніторингу. Суттєвою перевагою підходу є відсутність вимог до стаціонарності часових рядів і мала кількість параметрів налаштування.

Посилання

Lande D., Subach I., Puchkov A. A System for Analysis of Big Data from Social Media. Information & Security: An International Journal. 2020. 47. No. 1. P. 44–61. DOI: https://doi.org/10.11610/isij.4703

Yuzefovych V.V., Tsybul's'ka Ye.O. Pidkhid do formuvannya informatsiynoho resursu yedynoho informatsiynoho prostoru systemy orhanizatsiynoho upravlinnya. Zbirnyk dopovidey XXI Mizhnarodnoyi naukovo-praktychnoyi konferentsiyi «Informatsiyni tekhnolohiyi ta bezpeka». 9 hrudnya 2021. S. 185–192 (ITB-2021).

Nielsen A. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O’Reilly Media, Inc., 2020. 504 p. ISBN 978-1-492-04165-8.

Sornette D. Why Stock Markets Crash: Critical Events in Complex Financial Systems. Princeton University Press, 2004. DOI: https://doi.org/10.23943/princeton/ 9780691175959.001.0001.

Sornette D., Becke S. Financial Market and Systemic Risks. in Market Risk and Financial Markets Modeling. Berlin, Heidelberg: Springer-Verlag, 2012. DOI: https://doi.org/10.1007/978-3-642-27931-7.

Li Xiaochen. Comparison and Analysis Between Holt Exponential Smoothing and Brown Exponential Smoothing Used for Freight Turnover Forecasts // In Conference proc.: Intelligent System Design and Engineering Applications (ISDEA), 2013. Third International Conference. 2013. DOI: 10.1109/ISDEA.2012.112

Yohana James Mgale, Yunxian Yan, Shauri Timothy. A Comparative Study of ARIMA and Holt-Winters Exponential Smoothing Models for Rice Price Forecasting in Tanzania. Open Access Library Journal. 2021. No. 8. P. 1–9. DOI: https://doi.org/10.4236/oalib.1107381.

Rahman M.M., Kabir M.F., Huda M.N. A corpus based n-gram hybrid approach of bengali to english machine translation. In 2018 21st International Conference of Computer and Information Technology (ICCIT). IEEE, 2018. P. 1-6. DOI: https://doi.org/10.1109/ICCITECHN.2018.8631938.

Lande D., Shnurko-Tabakova E. OSINT as a part of cyber defense system // Theoretical and Applied Cybersecurity, 2019. No. 1. P. 103–108. DOI: https://doi.org/10.20535/tacs.2664-29132019. 1.169091.

##submission.downloads##

Опубліковано

2022-06-07

Номер

Розділ

Математичні методи обробки даних