Методика попередньої обробки даних у задачі секвенційного аналізу
DOI:
https://doi.org/10.35681/1560-9189.2017.19.1.126492Ключові слова:
інтелектуальний аналіз даних, попередня обробка даних, секвенційний аналіз, патерни, послідовностіАнотація
Статтю присвячено розробці методики попередньої обробки даних задля проведення секвенційного аналізу. Виділено та експериментально підтверджено проблеми попередньої обробки у даній галузі: зашумленість даних, надлишковість алфавіту, можлива наявність циклічних повторів. Запропоновано способи їхнього вирішення. Ефективність і результативність запропонованих методів показано на дослідах.Посилання
Arsenev S. Izvlechenie znanij iz medicinskih baz dannyh. 1999. URL: http://neural.narod.ru/Arsen.htm
Kungurcev A.B. Formirovanie predstavlenija dannyh raspredelennyh informacionnyh sistem v terminah predmetnoj oblasti. Novi tekhnolohiyi. 2003. # 2(3). S. 74–77.
Afanaseva S.M. Primenenie kompjuternyh tehnologij dlja avtomatizacii analiza medicinskoj informacii. VNMT. 2005. # 3–4. S. 104–106.
Ljubicyn V.N. Povyshenie kachestva dannyh v kontekste sovremennyh analiticheskih tehnologij. Vestnik Juzhno-Uralskogo gosudarstvennogo universiteta. Serija: Kompjuternye tehnologii, upravlenie, radiojelektronika. 2012. # 23.
Davydov A.A. Knowledge Discovery and Data Mining v sistemnoj sociologii. Moskva: IS RAN, 2009.URL: http://www.isras.ru/Davydov_Knowledge.html
Markov Z., Larose D.T. Data-mining the Web: uncovering patterns in Web content, structure, and usage. John Wiley & Sons Inc., 2007. 218 p.
Lunkov A.D., Harlamov A.V. Intellektualnyj analiz dannyh: uchebno-metodicheskoe posobie dannyh. Saratovskij gosudarstvennyj universitet im. N.G. Chernyshevskogo. URL: http://elibrary.sgu.ru/uch_lit/1141.pdf
Guyon I., Elisseeff A. An introduction to feature extraction. Feature extraction. Springer Berlin Heidelberg, 2006. С. 1–25.
Djuk V.A., Zhvalevskij O.V., Rudnickij S.B., Tolstonogov D.A. Predvaritelnye rezultaty obrabotki raznotipnyh biometricheskih dannyh metodami data mining. Trudy SPIIRAN. 2009. Vyp. 9. C. 197–210.
Agrawal R. and Srikant R. Mining Sequential. Journal Intelligent Systems. 1997. Vol. 9. N 1. Р. 33–56.
Moldavskaya A.V. Metod formirovanija mnogourovnevyh posledovatelnyh patternov. Problemi programuvannja. 2016. # 2/3. S. 158–163.
Fournier-Viger P., Lin C.W., Gomariz A., Gueniche T., Soltani A., Deng Z., Lam H.T. The SPMF Open-Source Data Mining Library Version 2. Proc. 19-th European Conference on Principles of Data Mining and Knowledge Discovery (PKDD 2016). Part III. Springer LNCS 9853, 2016. Р. 36–40.
Orlov Ju.N. Optimalnoe razbienie gistogrammy dlja ocenivanija vyborochnoj plotnosti funkcii raspredelenija nestacionarnogo vremennogo rjada. Moskva: Institut prikladnoj matematiki im. M.V. Keldysha, 2013. # 14. 26 s. (Preprint. In-t prikladnoj matematiki im. M.V. Keldysha).
Smit B. Metody i algoritmy vychislenij na strokah. Izdatelskij dom Viljams, 2006. 496 s.