Вибір провайдера хмарного сервісу на основі навчання з підкріпленням і репутації провайдерів

Автор(и)

  • I. Yu. Myroshnikova Національний Технічний Університет України «Київський Політехнічний Інститут», Україна
  • A. N. Novikov Національний Технічний Університет України «Київський Політехнічний Інститут», Україна

DOI:

https://doi.org/10.35681/1560-9189.2014.16.4.100290

Ключові слова:

хмарні обчислення, задача вибору провайдера, навчання з підкріпленням, репутація, брокер, модель аукціону

Анотація

Для задачі вибору провайдера хмарного сервісу запропоновано використати підхід на основі навчання з підкріпленням, що додатково враховує репутацію провайдерів, яка визначається за досвідом використання їхніх сервісів та оцінками користувачів. Для провайдерів зі сталими параметрами надання сервісів було показано зменшення кількості кроків, що необхідні для навчання системи, порівняно з підходами на основі навчання зпідкріпленням безурахування репутації провайдерів.

Посилання

Mell P. The NIST definition of cloud computing / P. Mell, T. Grance [Elektronnyy resurs]: NIST Special Publication 800–145. — USA National Institute of Standards and Technology. — 2011. — Rezhym dostupu:

http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf

Designing a resource broker for heterogeneous grids / S. Venugopal, K. Nadiminti, H. Gibbins, R. Buyya // Software: Practice and Experience. — 2008. — Vol. 38, N 8. — P. 793 825.

Dynamic cloud resource reservation via cloud brokerage / W. Wang, D. Niu, B. Li, B. Liang // Proc. of the 2013 IEEE 33-rd Internation. Conf. on Distributed Computing Systems ICDCS’13. — 2013. — P. 400–409.

Sutton R. Reinforcement learning: ani / R. Sutton, A.G. Barto // MIT Press. — Cambridge, MA, 1998.

Galstyan A. Resource allocation in the grid with learning agents / A. Galstyan, K. Czajkowski, K. Lerman // Journal of Grid Computing. — 2005. — Vol. 3, N 1. — P. 91–100.

Grid differentiated services: a reinforcement learning approach / J. Perez, C. Germain-Renaud, B. Kegl, C. Loomis // Cluster Computing and the Grid, 2008 CCGRID’08. — 8-th IEEE International Symposium on. — 2008. — P. 287–294.

A novel multi-agent reinforcement learning approach for job scheduling in Grid computing / J. Wu, X. Xu, P. Zhang, C. Liu // Future Generation Computer Systems. — 2011. — Vol. 27, N 5. — P. 430 439.

Watkins C.J.C.H. Q-learning / C.J.C.H. Watkins, P. Dayan // Machine learning. — 1992. — Vol. 8, N 3. — P. 279 292.

Tran T.T. A reputation-oriented reinforcement learning strategy for agents in electronic marketplaces / T.T. Tran, R. Cohen // Computational Intelligence. — 2002. — Vol. 18, N 4. — P. 550–565.

Barto A.G. Temporal difference learning / A.G. Barto // Scholarpedia. — 2007. — 2(11):1604.

Vermorel J. Multi-armed bandit algorithms and empirical evaluation / J. Vermorel, M. Mohri // Proc. of the 16-th European Conf. on Machine Learning. ECML’05. — 2005. — P. 437–448.

Yu B. A social mechanism of reputation management in electronic communities / B. Yu, M.P. Singh // In M. Klusch and L. Kerschberg editors — Cooperative Information Agents IV, Lecture Notes in Artificial Intelligence. — 2000. — Vol. 1860. — P. 154–165.

##submission.downloads##

Опубліковано

2014-10-06

Номер

Розділ

Експертні системи та підтримка прийняття рішень