DOI: https://doi.org/10.35681/1560-9189.2014.16.4.100290

Вибір провайдера хмарного сервісу на основі навчання з підкріпленням і репутації провайдерів

I. Yu. Myroshnikova, A. N. Novikov

Анотація


Для задачі вибору провайдера хмарного сервісу запропоновано використати підхід на основі навчання з підкріпленням, що додатково враховує репутацію провайдерів, яка визначається за досвідом використання їхніх сервісів та оцінками користувачів. Для провайдерів зі сталими параметрами надання сервісів було показано зменшення кількості кроків, що необхідні для навчання системи, порівняно з підходами на основі навчання зпідкріпленням безурахування репутації провайдерів.

Ключові слова


хмарні обчислення; задача вибору провайдера; навчання з підкріпленням; репутація; брокер; модель аукціону

Повний текст:

PDF

Посилання


Mell P. The NIST definition of cloud computing / P. Mell, T. Grance [Elektronnyy resurs]: NIST Special Publication 800–145. — USA National Institute of Standards and Technology. — 2011. — Rezhym dostupu:

http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf

Designing a resource broker for heterogeneous grids / S. Venugopal, K. Nadiminti, H. Gibbins, R. Buyya // Software: Practice and Experience. — 2008. — Vol. 38, N 8. — P. 793 825.

Dynamic cloud resource reservation via cloud brokerage / W. Wang, D. Niu, B. Li, B. Liang // Proc. of the 2013 IEEE 33-rd Internation. Conf. on Distributed Computing Systems ICDCS’13. — 2013. — P. 400–409.

Sutton R. Reinforcement learning: ani / R. Sutton, A.G. Barto // MIT Press. — Cambridge, MA, 1998.

Galstyan A. Resource allocation in the grid with learning agents / A. Galstyan, K. Czajkowski, K. Lerman // Journal of Grid Computing. — 2005. — Vol. 3, N 1. — P. 91–100.

Grid differentiated services: a reinforcement learning approach / J. Perez, C. Germain-Renaud, B. Kegl, C. Loomis // Cluster Computing and the Grid, 2008 CCGRID’08. — 8-th IEEE International Symposium on. — 2008. — P. 287–294.

A novel multi-agent reinforcement learning approach for job scheduling in Grid computing / J. Wu, X. Xu, P. Zhang, C. Liu // Future Generation Computer Systems. — 2011. — Vol. 27, N 5. — P. 430 439.

Watkins C.J.C.H. Q-learning / C.J.C.H. Watkins, P. Dayan // Machine learning. — 1992. — Vol. 8, N 3. — P. 279 292.

Tran T.T. A reputation-oriented reinforcement learning strategy for agents in electronic marketplaces / T.T. Tran, R. Cohen // Computational Intelligence. — 2002. — Vol. 18, N 4. — P. 550–565.

Barto A.G. Temporal difference learning / A.G. Barto // Scholarpedia. — 2007. — 2(11):1604.

Vermorel J. Multi-armed bandit algorithms and empirical evaluation / J. Vermorel, M. Mohri // Proc. of the 16-th European Conf. on Machine Learning. ECML’05. — 2005. — P. 437–448.

Yu B. A social mechanism of reputation management in electronic communities / B. Yu, M.P. Singh // In M. Klusch and L. Kerschberg editors — Cooperative Information Agents IV, Lecture Notes in Artificial Intelligence. — 2000. — Vol. 1860. — P. 154–165.