Звичайний вигляд Перегляд у МАРК Перегляд у ISBD

Навчання з підкріпленням в автономних інтелектуальних системах [Текст] : навчальний посібник з дисципліни для студентів галузі знань 12 "Інформаційні технології" спеціальності 123 "Комп'ютерна інженерія" / Бочкарьов О. Ю. ; Міністерство освіти і науки України, Національний університет "Львівська політехніка"

Автор: Бочкарьов Олексій Юрійович (1975-)Вторинна відповідальність: Організація, під егідою якої видано Національний університет "Львівська політехіка"Вихідні дані: Львів : Видавець Марченко Т. В., 2023Опис: 124 сторінки : схеми, графіки, таблиці ; 24 смМова: українська.Країна: Україна.Форматний номер: 3 формат (висота > 23-31 см)ISBN: 978-617-7937-93-6.Вид літератури за цільовим призначенням: НавчальніВид/характер текстових документів: навчальні виданняУДК: 004.8(075.8)

Загальні примітки:

Містить термінологічний словник

Примітки щодо походження:

Дар автора

[Інв. № 01355826, IST15806]

Наявність бібліографії/покажчика: Бібліографія: сторінки 123-124 (29 назв).Найменування теми як предметна рубрика: Інформаційні технології -- Інтелектуальні системи -- Методи навчання з підкріпленням -- Навчальні посібники Анотація:

    В навчальному посібнику розглянуто теоретичні принципи навчання з підкріпленням в автономних інтелектуальних системах. Основна увага приділена моделям та методам навчання з підкріпленням. Розглянуто питання практичного застосування методів навчання з підкріпленням для побудови автономних інтелектуальних систем.
    Навчальний посібник призначений для студентів спеціальності 123 “Комп’ютерна інженерія” галузі знань 12 “Інформаційні технології”.

Зміст:

Вступ.....5

1. Автономна інтелектуальна система.....7

1.1. Використання методів штучного інтелекту для побудови інтелектуальних систем.....7

1.1.1. Поняття штучного інтелекту.....7

1.1.2. Основні напрямки досліджень в області штучного інтелекту.....9

1.1.3. Основні концепції штучного інтелекту.....10

2.1. Автономна інтелектуальна система: основні ідеї та визначення.....13

1.2.1. Поняття автономної інтелектуальної системи.....13

1.2.2. Узагальнена функціональна схема автономної інтелектуальної системи.....14

інтелектуальної системи.....14

1.2.3. Застосування автономних інтелектуальних систем.....17

Контрольні питання.....19

2. Автомати, що навчаються (learning automata).....21

2.1. Моделювання простих форм цілеспрямованої поведінки.....21

2.1.1. Стаціонарне випадкове середовище.....21

2.1.2. Модель цілеспрямованої поведінки.....23

2.1.3. Конструкції автоматів, що навчаються.....25

2.1.4. Асимптотично-оптимальні послідовності симетричних автоматів, що навчаються.....29

2.2. Поведінка автоматів, що навчаються, у випадкових середовищах з перемиканням станів.....31

2.2.1. Випадкове середовище з перемиканням станів.....31

2.2.2. Каскад двох автоматів з лінійною тактикою.....35

2.2.3. Стохастичні автомати зі змінною структурою.....36

Контрольні питання.....41

3. Навчання з підкріпленням (Reinforcement Learning).....43

3.1. Проблема навчання з підкріпленням.....43

3.1.1. Машинне навчання (machine learning).....43

3.1.2. Навчання з підкріпленням (reinforcement learning).....45

3.1.3. Випадкове середовище Multi-armed Bandit (МАВ).....46

3.1.4. Класифікація задач навчання з підкріпленням.....49

3.2. Принципи навчання з підкріпленням в МАВ.....51

3.2.1. Методи зваженої оцінки дій (action-value methods).....51

3.2.2. Узагальнена форма методів зваженої оцінки дій.....54

3.2.3. Метод експоненціального усереднення.....55

3.3. Методи навчання з підкріпленням в МАВ.....58

3.3.1. Метод нормованої експоненціальної функції.....58

3.3.2. Метод на основі стохастичного градієнтного підйому.....59

3.3.3. Метод верхньої довірчої межі.....60

3.3.4. Порівняння ефективності методів навчання з підкріпленням в МАВ.....62

3.3.5. МАВ з контекстною залежністю.....64

Контрольні питання.....66

4. Марківський процес прийняття рішень (Markov Decision Process).....68

4.1. Навчання з підкріпленням в MDP.....68

4.1.1. Задача навчання з підкріпленням в MDP.....68

4.1.2. Пошук оптимальної стратегії для відомої моделі MDP.....71

4.2. Методи навчання з підкріпленням в MDP.....74

4.2.1. Метод адаптивної евристичної оцінки.....74

4.2.2. Навчання з підкріпленням на основі часових різниць.....75

4.2.3. Метод навчання з підкріпленням SARSA.....79

4.2.4. Метод навчання з підкріпленням Q-leaming.....80

Контрольні питання.....82

5. Навчання з підкріпленням в багатоагентних системах.....84

5.1. Багатоагентні системи (multi-agent systems).....84

5.1.1. Поняття багатоагентної системи.....84

5.1.2. Концептуальна модель багатоагентної системи.....90

5.1.3. Алгоритмічне забезпечення багатоагентних систем.....93

5.1.4. Механізми координації колективної поведінки інтелектуальних агентів.....97

5.2. Моделі та методи навчання з підкріпленням в багатоагентних системах.....102

5.2.1. Задача навчання з підкріпленням в багатоагентній системі.....102

5.2.2. Класифікація задач навчання з підкріпленням в багатоагентних системах.....105

5.2.3. Методи навчання з підкріпленням в багатоагентній системі.....106

5.2.4. Навчання розподілу обов'язків в багатоагентній системі.....108

Контрольні питання.....111

Термінологічний словник.....113

Література.....123

Тип одиниці:

Книга

Фонди
Тип одиниці зберігання	Поточна бібліотека	Шифр зберігання	Стан	Очікується на дату	Штрих-код
Книга	Книгосховище відділу книгозберігання (KSHVKZ) Фонд відділу книгозберігання	IST15806 (Огляд полиці(Відкривається нижче))	Доступно		IST15806
Книга	Книгосховище відділу книгозберігання (KSHVKZ) Фонд відділу книгозберігання	01355826 (Огляд полиці(Відкривається нижче))	Доступно		01355826

Містить термінологічний словник

01355826, IST15806 Дар автора

Бібліографія: сторінки 123-124 (29 назв)

Вступ.....5
1. Автономна інтелектуальна система.....7
1.1. Використання методів штучного інтелекту для побудови інтелектуальних систем.....7
1.1.1. Поняття штучного інтелекту.....7
1.1.2. Основні напрямки досліджень в області штучного інтелекту.....9
1.1.3. Основні концепції штучного інтелекту.....10
2.1. Автономна інтелектуальна система: основні ідеї та визначення.....13
1.2.1. Поняття автономної інтелектуальної системи.....13
1.2.2. Узагальнена функціональна схема автономної інтелектуальної системи.....14
інтелектуальної системи.....14
1.2.3. Застосування автономних інтелектуальних систем.....17
Контрольні питання.....19
2. Автомати, що навчаються (learning automata).....21
2.1. Моделювання простих форм цілеспрямованої поведінки.....21
2.1.1. Стаціонарне випадкове середовище.....21
2.1.2. Модель цілеспрямованої поведінки.....23
2.1.3. Конструкції автоматів, що навчаються.....25
2.1.4. Асимптотично-оптимальні послідовності симетричних автоматів, що навчаються.....29
2.2. Поведінка автоматів, що навчаються, у випадкових середовищах з перемиканням станів.....31
2.2.1. Випадкове середовище з перемиканням станів.....31
2.2.2. Каскад двох автоматів з лінійною тактикою.....35
2.2.3. Стохастичні автомати зі змінною структурою.....36
Контрольні питання.....41
3. Навчання з підкріпленням (Reinforcement Learning).....43
3.1. Проблема навчання з підкріпленням.....43
3.1.1. Машинне навчання (machine learning).....43
3.1.2. Навчання з підкріпленням (reinforcement learning).....45
3.1.3. Випадкове середовище Multi-armed Bandit (МАВ).....46
3.1.4. Класифікація задач навчання з підкріпленням.....49
3.2. Принципи навчання з підкріпленням в МАВ.....51
3.2.1. Методи зваженої оцінки дій (action-value methods).....51
3.2.2. Узагальнена форма методів зваженої оцінки дій.....54
3.2.3. Метод експоненціального усереднення.....55
3.3. Методи навчання з підкріпленням в МАВ.....58
3.3.1. Метод нормованої експоненціальної функції.....58
3.3.2. Метод на основі стохастичного градієнтного підйому.....59
3.3.3. Метод верхньої довірчої межі.....60
3.3.4. Порівняння ефективності методів навчання з підкріпленням в МАВ.....62
3.3.5. МАВ з контекстною залежністю.....64
Контрольні питання.....66
4. Марківський процес прийняття рішень (Markov Decision Process).....68
4.1. Навчання з підкріпленням в MDP.....68
4.1.1. Задача навчання з підкріпленням в MDP.....68
4.1.2. Пошук оптимальної стратегії для відомої моделі MDP.....71
4.2. Методи навчання з підкріпленням в MDP.....74
4.2.1. Метод адаптивної евристичної оцінки.....74
4.2.2. Навчання з підкріпленням на основі часових різниць.....75
4.2.3. Метод навчання з підкріпленням SARSA.....79
4.2.4. Метод навчання з підкріпленням Q-leaming.....80
Контрольні питання.....82
5. Навчання з підкріпленням в багатоагентних системах.....84
5.1. Багатоагентні системи (multi-agent systems).....84
5.1.1. Поняття багатоагентної системи.....84
5.1.2. Концептуальна модель багатоагентної системи.....90
5.1.3. Алгоритмічне забезпечення багатоагентних систем.....93
5.1.4. Механізми координації колективної поведінки інтелектуальних агентів.....97
5.2. Моделі та методи навчання з підкріпленням в багатоагентних системах.....102
5.2.1. Задача навчання з підкріпленням в багатоагентній системі.....102
5.2.2. Класифікація задач навчання з підкріпленням в багатоагентних системах.....105
5.2.3. Методи навчання з підкріпленням в багатоагентній системі.....106
5.2.4. Навчання розподілу обов'язків в багатоагентній системі.....108
Контрольні питання.....111
Термінологічний словник.....113
Література.....123

В навчальному посібнику розглянуто теоретичні принципи навчання з підкріпленням в автономних інтелектуальних системах. Основна увага приділена моделям та методам навчання з підкріпленням. Розглянуто питання практичного застосування методів навчання з підкріпленням для побудови автономних інтелектуальних систем.
Навчальний посібник призначений для студентів спеціальності 123 “Комп’ютерна інженерія” галузі знань 12 “Інформаційні технології”.

Натисніть на зображення, щоб переглянути його в оглядачі зображень

Поділитися