Машина Больцмана

Пример графического представления машины Больцмана. В данном примере 3 скрытых и 4 видимых нейрона

Маши́на Бо́льцмана (англ. Boltzmann machine) — вид стохастической рекуррентной нейронной сети, изобретенной Джеффри Хинтоном и Терри Сейновски^[англ.] в 1985 году^[1]. Машина Больцмана может рассматриваться как стохастический генеративный вариант сети Хопфилда.

Специалисты по статистике называют такие сети случайными марковскими полями. Сеть названа машиной Больцмана в честь австрийского физика Людвига Больцмана, одного из создателей статистической физики.

Эта сеть использует для обучения алгоритм имитации отжига и оказалась первой нейронной сетью, способной обучаться внутренним представлениям, решать сложные комбинаторные задачи. Несмотря на это, из-за ряда проблем, машины Больцмана с неограниченной связностью не могут использоваться для решения практических проблем. Если же связность ограничена, то обучение может быть достаточно эффективным для использования на практике. В частности, из каскада ограниченных машин Больцмана строится так называемая глубокая сеть доверия.

Модель

Как и сеть Хопфилда, машина Больцмана является сетью нейронов с определенной для неё понятием "энергии". Расчет глобальной энергии производится идентичным по форме с сетью Хопфилда образом:^[2]

E=-\sum _{i<j}w_{ij}\,s_{i}\,s_{j}-\sum _{i}\theta _{i}\,s_{i}

Где:

$w_{ij}$ сила связи между нейронами $j$ и $i$ .
$s_{i}$ состояние , $s_{i}\in \{0,1\}$ , нейрона $i$ .
$\theta _{i}$ порог для нейрона $i$ .

Связи имеют следующие ограничения:

$w_{ii}=0\qquad \forall i$ . (нейрон не может иметь связь с самим собой);
$w_{ij}=w_{ji}\qquad \forall i,j$ (все связи являются симметричными).

Термическое равновесие

Одним из основных недостатков сети Хопфилда является тенденция «стабилизации» состояния сети в локальном, а не в глобальном минимуме. Практически желательно, чтобы сеть переходила в глубокие минимумы энергии чаще, чем неглубокие, и чтобы относительная вероятность перехода сети в один из двух минимумов с разной энергией зависела только от соотношения их глубин. Это позволило бы управлять вероятностями получения конкретных выходных векторов состояния путём изменения профиля энергетической поверхности системы за счет модификации весов связей. На основе этих соображений и построена машина Больцмана.

Идея использования «теплового шума» для выхода из локальных минимумов и повышения вероятности попадания в более глубокие минимумы принадлежит С. Кирпатрику. На основе этой идеи разработан алгоритм имитации отжига.

Введем некоторый параметр $t$ — аналог уровня теплового шума. Тогда вероятность активности некоторого нейрона $k$ определяется на основе вероятностной функции Больцмана:

Pk=1/(1+e^{-E_{k}/t}),

где $t$ — уровень теплового шума в сети; $E_{k}$ — сумма весов связей $k$ -го нейрона со всеми активными в данный момент нейронами.

Ограниченная машина Больцмана

Хотя возможности обучения машины Больцмана ограничены на практике, эти проблемы могут быть решены применением архитектуры ограниченной машины Больцмана (restricted Boltzmann machine; RBM). В этой архитектуре связи существуют только между скрытыми и видимыми нейронами, но при этом отсутствуют между нейронами одного класса. Такая архитектура изначально использовалась Полом Смоленски в 1986 году под названием Harmonium^[3], но приобрела популярность только после изобретения Хинтоном быстрых алгоритмов обучения в середине 2000-х годов.

Ограниченные машины Больцмана используются в сетях глубинного обучения. В частности, глубокие сети доверия могут быть получены путём «наложения» RBM и последующего дообучения при помощи алгоритма обратного распространения ошибки.

Примечания

↑ Ackley, David H.; Hinton, Geoffrey E.; Sejnowski, Terrence J. A Learning Algorithm for Boltzmann Machines. — Cognitive Science 9 (1), 1985. — С. 147—169.
↑ Лоскутов А. Ю., Михайлов А. С. Введение в синергетику. - М., Наука, 1990. - ISBN 5-02-014475-4. - с. 233-237
↑ Архивированная копия (англ.). Дата обращения: 12 июня 2014. Архивировано из оригинала 13 июня 2013 года.Архивированная копия (неопр.). Дата обращения: 12 июня 2014. Архивировано из оригинала 13 июня 2013 года.

Ссылки

Talk at Google by Geoffrey Hinton

[1] Ackley, David H.; Hinton, Geoffrey E.; Sejnowski, Terrence J. A Learning Algorithm for Boltzmann Machines. — Cognitive Science 9 (1), 1985. — С. 147—169.

[2] Лоскутов А. Ю., Михайлов А. С. Введение в синергетику. - М., Наука, 1990. - ISBN 5-02-014475-4. - с. 233-237

[3] Архивированная копия (англ.). Дата обращения: 12 июня 2014. Архивировано из оригинала 13 июня 2013 года.Архивированная копия (неопр.). Дата обращения: 12 июня 2014. Архивировано из оригинала 13 июня 2013 года.

[1]

[2]

[3]

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Метод случайного леса Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Размерность Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG