Метод искусственных нейронных сетей (часть 2)
13.03.2013

2. Затем наступает выбор начальной конфигурации сети. Сеть может иметь много скрытых уровней, поэтому определение числа промежуточных слоев и элементов в них является важным вопросом при ее конструировании. Начальная конфигурация сети выбирается случайным образом. В качестве начального приближения берут один промежуточный слой, а количество нейронов в нем находят опытным путем по величине среднего геометрического нейронов на уровнях ввода и вывода. В работах по нейроинформатике система обозначений I-H-R часто используется, чтобы представить сеть с I нейронами на уровне входа, Н нейронами на скрытом уровне, и R нейронами на уровне выхода, так пример 5-3-1 ИНС с прямой передачей сигнала показан на рисунке XI.3.

Метод искусственных нейронных сетей (часть 2)

3. После того, как определено число слоев и число элементов в каждом из них, необходимо найти значения для весов и порогов сети, которые бы минимизировали ошибку прогноза, выдаваемого сетью. Существенная особенность нейронных сетей состоит в том, что зависимость между входными и выходными данными находится в процессе обучения сети с помощью алгоритмов обучения (наиболее известным является метод обратного распространения). Процесс представляет собой подгонку модели, которая реализуется сетью, к подобранным пользователем наборам обучающих данных - шаблонам. Ошибка для конкретной конфигурации сети определяется путем прогона через сеть всех имеющихся наблюдений и сравнения реально выдаваемых выходных значений с желаемыми (целевыми) значениями.
В качестве функции ошибок чаще всего берется сумма квадратов ошибок (все ошибки выходных элементов для всех наблюдений возводятся в квадрат и затем суммируются) или среднеквадратичная ошибка (сумма квадратов ошибок нормируется на число наблюдений и переменных, после чего из нее извлекается квадратный корень). Условием остановки процесса обучения является прохождение определенного количества этапов итерации, либо когда ошибка достигнет некоторого заданного пользователем уровня. Если в очередном эксперименте наблюдается «недообучение» (сеть не выдает результат приемлемого качества) или «переобучение» (чересчур точная аппроксимации в процессе обучения), рекомендуется попробовать поэкспериментировать с конфигурацией сети, добавляя или удаляя промежуточные нейроны или слои. Если сеть обучена хорошо, она приобретает способность моделировать (неизвестную) функцию, связывающую значения входных и выходных переменных, и впоследствии такую сеть можно использовать для прогнозирования в ситуации, когда неизвестны выходные значения.
Таким образом, преимущества ИНС по сравнению с регрессионными методиками заключаются в их способности имитировать поведение сложных систем, варьируя силу влияния узлов сети друг на друга, и изменяя структуру взаимосвязи между компонентами. Теоретически искусственные нейронные сети могут аппроксимировать любую непрерывную функцию (если есть достаточное количество уровней, нейронов, и взаимосвязей), и поэтому исследователю нет необходимости заранее принимать какие-либо гипотезы относительно модели. Кроме того, ИНС справляются с «проклятием размерности», которое не позволяет моделировать линейные зависимости в случае большого числа переменных. Однако существенным недостатком нейронных сетей является то обстоятельство, что они представляют собой «черный ящик», и знания в виде нескольких сотен весовых коэффициентов, полученных с ее помощью, не поддаются анализу и интерпретации. При таком подходе главное - практический результат, т.е. точность прогнозов, - а не на суть механизмов, лежащих в основе явления.


Имя:*
E-Mail:
Комментарий:
Введите два слова, показанных на изображении: *