Механизмы кратковременной памяти в целенаправленном поведении нейросетевых агентов
Лахман К.В., Бурцев М.С.
Лаборатория нейроинтеллекта и нейроморфных систем, Курчатовский НБИКС-центр, НИЦ «Курчатовский институт» Россия, Москва, пл. Академика Курчатова, 1
klakhman@gmail.com
burtsev.m@gmail.com
Аннотация. Современные методы машинного обучения не позволяют достичь того уровня адаптивности, который наблюдается в поведении животных в сложных средах с множеством целей. Данное обстоятельство диктует необходимость исследования общих принципов формирования сложных управляющих систем, позволяющих обеспечивать эффективное целенаправленное поведение. Нами была разработана оригинальная модель нейроэволюции агентов в стохастической среде с иерархией целей. В работе проведен анализ эволюционной динамики поведенческих стратегий агентов. Результаты анализа показали, что в процессе эволюции возникают нейросетевые контроллеры, позволяющие агентам хранить информацию в кратковременной памяти за счет различных нейродинамических механизмов и использовать ее в поведении с альтернативными действиями. При исследовании нейронального обеспечения поведения агентов мы обнаружили, что группы нейронов могут отвечать за разные этапы поведения.
Ключевые слова: целенаправленное поведение, альтернативное поведение, кратковременная память, нейроэволюция, среды с множественными целями, рекуррентные нейронные сети.