Становясь умнее, машины начинают обучаться
Исследования демонстрируют, что нейронные сети, которые используются во многих приложениях, могут учиться распознавать последовательности в данных по таким же алгоритмам, что и человеческий мозг.
Мозг занимается своей стандартной задачей – обучение – подстраивая свои соединения по неизвестному набору правил. Для того, чтобы эти правила раскрыть, учёные тридцать лет назад стали заниматься разработкой компьютерных моделей, которые пытаются воспроизвести процесс обучения. В настоящее время в процессе экспериментов выявляется, что ведут себя эти модели очень похожим на настоящий мозг образом при выполнении конкретных задач. Исследователи утверждают, что эта похожесть связана с базовым соответствием между алгоритмами обучения компьютера и мозга.
Алгоритм, который использует используемый компьютерная модель, назван машиной Больцмана. Он выглядит довольно многообещающим как простое теоретическое объяснение нескольких процессов, которые происходят в мозгу – распознавания звуков и объектов, формирования памяти, цикла бодрствования и сна.
«Это самая лучшая из имеющихся у нас на настоящий момент возможностей для понимания мозга», – рассказывает Сью Бекер, профессор психологии, нейробиологии и поведения в Университете им. Макмастера в Гамильтоне, Онтарио. «Мне неизвестна модель, которая описывает более широкий круг явлений, связанных со структурой мозга и с обучением».
Пионеру в области искусственного интеллекта Хинтону всегда хотелось понять правила, по которым мозг ослабляет связь или усиливает её – то есть, алгоритм обучения. «Я решил, что для того, чтобы понять что-либо, его необходимо построить», – сообщает он. Хинтон планирует, последовав редукционистскому подходу физиков, создавать простые компьютерные модели мозга, использующие разные алгоритмы обучения, и поглядеть, «какие из них станут работать», – рассказывает Хинтон, который работает частично в Google и частично в Торонтском университете профессором информатики.
Десятками лет многие компьютерные модели Хинтона прозябали. Но из-за подвижек в мощности процессоров, прогрессу в понимании мозга и алгоритмов, нейросети играют всё возрастающую роль в нейробиологии. Сежновски, глава Вычислительной лаборатории нейробиологии в Институте биологических исследований им. Салка в Ла-Холье (Калифорния), рассказывает «30 лет назад у нас были довольно приблизительные идеи; сейчас мы принялись проверять некоторые из них».
Мозговые машины
Прежние попытки Хинтона воспроизвести мозг были ограниченными. Хотя Хинтон своё открытие опубликовал в двух уважаемых журналах, к тому времени нейросети вышли из моды, и он «с трудом пытался заинтересовать людей», — рассказывает ведущий исследователь в Microsoft Research Ли Денг. Но Денг знал Хинтона и захотел в 2009 году испробовать его метод «глубинного обучения», распознав его потенциал. В последующие годы алгоритмы обучения используются на практике в приложениях, подобных личному помощнику Google Now или функции голосового поиска в телефонах на Microsoft Windows.
Один из самых многообещающих алгоритмов, машина Больцмана, носит имя австрийского физика XIX века Людвига Больцмана, разработавшего раздел физики, имеющий дело с большим количеством частиц, известный, как статистическая механика. Больцман открыл уравнение, дающее вероятность обладания молекулярным газом определённо энергией при достижении равновесия. Если заменить молекулы нейронами, то результат будет стремиться к тому же самому уравнению.
Синапсы сети начинают со случайного распределения весов, и веса постепенно подстраиваются согласно довольно простой процедуре создаваемая схема срабатывания в процессе получения машиной данных (таких, как изображения или звуки), сравнивается со случайной схемой срабатываний машины, происходящей, когда данные не вводятся.
Джоффри Хинтон полагает, что лучший подход к пониманию процессов обучения в мозге это построение компьютеров, которые обучаются таким же способом.
Каждый виртуальный синапс отслеживает оба статистический набора. Если соединяемые им нейроны чаще срабатывают в близкой последовательности при получении данных, чем при случайной работе, то вес синапса увеличивается на пропорциональную разнице величину. Но если два нейрона чаще срабатывают вместе во время случайной работы, то соединяющий их синапс признаётся слишком сильным и ослабляется.
Чаще всего используемая версия машины Больцмана лучше работает после «тренировки», переработав тысячи примеров данных последовательно на каждом слое. Сначала нижний слой сети получает сырые данные в виде изображений или звуков, и, на манер клеток сетчатки, нейроны срабатывают, если обнаруживают контрасты в своём участке данных, такие, как переключение от светлого к тёмному. Их срабатывание может вызвать срабатывание объединённых с ними нейронов, в зависимости от веса соединяющего их синапса. По мере того, как срабатывание пар виртуальных нейронов постоянно сравнивается с фоновой статистикой, постепенно появляются и усиливаются осмысленные связи между нейронами. Веса синапсов уточняются, и категории звуков и изображений встраиваются в соединения. Каждый последующий слой тренируется сходным образом, используя данные со слоя ниже его.
Если скормить изображение автомобиля нейронной сети, натренированной на обнаружение определённых объектов на изображениях, нижний слой сработает, если обнаружит контраст, обозначающий грань или конечную точку. Эти сигналы пройдут до нейронов более высокого уровня, определяющих углы, части колёс, и т.п. В верхнем уровне нейроны срабатывают только реагируя на изображение автомобиля.
«Магия происходящего в сети в том, что она способна обобщать, – рассказывает Ян Лекун, директор Центра науки о данных в Нью-Йоркском университете. – Если вы продемонстрируете ей машину, которую она раньше не видела, и если у машины будут некие формы и особенности, общие с машинами, которые показаны ей во время тренировки, она может определить, что это машина».
Недавно нейросети ускорили своё развитие из-за хинтоновскому многослойному режиму, использованию высокоскоростных компьютерных чипов для обработки графики и быстрому росту количества изображений и записи речи, которые доступны для тренировки. Сети способны правильно распознавать 88% слов английской разговорной речи, тогда как средний человек распознаёт 96%. Они способны выявлять автомобили и множество других объектов на изображениях со одинаковой точностью, и за последние годы заняли доминирующее положение в соревнованиях по машинному обучению.
Строим мозг
Никому не известно, как напрямую выяснить правила, по которым обучается мозг, но есть много косвенных совпадений между поведениями мозга и машины Больцмана. Оба обучаются без надзора, используя лишь существующие в данных закономерности. «Ваша мама не рассказывает вам миллион раз о том, что изображено на картинке, – рассказывает Хинтон. – Вам приходится учиться распознавать вещи без советов других. После того, как вы изучите категории, вам говорят названия этих категорий. Так что дети узнают про кошек и собак, а затем узнают, что собак называют „собаки“, а кошек – „кошки“. Взрослый мозг не настолько гибкий, как юный, точно также и машина Больцмана, потренировавшись на 100 000 изображений автомобилей, не сильно изменится, увидев ещё одно. У её синапсов уже установлены нужные веса для категоризации автомобилей. Но обучение не завершается. Новая информация может быть интегрирована в структуру и мозга, и машины Больцмана.
За последние двадцать лет изучение деятельности мозга во сне дало первые свидетельства того, что мозг пользуется алгоритмом, похожим на больцмановский, для включения в свою структуру воспоминаний и новой информации. Нейробиологам давно известно, что у сна существует важная роль в консолидации памяти и он способствует интеграции новой информации. В 1995 Хинтон с коллегами сделали предположение, что сон играет роль базового уровня в алгоритме, обозначая активность нейронов в отсутствии вводных данных.
Во время сна вы просто выясняете базовую частоту срабатывания нейронов, – рассказывает Хинтон. – Вы выясняете корреляцию их работы в случае, когда система функционирует сама по себе. А потом, если нейроны коррелируют больше, просто между ними увеличиваете веса. А если меньше, то уменьшаете веса.
На уровне синапсов, «этот алгоритм можно обеспечить несколькими способами», – сообщает Сежновски, советник администрации президента в рамках инициативы BRAIN, исследования с грантом в $100 млн, призванного разработать новые техники изучения мозга.
Он утверждает, что мозгу проще всего работать с алгоритмом Больцмана, переключаясь с наращивания синапсов днём на уменьшение их ночью. Гиулио Тонони [Giulio Tononi], глава Центра изучения сна и сознания в Университете Висконсина-Мэдисона, обнаружил, что экспрессия генов в синапсах меняет их в соответствии с данной гипотезой гены, которые участвуют в росте синапсов, активнее днём, а гены, которые занимаются в сокращении синапсов – ночью.
По другому варианту, «базовая линия может вычисляться во сне, а потом изменения относительно её могут проводиться в течение дня», – рассказывает Сежновски. В его лаборатории строят подробные компьютерные модели синапсов и поддерживаемых ими сетей, чтобы определить, как они собирают статистику срабатываний при бодрствовании и сне, и когда для отображения этой разницы изменяется сила синапсов.
Сложности с мозгом
Изображение сетчатки, на котором разные типы клеток обозначены разными цветами. Цветочувствительные (фиолетовые) соединяются с горизонтальными (оранжевые), которые соединяются с биполярными (зелёные), а те – с клетками сетчатки и ганглия (пурпурные). Больцмановский алгоритм может оказаться одним из многих, задействуемых мозгом для подстройки синапсов. В 1990-х несколько независимых групп разработали теоретическую модель того, как зрительная система эффективно кодирует поток информации, идущей на сетчатку. Теория постулировала, что в нижних слоях зрительной коры идёт процесс «разбросанного кодирования», схожий со сжатием изображений, в результате чего поздние стадии зрительной системы работают эффективнее.
Предсказания модели постепенно проходят всё больше строгих тестов. В работе, которая опубликована в PLOS Computational Biology, вычислительные нейробиологи из Британии и Австралии обнаружили, что когда нейросети, которые используют алгоритм разбросанного кодирования «Products of Experts», изобретённый в 2002-м Хинтоном, обрабатывают те же самые необычные зрительные данные, что получают живые кошки (к примеру, кошки и нейросети изучают полосатые изображения), их нейроны вырабатывают почти идентичные необычные связи.
«К моменту, когда информация добирается до зрительной коры, мозг, как мы полагаем, представляет её в виде разбросанного кода», – говорит Бруно Ольсхаузен, вычислительный нейробиолог и директор Редвудского центра теоретической нейробиологии в Университете Калифорнии-Беркли, помогавший разрабатывать теорию разбросанного кодирования. «Будто бы у вас в голове находится машина Больцмана, и пытается понять связи, которые существуют между элементами разбросанного кода».
Ольсхаузен с командой использовали модели нейросетей высших слоёв зрительной коры для того, чтобы продемонстрировать, как мозг может поддерживать стабильное восприятие зрительного ввода несмотря на движение изображений. В другом исследовании они увидели, что активность нейронов зрительной коры кошек, наблюдавших чёрно-белый фильм, очень хорошо описывается машиной Больцмана.
Одно из возможных применений этой работы – создание нейропротезов, к примеру, искусственной сетчатки. Если разобраться в том, как «информация форматируется в мозге, можно понять, как стимулировать мозг, чтобы заставить его считать, что он видит изображение», – рассказывает Ольсхаузен.
Сежновски сообщает, что понимание алгоритмов роста и уменьшения синапсов даст возможность исследователям изменить их и изучить, как нарушается функционирование нейросети. «Затем их можно сравнить с известными проблемами людей, – утверждает он. – Почти все умственные нарушения можно объяснить проблемами с синапсами. Если мы сумеем лучше понять синапсы, мы сумеем понять, как мозг функционирует в нормальном режиме, как он обрабатывает информацию, как он обучается, и что идёт не так, если у вас, к примеру, развивается шизофрения».
Подход к изучению мозга при помощи нейросетей резко контрастирует с подходом проекта «Человеческий мозг» [Human Brain Project]. Это план швейцарского нейробиолога Генри Маркрама по созданию точной симуляции человеческого мозга с помощью суперкомпьютера. В отличие от подхода Хинтона, который начинается с сильно упрощённой модели и идёт по пути постепенного усложнения, Маркрам хочет сразу же включить наибольшее возможное количество данных, вплоть до отдельных молекул, и надеется, что в результате у него появится полная функциональность и сознание.
Проект получил финансирование на сумму $1,3 млрд от Европейской комиссии, но Хинтон полагает, что эта мега-симуляция провалится, завязнув в слишком большом количестве движущихся частей, которые никто пока ещё не понимает.
Кроме того, Хинтон не считает, что в работе мозга можно разобраться только по его изображениям. Такие данные нужно использовать для создания и уточнения алгоритмов. «Необходимо теоретическое мышление и исследование пространства обучающихся алгоритмов, чтобы создать такую теорию, как» машина Больцмана, – говорит он. Следующий шаг для Хинтона – разработка алгоритмов для тренировки ещё больше похожих на мозг нейросетей, таких, в которых синапсы соединяют нейроны в пределах одного слоя, а не только между разными слоями. «Основной целью является понять преимущества, которые можно получить, усложняя вычисления на каждом этапе», – рассказывает он.
Гипотеза состоит в том, что большее количество связей приведёт к усилению обратных петель, которые, согласно Ольсхаузену, скорее всего и помогают мозгу «заполнять недостающие детали». Высшие слои вмешиваются в работу нейронов из низших слоёв, имеющих дело с частичной информацией. «Всё это тесно связано с сознанием», – рассказывает Хинтон он.
Человеческий мозг всё ещё остаётся гораздо более сложным, чем любые модели. Он больше, плотнее, эффективнее, у него больше взаимосвязей и сложных нейронов – и он одновременно работает с несколькими алгоритмами. Ольсхаузен предполагает, что нам понятно около 15% активности зрительной коры. Хотя модели продвигаются, нейробиология всё ещё «похожа на физику до Ньютона», – рассказывает он. И всё же он уверен, что процесс работы на основе этих алгоритмов когда-нибудь сможет пояснить главную загадку мозга – как данные с органов чувств преобразуются в субъективное ощущение реальности. Сознание, говорит Ольсхаузен, «это нечто, появляющееся из реальности, очень сложная машина Больцмана».
Комментарии (0)