Читать книгу "Homo Roboticus? Люди и машины в поисках взаимопонимания - Джон Маркофф"
Шрифт:
Интервал:
Закладка:
По счастливой случайности им удалось встретиться зимой 1985 г. во французских Альпах на научной конференции по вопросу соединения идей физики и нейронауки. Сеть Хопфилда, служившая первой моделью памяти человека, вызвала новый интерес в научном сообществе. Хотя Сейновски участвовал в конференции, он пропустил выступление Лекуна. Молодой французский ученый впервые делал доклад на английском и страшно волновался в немалой мере потому, что присутствовавший на конференции физик из Bell Laboratories сопровождал едкими замечаниями каждое выступление. Сидевшие рядом с Лекуном участники сказали ему, что это стиль Bell Labs – или идеи не на должном уровне, или для ученых лаборатории они уже не новость. Как ни странно, но после его выступления на ломаном английском ученый из Bell Labs встал и выразил одобрение. Через год Bell Labs предложила Лекуну работу.
На конференции Лекун все же поймал Сейновски, и ученые поделились своими соображениями. Разговор привел к появлению небольшого братства исследователей, которые намеревались создать новую модель искусственного интеллекта. Лекун завершил работу над диссертацией по подходу к обучению нейронных сетей, известному как «обратное распространение ошибки». Его вклад сделал возможной автоматическую «настройку» сети на более точное распознавание образов.
После завершения учебы Лекун стал искать во Франции организации, использующие аналогичные подходы к искусственному интеллекту. Найти удалось лишь небольшую лабораторию Министерства науки с профессором, работавшим в смежной области, но Лекун получил финансирование и место в ней. Его новый профессор сказал: «Я не представляю, чем ты занимаешься, но у тебя, похоже, светлая голова, поэтому я подпишу бумаги». Но Лекун там не задержался. Сначала он перешел в занимавшуюся нейронными сетями группу Джеффа Хинтона в Торонтском университете, а когда поступило предложение от Bell Labs, переехал в Нью-Джерси и продолжил совершенствовать свой подход, известный как сверточные нейронные сети, первоначально ориентированные на распознавание рукописных символов для автоматизированной сортировки почты. Родившийся во Франции канадец Йошуа Бенджио, получивший образование в Массачусетском технологическом институте яркий специалист по информатике, присоединился к нему в Bell Labs и работал над программным обеспечением для распознавания символов, а позже над созданием технологии машинного зрения, которая будет использоваться компанией NCR для автоматической обработки значительной части банковских чеков, циркулирующих в мире.
Несмотря на успехи разработчиков нейронных сетей, мейнстрим компьютерной науки не замечал их. Воспринимая себя как трех мушкетеров, Хинтон, Лекун и Бенджио решили изменить ситуацию. В 2004 г. они, как выразился Лекун, организовали «заговор» с целью повышения популярности сетей и одновременно развернули кампанию по ребрендингу, предлагавшую более привлекательные концепции технологии, такие как «глубинное обучение» и «глубокие сети доверия». К этому времени Лекун перебрался в Нью-Йоркский университет в какой-то мере для более тесного общения с нейробиологами и исследователями, применяющими алгоритмы машинного обучения к проблемам зрения.
Хинтон обратился в Канадский институт перспективных исследований за помощью в организации исследований в своей области и проведении ежегодных конференций. Проект, известный как «Нейрокомпьютеры и адаптивное восприятие», позволил ему отыскать самых перспективных исследователей в разных областях – от нейронауки до электротехники – и создать сообщество людей, заинтересованных в развитии нейросетей.
В этот раз на их стороне был технический прогресс – ускорение роста мощности компьютеров позволило строить нейронные сети огромных масштабов, способные обрабатывать массивы данных на порядки больше, чем раньше. Процесс занял почти десятилетие, но зато теперь возможности и ценность нейронных сетей были бесспорными. Помимо недостатка быстродействия компьютеров развитие нейронных сетей сдерживалось отсутствием больших массивов данных, необходимых для обучения. Ситуация быстро изменилась с появлением глобального интернета, а вместе с ним новой информационно-технологической концепции – облачных вычислений, а также возможности соединения этого ресурса с миллиардами мобильных передающих и вычислительных систем в виде смартфонов. Теперь нейронные сети можно было легко обучать на базе миллионов цифровых изображений или аудиозаписей, доступных в интернете.
Успех технологии стал очевидным, и Хинтон начал получать приглашения от компьютерных компаний, искавших пути повышения точности ориентированных на потребителя интеллектуальных сервисов – распознавания речи, машинного зрения, распознавания лиц, перевода и диалоговых систем. Казалось, что список был бесконечен. В качестве консультанта Хинтон внедрил нейронные сети глубинного обучения в Microsoft, и правильность такого подхода подтвердилась в 2012 г., когда директор по разработкам Microsoft Ричард Рашид выступил перед большой аудиторией в Тяньцзине, Китай. Рашид говорил по-английски, делая паузу после каждого предложения, а программа сразу произносила его на китайском голосом лектора. В конце выступления наступила тишина, а затем раздались оглушительные аплодисменты.
Программа работала не идеально, но за счет алгоритма глубинного обучения, разработанного на основе исследований Хинтона, количество ошибок распознавания было снижено более чем на 30 %. В следующем году ручеек интереса к нейронным сетям превратился в поток. Доступность данных в интернете и дешевой рабочей силы за счет краудсорсинга обеспечила и вычисления, и человеческие ресурсы для целей обучения.
Microsoft была не одинокой. Новые нейросетевые и другие технологии машинного обучения резко повысили интерес к искусственному интеллекту в Кремниевой долине и не только в ней. Соединение нового подхода к искусственному интеллекту с интернетом открывало путь к созданию новых сервисов на основе машинного зрения или распознавания речи и получения прямого доступа к глобальной аудитории через десятки миллионов смартфонов.
В 2010 г. Себастьян Трун пришел в Google, чтобы создать X Laboratory, своего рода аналог Исследовательского центра Xerox в Пало-Альто. У лаборатории был большой портфель научно-исследовательских проектов – от работы Труна над беспилотными автомобилями до развития нейронных сетей. В широком смысле их определяли как «мозговые» проекты, возрождавшие новую волну интереса к системам искусственного интеллекта.
Проект «Человеческий мозг» первоначально возглавлял Эндрю Ын, коллега Труна по возрожденной Стэнфордской лаборатории искусственного интеллекта. Ын был экспертом по машинному обучению и знатоком некоторых методов глубинного обучения нейронных сетей, предложенных Хинтоном и Лекуном. В 2011 г. он начал заниматься в Google созданием системы машинного зрения, и в следующем году проект дал такие результаты, что исследователи Google решили представить их в докладе об эксперименте по неконтролируемому обучению с использованием видео из YouTube. Обучение на 10 млн цифровых изображений, найденных на YouTube, прошло намного лучше, чем все предыдущие попытки, – точность распознавания 20 000 объектов возросла примерно в два раза. Система также научилась распознавать кошек, что не удивительно, учитывая изобилие изображений кошек на YouTube. «Мозг» Google смонтировал сказочное цифровое изображение кошки, используя иерархию ячеек памяти для последовательного отбора общих особенностей на основе просмотра миллионов изображений. Ученые описывали этот механизм как кибернетический аналог процесса, происходящего в зрительной зоне коры головного мозга. Эксперимент стал возможным благодаря огромным вычислительным ресурсам Google, позволившим исследователям выделить для решения задачи кластер из 16 000 процессоров, что, конечно, ничтожно мало по сравнению с миллиардами нейронов мозга, значительная доля которых задействована в нашей зрительной системе.
Внимание!
Сайт сохраняет куки вашего браузера. Вы сможете в любой момент сделать закладку и продолжить прочтение книги «Homo Roboticus? Люди и машины в поисках взаимопонимания - Джон Маркофф», после закрытия браузера.