Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kvant.mccme.ru/pdf/1998/02/23.pdf
Дата изменения: Fri Dec 23 19:24:24 2005
Дата индексирования: Tue Oct 2 00:15:25 2012
Кодировка: Windows-1251

Поисковые слова: р п п р п п р п п р п п р п п р п п р п
'КВАНТ' УЛЫБАЕТСЯ

23
совершенно одинаковые. В каждую машину была введена программа для игры машины с человеком. Сеня запустил обе машины и дал им поиграть друг с другом в течение нескольких часов (за это время они сыграли миллионы и миллионы партий). А потом Сеня стал проверять, научились ли машины играть в крестики и нолики. Он сыграл партию с одной из двух машин, и оказалось, что ЭВМ как не умела играть сначала, так и не научилась. Как была дурой, так и осталась. Сеня не поленился, сыграл и со второй ЭВМ. Тот же результат. Эти глубокие исследования позволили Сене сформулировать один из основных законов обучения: При игре дурака с дураком самообучения не происходит. Когда я узнал про этот закон и про то, как он был открыт, я долго смеялся. Действительно, закон обучения кажется хорошей шуткой. Но отсмеявшись вволю, я пришел к выводу, что закон обучения, открытый Сеней, гораздо важнее, чем это может показаться на первый взгляд. Он применим не только к обучению вычислительных машин, но и к обучению людей. Мы все знаем, что плохой учитель не может ничему научить. Он не может передать ученику знания, если они есть. Он тем более не может ничему научить, если сам ничего не знает. Не случайно человек, если хочет чему-нибудь научиться, ищет хорошего учителя, человека умнее себя. Не случайно тренер должен быть мастером. Хороший учитель всегда знаток. Он знает, чему учить и как учить. Плохой учитель это беда. Не надо надеяться, что у него будут хорошие, знающие ученики. Когда дурак учит, обучения не происходит. И самообучения тоже. Надо готовить хороших учителей во всех областях обучения. И не жалеть на это сил и средств. Захваченный открытым законом обучения, я разыскал Сеню и расспросил его обо всем подробнее. И изложил ему большое количество важных следствий, которые вытекают из его открытия. Сеня выслушал меня и сказал, что не думает, что открыл закон обучения, что, по-видимому, программы не очень хороши и если составить хорошую программу, то возможно, машина, играя с машиной, сможет все-таки обучиться. Таким образом, полной ясности в проблеме обучения пока нет. Но надо хотя бы пытаться ее решить. Даже если нет твердой надежды на успех. Как говорится, можешь дерзай, не можешь слезай. Но в любом случае мы должны знать, чего ждать от ЭВМ.

народнохозяйственная проблема. Бесполезных ископаемых надо добывать как можно больше, сокращая при этом расход денежных средств, материалов и энергии. И в этом деле ЭВМ должна была оказать решающую помощь. Но до этого не дошло. Первой машину освоила бухгалтерия. Теперь вся зарплата, весь учет материальных фондов института, разные там балансы, дебеты, кредиты все считает вычислительная машина. Быстро считает и выдает результаты счета, печатая столбики цифр н а больших бумажных простынях. При этом численность сотрудников бухгалтерии вовсе не сократилась, а еще выросла. Прибавилось несколько программистов, оператор на ЭВМ, радиоинженер и три лаборанта. Насчет ископаемых машина пока не высказывается программа не готова, не хватает опытных программистов. А сама машина пока не знает, что ей делать. Но это дело времени. Есть у нас сотрудник, назовем его сокращенно Сеней. Давно работает. И вот он взялся за решение важнейшей задачи научить электронно-вычислительную машину думать, т.е. не просто выполнять то, что ей задано в программе, а раз от разу все лучше и лучше. Как вам объяснить, чего Сеня добивался? Представьте себе исполнительного дурака (это, чисто условно, ЭВМ). И вот этот дурак, выполняя данные ему поручения, начинает вдруг присматриваться к тому, что и как он делает и нельзя ли все это сделать лучше. Словом, дурак умнеет и раз от разу все лучше выполняет поставленную задачу. Дурак с рефлексией это уже почти умный. В принципе можно составить такие программы, которые предусматривают самообучение машины в процессе работы. Вот Сеня и занялся таким делом. Для обучения машины Сеня выбрал игру в крестики и нолики. Игра эта очень простая, но Сеня рассудил, что если удастся научить машину прилично играть хотя бы в крестики и нолики, то откроется путь и к обучению более сложным делам. Сеня составил такую программу. Первоначально машина не умеет играть в крестики и нолики, она знает только правила игры. В частности, она знает, что может поставить свой крестик на любое свободное поле. На какое именно поле следует ставить крестик, чтобы выиграть, машина сначала не знает и поэтому, конечно, проигрывает. Но Сеня построил такую программу, что машина от партии к партии улучшает свою игру. Как это достигается, я вам не могу точно сказать, потому что сам
6

толком не знаю. Но если объяснить грубо и приблизительно, то дело обстоит следующим образом. В соответствии с программой, машина запоминает сыгранную (и проигранную) партию, а затем повторяет эту партию в своей памяти. П ри этом машина имеет задание: надо найти в той уже сыгранной партии такой последний ход (или два последних хода), чтобы помешать противнику сделать выигрывающий ход. Грубо говоря, играл дурак с умным в крестики и нолики. Играл и первую партию проиграл. А потом ему говорят: 'Вспомни еще раз проигранную партию и подумай, как надо было ходить, чтобы помешать противнику сделать выигрывающий ход. И в следующий раз не забудь, как надо ходить'. Я об этом рассказываю очень неточно, потому что я и сам не очень хорошо понимаю, как все это делается. А если бы я все хорошо понимал, то было бы для вас еще хуже: тогда бы вы меня не поняли. Так или иначе, в памяти ЭВМ остается какой-то положительный опыт после каждой партии. И этот опыт накапливается. Дурак играет с умным и сам постепенно умнеет. Через шесть-восемь партий машина начинает играть с человеком беспроигрышно. Выиграть она у человека не может, потому что крестики и нолики такая игра, в которой при правильных действиях партнера выигрыш невозможен. Но и человек уже не может выиграть у машины. Дурак научился играть он уже не дурак. Вот такую программу составил Сеня программу с самообучением. Но это не все, как говорил Анри Пуанкаре. Составив программу и испытав ее, Сеня проделал следующий опыт. Он взял две электронно-вычислительные машины, заложил в каждую из них одну и ту же программу и посадил эти две машины играть друг с другом в крестики и нолики. Как вы понимаете, это уже совсем другая задача. Действительно, в предыдущем случае дурак играл с умным и от умного набирался ума. А здесь дурак играет с таким же, как он сам, дураком. Спрашивается, чему они могут научить друг друга? Чему один дурак может научить другого? На первый взгляд ничему. Но есть одна тонкость. Дело в том, что электронно-вычислительные машины обладают большим быстродействием. Пока человек сыграет с машиной одну партию, машина с машиной успеют сыграть миллионы партий. И, может быть, огромное количество сыгранных партий, несмотря на низкую квалификацию обоих партнеров, поможет им чему-то обучиться. Повторяю, программы самообучения у обеих машин были

*