Вы здесь

Время молотков, день 29: Стратегический уровень

alkjash

Я заметил, что я еле волочу ноги к концу десятидневного цикла Времени молотка. Исходя из этого и других соображений, я полагаю, что мой объём писательского внимания равен неделе, а черновики и планы, которым больше недели, слишком «зачерствели», чтобы я мог их закончить. Если бы я знал это заранее, я бы, наверное, организовал время молотков как шесть 5-дневных циклов.

Обучение с подкреплением?

Вы играете в Го против сэнсэя. На двадцать четвёртом ходу он вторгается в ваше сангэн бираки (позиция в го, в которой между камнями три пустых места, иначе «расширение через три пункта») с разрушительной точностью, разделяя группу, которая казалась вам защищённой, на двух рассеянных драконов. Левый дракон пытается бежать, но сэнсэй отрезает ему путь к отступлению с помощью тонкой атаки на ваше угловое заграждение. Он в отчаянии погибает.

Правый дракон, теперь столкнувшийся с массивной стеной, которую сэнсэй построил для атаки на левую группу, отчаянно пытается проявлять какую-то жизнь на месте. Его второй глаз был бесцеремонно «выколот» хорошо поставленным тесудзи. Благодаря вашей борьбе, у сэнсэя есть пятьдесят очков территории и хорошее окружение по всей доске. Вы терпите поражение.

Что, как предполагается, новичок должен выучить в ходе такой игры? Если учитель разрешит пересмотреть партию самостоятельно, вы можете с лёгкостью сделать одно из следующих заключений, если не все сразу:

  1. Не делать расширение через три пункта.
  2. Не пытаться бежать.
  3. Не реагировать на угловые ходы.
  4. Жертвовать камни сразу.
  5. Изучить жизнь и смерть.

Допустим, вы усвоили урок 1, не делать расширение через три пункта. На следующей неделе в партии с учителем вы покорно делаете шаги через два пункта. Камни сэнсэя сбалансированы и эффективны, в то время как ваши неинтересно скучены. Вы с лёгкостью проигрываете по очкам.

Что произойдёт дальше? Вы вернётесь к шагам через три пункта, так как вам не понравились шаги через два?

Избыточная коррекция и сигналы остановки обучения

Стратегический уровень в ускоренной CFAR-программе - это учиться стратегически: обновлять знания тем способом, который предотвратит подобные провалы в будущем. Тот тип обучения, который был продемонстрирован выше, определённо, не стратегический.

Как я думаю, есть два распространённых и частично пересекающихся вида провала при обучении, при которых выученные уроки оказываются хуже, чем ничего.

Первый - избыточная коррекция:

После спора: «Я должен быть более понимающим.»

После панической атаки: «Я должен меньше беспокоиться обо всём.»

Побывав Белым Рыцарем в Армии Дракона: «Я больше не буду верить человеческим существам.»

Проиграв игру в Го: «Я должен перестать делать прыжки длиной три пункта.»

Подобные избыточно обобщаемые уроки могут быть лекарством, которое хуже, чем болезнь. По мере того ваши простые стратегии постоянно терпят неудачу, вы должны пробовать всё более и более сложные стратегии. Вы не должны болтаться между двумя крайностями, отказываясь взглянуть в лицо сложной реальности.

Второй тип ошибок тоже непродуктивный:

Я должен был разобрать ту задачу мастерского уровня на жизнь и смерть камней [в Го].

Я должен был прочитать главу 3 вместо главы 2!

Я должен был использовать метод полиномов при решении данной задачи!

Я называю такие мысли «стоп-сигналы обучения». Распространённый тип стоп-сигналов обучения это «нужно было сделать то и это», где то и это - какой-то произвольный, блестящий, но необоснованный выбор, который вы бы никогда не сделали заранее. Также, как семантические стоп-сигналы выглядят как ответы, стоп-сигналы обучения выглядят как уроки, которые вы изучили, но которые не дадут вам в будущем никакой пользы.

Стоп-сигналы обучения просто говорят: повернись назад, тут нечего делать, тут только болезненные мысли. Обычно это сопровождается небрежным пожиманием плеч.

Стратегическое обучение

Что значит «обучаться стратегически»?

Если вы терпите провал, попробуйте ответить на вопрос: «Каким способом я должен был бы думать, чтобы заранее избавиться от встретившейся мне проблемы?». Каждый урок, выученный вами, это шанс откалибровать вашу мыслительную стратегию для того, чтобы в будущем предотвращать подобные проблемы.

Наконец, научитесь распознавать непродуктивные «избыточные коррекции» и объезжать «стоп-сигналы обучения». Когда вы совершаете ошибку и делаете скороспелое суждение на тему «что пошло не так», спросите себя: стало ли менее вероятным, что я потерплю подобную неудачу снова?

Упражнение: установите Таймер Йоды и обдумайте ваши последние ошибки.

Челлендж дня

Расскажите историю про то, как лекарство оказалось хуже болезни.


Перевод: 
Tookser
Аудио: 

Время молотков, день 29: Стратегический уровень

Аудиофайл: 
Оцените качество перевода: 
Средняя оценка: 5 (2 votes)
  • Короткая ссылка сюда: lesswrong.ru/531