Методы обучения собак. оперантное обучение собак

Оглавление

Теория социального научения бандуры. Бандура Альберт

Эффективность человеческого поведения: социальные корни, социальные последствия

Самоэффективность занимает центральное место в размышлениях Бандуры. Когда люди осознают собственную эффективность в специфической ситуации, они начинают прилагать больше усилий, дольше могут противостоять препятствиям, выдерживают враждебные обстоятельства и неприятные переживания. Высокая самоэффективность, связанная с ожиданием успеха, обычно приводит к хорошему результату и повышает таким образом самоуважение. И, напротив, низкая самоэффективность приводит к неудаче и снижению самоуважения. Человек постоянно пытается контролировать непредсказуемые ситуации и таким образом пытается осуществлять контроль над разнообразными аспектами бытия.

Бандура считает поведение достаточно целенаправленной активностью, а эффективность намерений в регулируемом поведении определяется частично тем, насколько далеко цели устремлены в будущее.

Классический бихевиоризм Дж. Уотсона

Джон Уотсон — американский психолог, основатель бихевиоризма. Он пытался сделать психологию естественной наукой, которая пользовалась бы объективными методами.

Уотсон уделял огромное внимание классическому научению, при котором организм ассоциирует разные стимулы (звук колокольчика — условный раздражитель, а слюноотделение у собаки в ответ на звук этого колокольчика — условный рефлекс). Такой вид научения ориентирован на непроизвольные, автоматические действия

Организм как человека, так и животного приспосабливается к своему окружению посредством врождённого и приобретённого набора актов, т.е. поведения. Всю психическую деятельность Уотсон трактовал как поведение. Он рассматривал его как совокупность реакций организма на стимулы, т.е. поведение по принципу «стимул-реакция» (S →R). Дж. Уотсон считал, что подобрав верный стимул, можно формировать нужные навыки и качества в человеке или животном.

На работы Уотсона и основные идеи бихевиоризма сильно повлияло открытие русским физиологом И.П. Павловым классических условных рефлексов. Во многом под влиянием работ Павлова, хотя сам Павлов полагал, что они поняли его неверно, Уотсон заявил, что наблюдение над поведением может быть описано в форме стимулов (S) и реакций (R).

В доказательство правоты бихевиористической теории, Джон Уотсон и Розали Рейнер ставят эксперимент, который стал известен под названием «маленький Альберт».

Уотсон и Рейнер выбрали для экспериментов 11-месячного младенца «Альберта Б.», который был вполне нормально развитым ребенком. Сначала экспериментаторы проверили реакции маленького Альберта, показывая ему белую крысу, маски, горящую газету и хлопковую пряжу. Ничего из этого не выявило страха у мальчика.

Затем они приступили к формированию реакции страха. Одновременно с тем, как Альберту давали поиграть с белой крысой, экспериментатор бил молотком по стальной полосе так, чтобы малыш не видел молотка и полосы. Громкий звук пугал Альберта. Таким образом, ребенок стал пугаться и самой крысы (без удара). На данном этапе условный рефлекс страха на крысу закрепился у маленького Альберта.

Через пять дней Альберт снова оказался у экспериментаторов. Они проверили его реакцию: обычные игрушки не вызывали негативной реакции. Крыса же всё еще пугала малыша. Экспериментаторы проверили, не случился ли перенос реакции страха на других животных и похожие предметы. Выяснилось, что ребенок действительно боится некоторых животных и предметов, не связанных с крысой (например, кролика (сильно), собаки (слабо), мехового пальто и др.).

Ящик Скиннера

Согласно концепции оперантного поведения, обусловливание может использоваться для контроля над поведением окружающихи для самоконтроля. Для регулирования личного поведения необходимо положительное подкрепление для действия.

Эксперимент Берреса Скиннера

Голодная крыса помещалась в специальный короб. Нажимая на рычаг, животное получало еду. Со временем подопытная крыса осознала (положительный результат), что нажатие рычага позволяет достать лакомство. Данный навык закрепился.
Крыса снова помещалась в ящик, но нажатие рычага сопровождалось подачей тока. Каждый разряд тока создавал неприятное ощущение в памяти животного (негативное подкрепление). Ток, проводимый через лапки, заставлял выработанную форму поведения сойти на нет – наказание.
Последняя фаза эксперимента: крыса помещается в ящик. При нажатии рычага крыса не получала разряд током, но и еду не получала. Животное не получало позитивного или негативного подкрепления, поэтому навык затухал.

Опыты Берреса Скиннера позволили изучить процесс обучения организмов и способы его контроля.

В 1960-е годы американские государственные психиатрические клиники начали применять результаты эксперимента для работы с людьми, больными шизофренией, расстройством личности.

Чего мы можем достичь с помощью оперантного кондиционирования?

Что мы можем достичь с помощью оперантной обусловленности — это привычное формирование поведения. Наиболее важные понятия:

Приобретение

Приобретение — это процесс изучения поведения, при котором поведение связано с положительным или отрицательным подкреплением. Из-за подкрепления, поведение происходит быстрее, больше раз и с меньшей вероятностью исчезнет.

Вымирание

Вымирание состоит в подавлении подкрепления ранее усиленного поведения. Когда вы прекращаете усиливать поведение, его частота уменьшается. Это эффективная процедура для определенно уменьшить поведение, но это медленнее, чем другие, поэтому нельзя ожидать, что поведение исчезнет немедленно. Снижение поведения происходит постепенно и зависит от:

История поведения, которое должно быть погашено: вымирание происходит быстрее, когда происхождение поведения происходит недавно, и медленнее, когда поведение имеет долгую историю возникновения и хорошо консолидировано..
Подкрепление, которое получило поведение для тушения: оно быстрее, когда поведение получало подкрепление непрерывно, и медленнее, когда оно получало подкрепление периодически.
Уровень лишения подкрепления: чем больше времени прошло между появлением подкрепления, тем медленнее будет исчезновение.
Интенсивность усиления: чем больше используемый усилитель, тем больше времени потребуется, чтобы погасить поведение.
Усилие, необходимое для выдачи ответа: чем больше усилий требуется, тем легче будет потушить.

Необходимо учитывать, что приложение вымирания приводит к увеличению частоты и интенсивности поведения в первые моменты приложения, это называетсявзрыв вымирания«Они также могут усиливать агрессивное или эмоциональное поведение при осуществлении процедуры, так называемой« агрессии, вызванной вымиранием »

Важно упорствовать в применении вымирания, поскольку оно обеспечивает его эффективность.

Кроме того, ответ может появиться пунктуально через промежуток времени, в течение которого поведение исчезло, это явление называется «спонтанное выздоровление«Сохраняя вымирание, со временем исчезнет навсегда.

¿Как вымирание должно быть применено?

Удобно объяснить и уточнить условия вымирания.
Определите все усилители, которые поддерживают поведение.
Чтобы иметь возможность контролировать представление усилителей. Чтобы достичь этого, все люди в среде, в которой издано поведение, должны применить исчезновение, чтобы они не усиливали их.
Предотвратите людей, вовлеченных в программу вымирания, от первоначального увеличения нежелательного ответа, возможных агрессивных ответов, не получая ожидаемого вознаграждения, и последствий спонтанного выздоровления..
Будьте постоянны, потому что, если вымирание используется с перерывами, это эквивалентно его с перерывами.
Используйте вместе с исчезновением ненадлежащего поведения усиление альтернативного поведения, если возможно, несовместимого с тем, которое должно быть устранено. Например, если мы хотим погасить поведение употребления сладких напитков, мы будем усиливать каждый раз, когда вы пьете воду.

Управление человеком

Воспитание в Б. Скиннера основано на том, что личность человека — это совокупность физических реакций, возникающих при наличии предшествующих факторов и последствий.

Человеческое поведение формируется согласно подкреплениям. Чаще всего, на основе положительного. Может формироваться и под воздействием отрицательного подкрепления.

Зная это, поведением человека можно управлять, основываясь на:

Положительном подкреплении верных реакций. Это способствует их закреплению в поведении личности.
Субъективной ценности подкрепления. То есть исходя из того, что является наиболее стимулирующим для данной личности.
Оперантное обусловливание. Личность знает, что за ее поведением может последовать отрицательное подкрепление. Чтобы избежать негативных последствий, человек вполне способен отказаться от конкретного вида поведения.
Субъективная вероятность последствий. Если человек осознает то, что вероятность возникновения отрицательного подкрепления от его действий мала, он готов рисковать.
Подражание. Людям свойственно бессознательное подражание тем, кого они считают своим авторитетом.
Тип личности. Управлять теми, кто склонен перекладывать ответственность за свои поступки и действия на других людей и жизненные обстоятельства, гораздо легче. Такой тип личности называется экстерналами. Интерналы, наоборот, берут всю ответственность за происходящее с ними только на себя.

Преимущества оперантного обучения

Как вы уже убедились, в рамках оперантного метода собака принимает активное участие в процессе дрессировки. Животное получает возможность делать выводы, держать ситуацию под контролем и управлять ею.

Конечно, для обучения питомца базовому набору команда можно и с помощью более простого классического метода. Однако «классика» легко дает сбой там, где нельзя непосредственно воздействовать на животное (например, надавливая собаке на холку).

Кроме того, оперантный метод превращает обучение в игру, и собака учится командам не только из подчинения воле хозяина, но и ради удовольствия. В результате она становится более инициативной, уверенной в себе, у нее повышается самоконтроль и умение спокойно работать даже в сложных условиях.

Оперантный метод – больше, чем дрессировка. Используя мягкий подход, вы выстраиваете сложную систему взаимодействия с собакой – систему, в которой фундаментом служит любовь, уважение и обоюдный интерес к работе.

Бихевиоризм в «Поведении организмов»

Существующие в середине 20 века теории психоанализа Беррес Скиннер относит к умозаключениям, которые основываются на предположениях. Бихевиоризм допускал влияние внутренних факторов, например, подсознания. Скиннер считал, что изучение поведения человека возможно только с такой позиции, которая допускает формирование личности внешними обстоятельствами:

окружение;
внешняя среда.

Скиннер обозначил свое учение как радикальный бихевиоризм, так как формирующие факторы носят сугубо внешний характер.

Наиболее значимая работа Скиннера– «Поведение организмов» (1938), в которой рассматриваются принципы оперантного поведения. Концепция учения заключается в том, что обучение любому навыку или форме поведения происходит только через поощрение или наказание, которые ассоциируются с этим навыком.

Исходя из того, что психика человека опирается на различные рефлексы, Скиннер подчеркивал отличие своего подхода от опытов Павлова по типу стимулов. Негативное и положительное подкрепление прививают конкретную форму поведения, увеличивая вероятность его повторения. Наказание ослабляет вероятность повторения конкретного поведения.

Скиннер ввел обучение своих сотрудников на машинах, которые оценивают ответы учащихся. С помощью обучающих машин требуемое действие получает положительное подкрепление.

Для демонстрации механизма обусловливания исследователь провел опыт с экспериментальной камерой, изобретенной им самим. Камера получила название ящика Скиннера.

Разница между оперантным и классическим кондиционированием

Другой тип кондиционирования — это классический кондиционер, чей главный автор — Иван Павлов и состоит в том, чтобы связать безусловный стимул, то есть стимул, который сам по себе уже вызывает ответ, с нейтральным стимулом, который сам по себе не вызывает этот ответ. В тот момент, когда стимулы связаны, то есть они встречаются многократно, теперь вызывается нейтральный стимул (который не вызвал ответ). С примером это будет легче понять.

Пример классической обусловленности Павлова

Безусловный стимул (пища) вызывает реакцию (что собаки выделяют слюну); тогда как нейтральный стимул (см. лицо, осуществляющее уход) не вызывает ответа (он не вызывает слюноотделения).
Безусловные и нейтральные стимулы представляются вместе (попечитель приносит еду) неоднократно, и безусловный стимул ассоциируется с нейтральным (попечитель ассоциируется с едой).
Теперь, нейтральный стимул (см. Попечитель) также вызывает ответ (слюноотделение). Теперь слюна собаки при виде смотрителя смотрит или не видит еду.

Основное различие между Классическое кондиционирование и оперантное кондиционирование заключается в том, что классическая обусловленность фокусируется на изменении стимула, вызывающего поведение, в то время как оперантная обусловленность фокусируется на изменении поведения через стимул.

Эта статья носит исключительно информативный характер: в онлайн-психологии у нас нет факультета, чтобы поставить диагноз или рекомендовать лечение. Мы приглашаем вас пойти к психологу для лечения вашего случая в частности.

Если вы хотите прочитать больше статей, похожих на Что такое оперантная обусловленность: определение и примеры, .

Эксперименты ученого

Теория Скиннера подробно изложена в одном из его основных трудов, который носит название «Поведение организмов». В нем ученый излагает принципы так называемого оперантного обусловливания. Проще всего понять эти принципы, рассмотрев один из наиболее типичных экспериментов ученого. Вес крысы снижали до 80-90 % от обычного. Она помещается в особое устройство, которое носит название скиннеровского ящика. В нем предоставлена возможность совершать только те действия, которые наблюдающий экспериментатор может видеть и контролировать.

У ящика имеется отверстие, через которое животному подается пища. Чтобы получить питание, крыса должна нажать на рычаг. Данное нажимание в теории Скиннера называется оперантной реакцией. Как крысе удается нажать на этот рычаг – посредством лапы, носа, а может быть, хвоста, – не имеет никакого значения. Оператная реакция в эксперименте остается той же, так как она вызывает лишь одно следствие: крыса получает еду. Поощряя животное пищей за определенное число нажиманий, исследователь формирует устойчивые способы реагирования у животного.

Базовые концепты

Поскольку бихевиористы ограничиваются тем, что можно наблюдать, они суммируют все внутренние состояния — например, восприятия , эмоции и мысли — в так называемом черном ящике . Согласно теории поведения, на этот черный ящик воздействуют стимулы окружающей среды таким образом, что вызывается поведение (реакция) . У этого ответа есть последствия. Если какое-либо поведение проявляется в определенном контексте (стимуле), возможно, это поведение будет выполняться чаще в будущем (при тех же обстоятельствах) (тогда можно сделать вывод, что последствия были «приятными»), или оно будет быть реже (тогда последствия были «неприятными»). В первом случае говорят о « подкреплении », во втором — о «наказании».

Классификации «приятное / неприятное» или «аппетитное / отталкивающее» следует понимать не как субъективно переживаемые состояния — как таковые, им нет места в бихевиористской теории — но как выражение того, следует ли искать эти состояния или избегать их. Торндайк определил следующее: « Приятное состояние означает состояние, которого животное не избегает, а часто даже ищет и поддерживает. Неприятный описывает состояние, которого животное обычно избегает или уходит «.

Подкрепление происходит, когда следствием поведения является приятный стимул («положительное подкрепление») или отсутствие неприятного стимула («отрицательное подкрепление»). Соответственно, наказание происходит, когда следствием является неприятный стимул («положительное наказание») или устранение приятного стимула («отрицательное наказание», тренировка за бездействие или «DRO» = дифференцированное подкрепление другого поведения ).

Дискриминационные сигналы (сигнальные стимулы) — это стимулы, которые сигнализируют об определенных поведенческих последствиях. Пример: крыса получает награду (еду) только в том случае, если лампа была зажжена заранее.

Схема на случай непредвиденных обстоятельств

Четыре случая оперантного обусловливания: положительное подкрепление, отрицательное подкрепление, наказание I типа и наказание II типа.

В теории обучения , в чрезвычайных ситуациях (поздняя латынь contingentia «возможность») является непосредственным и закономерным следствием (Latin consequi «наблюдение, достижения»), я. ЧАС. Следствие поведения. Существует четыре классических основных формы непредвиденных обстоятельств в оперантном обусловливании:

Положительное подкрепление — это увеличение вероятности поведения, которое возникает, когда поведение вызывает приятные ( аппетитные ) немедленные последствия (например, признание, уважение, еда, деньги).
Отрицательное подкрепление — это увеличение вероятности поведения, возникающего, когда поведение предотвращает или прекращает неприятные ( отталкивающие ) немедленные последствия (например, устранение шума, яркого света, тепла или холода).
Положительное наказание — это снижение вероятности возникновения поведения, если поведение вызывает неприятные ( вызывающие отвращение ) немедленные последствия (например, шум, яркий свет, тепло или холод, поражение электрическим током).
Отрицательное наказание — это снижение вероятности возникновения поведения, если такое поведение предотвращает или прекращает приятные ( аппетитные ) немедленные последствия (например, удаление еды, тепла, рождественского бонуса). Негативное подкрепление и наказание часто путают друг с другом. Слово « отрицательный» здесь означает только устранение стимула.

Схема непредвиденных обстоятельств инструментального и оперантного кондиционирования
	Представлена согласованность	Нет никаких последствий
Приятное следствие	положительное подкрепление	отрицательное наказание (Снятие наказания)
Неприятные последствия	положительное наказание (Наказание за предъявление)	отрицательное подкрепление

Схема непредвиденных обстоятельств инструментального и оперантного кондиционирования

Представлена согласованность

Нет никаких последствий

Приятное следствие

положительное подкрепление

отрицательное наказание

(Снятие наказания)

Неприятные последствия

положительное наказание

(Наказание за предъявление)

отрицательное подкрепление

Клинически отрицательное подкрепление имеет наибольшее значение, поскольку оно используется для поддержания поведения избегания, например B. вносит огромный вклад в развитие фобических расстройств и обсессивно-компульсивного расстройства : пациенты делают все, чтобы избежать состояния, которое воспринимается как отвращение (тесное пространство, немытые руки), так что они никогда не узнают, смогут ли они вынести это состояние или справиться с ситуацией. тем временем.

Если нет ни положительного, ни отрицательного подкрепления, поведение гаснет . Удаление не следует путать с снятием положительного подкрепления (отрицательного наказания).

Скрытое обучение против других типов обучения

Скрытое обучение против классического обусловливания

Классическая обусловленность — это когда животное в конечном итоге подсознательно ожидает биологического стимула, такого как еда, когда оно испытывает, казалось бы, случайный стимул из-за повторяющегося опыта их ассоциации. Одним из ярких примеров классической обусловленности является эксперимент Ивана Павлова, в котором собаки проявляли условную реакцию на звонок, который экспериментаторы намеренно пытались связать со временем кормления. После того, как собаки были кондиционированы, у собак больше слюноотделения было не только для еды, что было биологической потребностью и, следовательно, безусловным раздражителем. У собак началось выделение слюны при звуке колокольчика, который был условным раздражителем, а выделение слюны стало условной реакцией на него. У них потекла слюна при звуке колокольчика, потому что они ждали еды.

Скрытое обучение — это когда животное чему-то учится, даже если у него нет мотивации или стимула, связывающего вознаграждение с изучением этого. Следовательно, животные могут просто получать информацию ради информации, и она приходит в их мозг. Одним из ярких примеров скрытого обучения являются крысы, подсознательно создающие ментальные карты и использующие эту информацию, чтобы иметь возможность быстрее находить биологический стимул, такой как еда, позже, когда есть награда. Эти крысы уже знали лабиринт на карте, хотя у них не было мотивации изучать лабиринт до того, как была введена еда.

Скрытое обучение против оперантного кондиционирования

Оперантное кондиционирование — это способность настраивать поведение животных с помощью поощрений и наказаний. Скрытое обучение — это адаптация поведения животных, давая им время создать мысленную карту до того, как будет введен стимул.

Скрытое обучение против теории социального обучения

Теория социального обучения предполагает, что поведению можно научиться посредством наблюдения, но при активном осознанном наблюдении. Согласно этой теории, наблюдение приводит к изменению поведения чаще, когда наблюдаются вознаграждения или наказания, связанные с конкретным поведением. Теория скрытого обучения похожа в аспекте наблюдения, но опять же из-за отсутствия подкрепления, необходимого для обучения.

От: admin

Эта тема закрыта для публикации ответов.

Оперантное обучение собак