ISSN 2079-6617 (Print)
ISSN 2309-9828 (Online)
Ru | En
РПО
Факультет психологии МГУ имени М.В. Ломоносова
Главная RSS Поиск

ГлавнаяВсе статьи журналаНомера

Вартанов А.В., Терещенко Л.В., Латанов А.В., Бурлак С.А. Звуковой язык эмоций человека и обезьян. // Национальный психологический журнал. – 2014. – № 4(16). – С. 79-92.

Автор(ы): Вартанов А.В.; Терещенко Леонид В. ; Латанов А. В.; ;

Аннотация

С помощью формальных объективных методов анализа обнаружено принципиальное сходство звуковых сигналов обезьян разных видов: шимпанзе, макак- резусов, павианов, сиамангов (гиббонов) с проявлениями эмоций в речи человека. Показано, что разработанная (на основе принципа относительного микроамплитудного кроссчастотного кодирования) система формальных параметров оценки эмоций в речи человека хорошо применима в качестве экспериментальной процедуры для объективной оценки и интерпретации (в соответствии с системой человеческих эмоций) звуковых сигналов обезьян. Это подтверждается обнаруженным соответствием формальных оценок с результатами наблюдений за поведением животных в разных ситуациях. Предложенный антропоморфный метод анализа звуковых сигналов животных базируется на четырехмерной сферической модели эмоций человека и принципах кодирования информации в нервной системе. Предлагаемая модель может служить общей классификационной системой для эмоциональных явлений, объединяя физиологические представления о мозговых механизмах эмоциональной регуляции и известные психологические классификации, полученные на основе разных экспериментальных данных. Она количественно объясняет также все возможные нюансы и плавные взаимопереходы эмоций, представляя каждую конкретную эмоцию как линейную комбинацию выделенных основных психофизиологических параметров. Хорошее согласие параметров речевого сигнала не только человека, но и обезьян с параметрами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодирования информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработке технических систем, в частности, к методам обработки речевого сигнала. С другой стороны, обнаруженное совпадение подтверждает и выделенные ранее параметры психофизиологической модели, дополнительно обосновывая предпочтительность (по сравнению с другими, известными в литературе) именно такой системы классификации эмоций, как с точки зрения размерности, так и в отношении ориентации осей пространства модели. В целом, полученные результаты свидетельствуют о древности эмоциональной системы регуляции и о том, что она сохранилась у человека в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи. Кроме того показано, что у большинства обследованных видов обезьян (шимпанзе, макака- резус и павиан) весь репертуар звуковых сигналов исчерпывается этой эмоциональной регуляцией. Однако обнаружено, что некоторые виды обезьян – сиаманги (гиббоны) способны усложнять репертуар своих звуковых сигналов и создавать дополнительные каналы звуковой сигнализации в относительно свободной частотной области, чтобы не мешать использованию общей с другими видами обезьян (и человека) эмоциональной системы сигнализации. По-видимому, эта дополнительная система изменения звукового сигнала основана на том же принципе кодирования, что и общая эмоциональная.

Страницы: 79-92
Поступила: 20.03.2014
Принята к публикации: 12.04.2014
DOI: 10.11621/npj.2014.0409

Ключевые слова: эмоции; обезьяны; речевой сигнал; антропоморфный метод;

PDF: /pdf/npj-no16-2014/npj_no16_2014_79-92.pdf

Доступно в on-line версии с 31.12.2014

Звуковая коммуникация

Звук, звуковая волна имеет большое значение в эволюции жизни на земле, поскольку она служит самым «перспек­тивным» средством передачи информа­ции в мире живых существ, что доказывается фактом появления звуковой речи и сознания у человека. Несмотря на то, что животные не говорят между собой в нашем человеческом понимании, язык звуков - немаловажный и для них спо­соб общения. Сейчас уже никто не отри­цает, что звуковая коммуникация, наряду с другими каналами, широко распростра­нена в животном мире, а эмоциональные реакции, хотя бы простые, свойствен­ны не только человеку, но и большинст­ву животных, не говоря уже об обезьянах. Речь животных имеет свою эволюцию: исторически звук проделал путь от ин­струментального «механического» голо­са к «истинному» голосу, использующему воздушную струю. С помощью модуля­ций голоса (известны три основных вида модуляций - амплитудная, частотная и фазовая) животные могут вкладывать в издаваемые ими звуки разнообразную информацию и кодировать ее большой объем в коротких сигналах. Например, А.А. Никольский (2012) в звуковых сигна­лах млекопитающих обнаружил пять вариантов амплитудной модуляции: ее от­сутствие, непрерывную, фрагментарную, гетерогенную и многоуровневую. Одни и те же формы амплитудной модуляции могут встречаться параллельно в звуках, издаваемых представителями различных отрядов млекопитающих. И, напротив, различные ее формы обнаружены в сиг­налах, выполняющих одну и ту же фун­кцию.

Обстоятельные исследования акусти­ческой структуры обезьяньего языка, проведенные в лаборатории Г.В. Гершуни (Морозов, 1987), показали, что в обезья­ньем языке имеется много звуковых эле­ментов, сходных по звучанию с фонети­ческими элементами человеческой речи - гласными, согласными, слогами. Но са­мым интересным оказалось, что эмо­циональное значение голосовых звуков обезьян — угрозу, страх, радость, насто­роженность, гнев, удовольствие, жалобу и т.п. - слушатели-люди воспринимают совершенно адекватно, то есть правиль­но (с вероятностью до 95%) определяют то эмоциональное состояние, в котором находилось животное, издавая соответст­вующие звуки (Морозов, 1987). При этом у современных обезьян средства обще­ния, коммуникации отличаются не толь­ко своим многообразием, но и выражен­ной адресованностью и выполнением побуждающей функции, направленной на изменение поведения членов стада (Фабри, 1999). Эти звуки имеют опреде­ленный смысл, как показали исследова­ния Н.И. Жинкина звуковой коммуни­кации обезьян в Сухумском обезьяньем питомнике. Спрятавшись за большой камень в свободном вольере, Николай Иванович издавал похожие на «обезья­ний язык» звуки. Настороженное молча­ние обитателей вольера вскоре начинало прерываться ответными криками или же животные убегали. Эти реакции означа­ли, что издаваемый человеком звук понят, то есть коммуникация установлена (Зим­няя, 2001). Замечено также, что в некото­рых пределах эти звуки самодостаточ­ны и правильно воспринимаются даже в записи. Часто приводится такой при­мер наблюдения (Морозов, 1987). В яр­кий солнечный день стадо обезьян рез­вилось в заповеднике. Вдруг неожиданно набежала туча и пошел дождь. Обезьяны с криками скрылись под навесом. Звуки их голосов при этом были записаны на магнитофон. В другой такой же солнеч­ный день, когда дождя совсем не предви­делось, эти магнитофонные записи были воспроизведены резвящимся обезьянам. В результате обезьяны, услышав свои крики, устремились под навес. Но следу­ет ли из этого заключать, как Н.И. Моро­зов, что в «лексиконе» обезьяньего языка есть звуки, обозначающие «дождь» (Мо­розов, 1987)? Или это просто сигнал-пре­дупреждение, побуждающий прятаться? Н.И. Тих считает, что в отличие от чело­века, у обезьян коммуникативные средст­ва: звуки и телодвижения лишены семан­тической функции и поэтому не служат орудием мышления (Фабри, 1999). Ком­муникация у высших обезьян носит не­специфический характер - акустические сигналы неспецифичны, а ритуализи­рованные демонстрации редуцированы (Фридман, 2012). Пример неспецифиче­ской успешной коммуникации - это так называемый «пищевой крик» цейлонских макак (Macaca sinica). Эмоциональной ос­новой крика служит общее возбуждение, своего рода эйфория, стимулированная находками новых источников или ви­дов пищи. Доказательством неспецифич- ности сигнала служит тот факт, что ин­дивидуальные различия в реактивности макак существенно влияют на интенсив­ность звуковой активности и на частот­ные характеристики самих звуков. К тому же признаки сигнала не зависят от кон­кретных особенностей пищевых объек­тов, то есть пищевой сигнал макак лишен иконического смысла. Такой неспецифический пищевой крик, тем не менее, служит эффективным и надежным средством коммуникации. В адекватной ситу­ации крик зарегистрирован в 154 случа­ях из 169. Положительная реакция других особей на крик обнаружена в 135 случа­ях из 154. Члены стада, услышавшие крик, сбегаются на него с расстояния до 100 м (Dittus, 1984).

Таким образом, можно отметить большую выразительность и разнообра­зие звуковых средств общения обезьян (в частности, у всех узконосых обезьян звук играет важную роль в коммуникации) и сходство их звуков с эмоцио­нальными средствами коммуникации у человека. При этом все же остается проблема интерпретации звуковых сиг­налов животных - правильное распоз­навание их человеком базируется на его собственном «здравом смысле» и его же интерпретации ситуации (которое мо­жет и не совпадать с восприятием дан­ной ситуации животными). Но, что тог­да означает факт правильного и точного опознания человеком эмоций живот­ного по его крику? Может быть, только простое соответствие созданных им по своим понятиям классов криков и си­туаций (что тоже немаловажно), но во­все не соответствие эмоций, которые должны испытывать животные, тем эмо­циям, которые испытывал бы сам чело­век в этой ситуации. То есть, получается порочный круг, когда исходная аксио­ма - что человек способен классифи­цировать ситуации и соответствующие им звуки на основании собственных признаков, превращается в утвержде­ние - эти же признаки приписываются животным. Вопрос остается открытым, пока не будет разработан объективный метод сопоставления соответствующих звуковых сигналов и определения соот­ветствия качества эмоций человека этим звуковым сигналам. Только тогда можно будет по-настоящему доказать наличие сходства эмоциональных звуковых сиг­налов человека и животных и доказать предположение, выдвинутое еще Ч. Дар­вином (2001) о родстве эмоций челове­ка и обезьян.

Что касается речевых способностей ныне живущих видов обезьян, то прин­ципиальная невозможность обучения их членораздельному языку была неодно­кратно доказана (Фабри, 1999). Как же возникла речь у человека, если он про­изошел от общих с обезьянами предков? Что должно было измениться у человека, чтобы он приобрел способность к чле­нораздельной речи? Или что было утра­чено нынешними видами обезьян, из-за чего они утеряли такую возможность?

О специфике звукопроизводства обезьян и человека

По сравнению с человеком, у обезьян (в частности, у шимпанзе) слишком вы­соко расположена гортань (Жинкин, 1998; Lenneberg, 1967). Это очень удоб­но, поскольку позволяет есть и дышать практически одновременно. Низкое же положение гортани открывает возмож­ности для четкого произнесения звуков человеческого языка. У человеческих младенцев гортань, как и у шимпан­зе, расположена высоко (это позволяет одновременно сосать и дышать). При­мерно к трем годам гортань опускается и это приблизительно совпадает со вре­менем полного овладения звуковой стороной языка. Справедливости ради сле­дует сказать, что положение гортани не остается неизменным в течение жизни не только у человека: по данным группы японских ученых, некоторое опуска­ние гортани наблюдается и у шимпанзе (Бурлак, 2011). Относительно того, для чего нужно низкое положение гортани, существует несколько гипотез. Согла­сно одной, представляющейся наибо­лее правдоподобной, это необходимо именно для членораздельной звучащей речи, поскольку дает возможность язы­ку двигаться внутри речевого тракта, как в горизонтальной, так и в вертикальной плоскости. Что, в свою очередь, позволя­ет создавать различные конфигурации ротовой полости и глотки независимо и тем самым сильно расширяет набор возможных фонем, различающихся по тому, на каких частотах звук усилен, а на каких, наоборот, приглушен. Такое по­нижение гортани дает возможность из­давать более низкие звуки. Таким обра­зом, низкое положение гортани можно рассматривать как видовой признак - это одно из приспособлений для чле­нораздельной звучащей речи (Бурлак, 2011).

Кроме этих анатомических особенно­стей можно упомянуть (Барулин, 2012) об отсутствии у человека естественных диастем (промежутка между зубами, в ко­тором размещаются клыки, например, у шимпанзе), а так же об отличающей­ся от человеческой лицевой мускулатуре обезьян (Lenneberg, 1967) и о небольшом по сравнению с гейдельбергским челове­ком, палеоантропом и неоантропом ди­аметре позвоночного столба в грудном отделе, что свидетельствует об отсутст­вии способности к тонкому регулирова­нию потока воздуха, направляемого на голосовые связки, т.е. на отсутствие спе­циального, речевого режима дыхания у обезьян (MacLarnon, Hewitt, 1999). Немаловажным является и тот факт, что обезьяны с одинаковым комфортом из­влекают звук как на выдохе, так и на вдохе (Kelemen,1961; Lenneberg, 1967; Deacon, 1997), в то время как голосовая щель человека приспособлена к тому, чтобы управляемо работать только на выдохе (Lenneberg, 1967; Deacon, 1997). У некоторых видов приматов (в том чи­сле, у человека и шимпанзе) в дополне­ние к истинным голосовым складкам имеется пара ложных голосовых связок, развитых значительно слабее. При этом шимпанзе, в отличие от человека, может использовать при звукопроизводстве обе пары связок независимо, хотя их актива­ция требует большего давления воздуш­ной струи (Lenneberg, 1967). У человека ложные голосовые связки могут начать использоваться только после специ­альной программы тренировок, напри­мер, при горловом пении или в резуль­тате лечения у логопеда, когда выходят из строя истинные голосовые связки. У всех гоминоидов, кроме людей, име­ются так называемые горловые или гортанные мешки (de Boer, 2011), которые создают при производстве звука допол­нительный низкочастотный резонанс, из-за чего частоты оригинальных резо­нансов смещаются и сближаются, что негативно влияет на различимость зву­ков по тембру.

«Правильная» конструкция и функци­онирование моторного аппарата мо­жет иметь значение не только для про­изводства речи, но и для ее восприятия. Противоречие между наблюдаемым разнообразием акустических параметров и кажущейся устойчивостью восприя­тия фонетических элементов речи че­ловеком привели к формулировке раз­личных вариантов моторной теории восприятия речи (Сорокин, 2007). Пред­ставление о том, что при восприятии речи каким-то образом используется информация о свойствах речеобразования, опирается на способность челове­ка к обучению речи. Определенную роль сыграло и явление так называемой вну­тренней речи, т.е. наблюдающееся иног­да проговаривание «про себя» читаемо­го текста. Накапливались и наблюдения за компенсацией естественных и искус­ственных нарушений процесса образо­вания или восприятия речи. Неврологам и логопедам давно известно, что при парезе или параличе отдельных лице­вых или внутриротовых мышц разбор­чивость речи может и не пострадать. Например, при парезе мышц, управля­ющих движениями нижней челюсти, артикуляция губных звуков осуществ­ляется за счет большей амплитуды дви­жений губ. Начиная носить зубные про­тезы с искусственных твердым небом, в ряде случаев люди сохраняли разбор­чивость своей речи. Иногда больные с удаленной гортанью полностью вос­станавливали в своей речи не только различие между звонкими и глухими со­гласными, но и правильную фразовую интонацию (Sorokin et al., 1998) и даже могли петь. Имеются сведения о том, что замена удаленного языка пластиковым протезом позволила больному сохра­нить сравнительно разборчивую речь (Сорокин, 2007). Все эти факты говорят о широком диапазоне возможностей подстройки речевого аппарата и устой­чивости системы восприятия и поро­ждения речи в целом.

Предложенная В.Н. Сорокиным (2007) теория внутренней модели объе­диняет процессы образования и воспри­ятия речи и позволяет понять механизм вышеописанной устойчивости. Внутренняя модель является элементом си­стемы управления артикуляцией, обес­печивая текущий контроль и коррекцию артикуляции при различных наруше­ниях путем решения обратных задач: «проприоцепция - управление» и «аку­стика - управление». Для успешной де­ятельности внутренняя модель должна основываться на данных механики, аэ­родинамики, акустики речеобразования и фонетике языка. Было установлено, что при наличии акустической информации нет необходимости измерения всей формы речевого тракта, достаточ­но знания о положении губ, нижней че­люсти и передней части языка. Тем са­мым при решении задач коррекции артикуляции или компенсации наруше­ний ослабляются требования к точно­сти проприоцептивных сигналов. Это повышает вероятность того, что систе­ма управления артикуляцией способна решать обратные задачи с целью контр­оля качества генерируемого речевого сигнала и соответствия его установившимся фонетическим нормам в данном языке (Сорокин, 2007). С помощью вычислительного эксперимента было так­же показано, что форма речевого трак­та, выявленная посредством решения обратной задачи с использованием одновременно и акустических и артикуляторных данных, хорошо совпадает с результатами, полученными на осно­ве одних только акустических параме­тров. Это означает, что такая организация восприятия и порождения реальной речи вполне возможна. В процессе этих исследований было также установлено, что для успешного решения обратной задачи можно использовать не только формальные процедуры, но и так называемую «кодовую книгу» (Atal et al. 1978). Ее идея состоит в предварительном вы­числении набора соответствий меж­ду заданными векторами артикулятор­ных параметров и соответствующими им векторами акустических параметров. Можно предположить, что, начиная с пе­риода детского лепета, внутренняя мо­дель, пользуясь методом проб и ошибок, отслеживает процесс изменения ана­томических размеров речевого тракта и соответствующим образом корректи­рует содержание «кодовой книги». Примеры восстановления голосового источника после удаления гортани указывают также на удивительную пластичность системы управления речеобразованием, способной не только отслеживать воз­растные изменения параметров рече­вого тракта, но и менять саму структуру внутренней модели. При этом роль суррогатного голосового источника при­нимает на себя сфинктер, образованный пищеводом и мышцами-сжимателями глотки, которым и передаются тонкие функции мышц удаленной гортани (Со­рокин, 2007). Все это говорит в пользу того, что «функция», т.е. необходимость говорить, в значительной степени определяет и «структуру» - способ управле­ния речедвигательным аппаратом. Поэ­тому, аргумент об отсутствии у обезьян и до какого-то момента у наших предков хорошо приспособленного к речи го­лосового аппарата, как причины отсут­ствия у них речи, не корректен. Скорее наоборот, отсутствие необходимости речи («функции») не приводит к изменениям структуры. По-видимому, речь могла начать формироваться раньше, чем произошли анатомические измене­ния, которые ныне хорошо заметны при сопоставлении человека с не говорящи­ми обезьянами, и которые являются уже результатом (и показателем) развития речи, а не условием ее становления.

Эмоции и происхождение языка

Нынешний человек и нынешние обезьяны различаются и строением ре­чевого аппарата, и возможностями зву­ковой коммуникации. Но каким был язык, речь человека, когда человек толь­ко начал выделятся из мира животных? Чем различаются и чем сходны звуки, издаваемые в различных ситуациях сов­ременными животными, хотя бы теми, что генетически ближе всего к челове­ку – обезьянами, от звуков человеческой речи? Вопрос о происхождении языка занимал многих выдающихся мыслите­лей, но ставился и решался весьма раз­лично. Среди множества теорий мож­но упомянуть теорию эмоционального происхождения языка и развивающую ее теорию междометий. Родоначальни­ком этой теории был Жан Жак Руссо (1712-1778). В своем трактате по пово­ду происхождения языков Руссо (1998) писал, что первый язык человека, наиболее всеобщий, наиболее выразительный и единственный язык – это крик самой природы. Так как этот крик исторгался у человека лишь силою некоторого рода инстинкта в случаях настоятельной не­обходимости, чтобы умолять о помощи при большой опасности или при тяж­ких страданиях, то им редко пользова­лись в повседневной жизни, где царят чувства более умеренные. Когда пред­ставления человека стали расширяться и усложняться, когда между людьми установилось более тесное общение, они постарались найти знаки более многочисленные и язык более развитый. Они увеличили число изменений голоса и присоединили к ним жесты, которые по природе своей более выразитель­ны, и смысл которых менее зависит от предварительного условия (Руссо, 1998). Эмоциональная теория Руссо получи­ла развитие и стала называться теорией междометий. Один из защитников этой теории русский лингвист Д.Н. Кудрявс­кий (1867-1920) считал, что междоме­тия были своеобразными первыми сло­вами человека. Междометия являлись наиболее эмоциональными словами, в которые первобытный человек вкла­дывал различные значения в зависи­мости от той или иной ситуации (Сте­панов, 1975). По мнению Кудрявского, в междометиях звук и значения еще были соединены неразрывно. Впослед­ствии, по мере превращения междоме­тий в слова, звук и значения разошлись, причем этот переход междометий в сло­ва и был связан с возникновением чле­нораздельной речи (Степанов, 1975).

Однако язык эмоций современных животных, в том числе обезьян, и, по-видимому, предков человека, вполне до­статочен, чтобы они могли решать все свои проблемы взаимодействия в группе, в том числе и повседневного, не тре­бующего крайнего напряжения. Остав­ляя вопрос о причинах или движущих силах эволюции языка, приведших к по­явлению человеческой речи, вернемся к вопросу средств и «технической» базы развития звуковой речи. Сохранилась ли у человека первобытная система зву­ковой эмоциональной коммуникации в неприкосновенности, продолжая со­существовать в качестве системы выра­жения чувств, параллельно с возникшей независимо звуковой системой члено­раздельной речи? В звучащей нормаль­ной речи современных людей эмоцио­нальная составляющая вполне хорошо заметна. Благодаря ей бывает можно по­нять, является ли говорящий радостным или огорченным, разгневанным, испуганным, удивленным и т.д. Эта составля­ющая может быть выделена даже тогда, когда слова разобрать по тем или иным причинам невозможно. Отличить прось­бу от утвердительного ответа или отказа несложно при прослушивании магнито­фонных записей «высказываний», произнесенных детьми, которые еще не ов­ладели словами (Цейтлин, 2000). Как же эта эмоциональная составляющая взаи­модействует со звуковой системой чле­нораздельной речи? Может быть в ходе развития языка она трансформирова­лась таким образом, что новая система членораздельной речи использовала, хотя бы частично, ее средства и «поте­снила» ее в звуковом сигнале? Если эмо­циональная звуковая система человека является общим наследием его предков и ныне живущих родственных видов обезьян, то она должна быть так схожа у них, как и у разных видов современных обезьян между собой. Если же развитие человеческого языка пошло по пути ре­дукции эмоциональной составляющей и развития членораздельной речи на ее основе, то можно ожидать существенно­го различия этих сигналов.

Задачей данного исследования было – формально сопоставить структуру голо­совых сигналов обезьян и эмоциональ­ных сигналов человека.

Подход к экспериментальному исследованию

Возможность такого сопоставления предоставляет недавно разработанный новый метод автоматического распоз­навания эмоций человека по речевому сигналу (Вартанов, 2013). Предложен­ный метод базируется на четырехмер­ной сферической модели эмоций и принципах кодирования информации в нервной системе (Виденеева, Хлудо­ва, Вартанов, 2000; Вартанов, Виденее­ва, 2001; Вартанов, Вартанова, 2003; Вар­танов, Вартанова, 2005; Вартанов, 2011). Четыре оси пространства эмоций были выделены на основе психофизических экспериментов и получили интерпре­тацию как определенные нейронные (мозговые) механизмы эмоций, а угло­вые характеристики - как субъектив­ные качества эмоций. Первые две евкли­довы оси пространства модели связаны с оценкой ситуации: ось 1 - по знаку (хорошо, полезно, приятно или плохо, вредно, неприятно), ось 2 - по степени информационной определенности (уве­ренность - удивление). Система третьей и четвертой осей связана с побуждени­ем: ось 3 - притяжение, ось 4 - отвер­жение (оборонительная реакция) актив­ное (агрессия) или пассивное избегание (страх, затаивание). Предлагаемая че­тырехмерная сферическая модель мо­жет служить общей классификационной системой для эмоциональных явлений, объединяя как физиологические пред­ставления о мозговых механизмах эмо­циональной регуляции, так и известные психологические классификации, полу­ченные на основе разных эксперимен­тальных данных. Она количественно объясняет также все возможные нюан­сы и плавные взаимопереходы эмоций, представляя каждую конкретную эмо­цию как линейную комбинацию основ­ных выделенных психофизиологиче­ских параметров.

В результате экспериментальной про­верки предложенного принципа отно­сительного кросс-частотного амплитуд­но-вариабельного кодирования эмоций человека в речевом сигнале были выде­лены параметры звукового сигнала, хо­рошо соответствующие модели эмоций (Вартанов, 2013). Применение этого же метода к образцам звуковых сигналов обезьян позволяет формально количе­ственно описать характер этих сигналов и сопоставить их с эмоциональным ком­понентом речевой продукции человека.

Методика

Материал

Были проанализированы четыре группы данных:

  1. Специально записанные кри­ки макак-резусов в различных условиях, документированных и интерпретированных опытными зоо­логами биологического факультета МГУ им. М. В. Ломоносова. Всего 151 файл, длительностью в среднем 1.308 сек (стандартное отклонение 1.5 сек). Каж­дый файл соответствует определенной ситуации из следующих возможных:
    • Экспериментатор входит в помеще­ние с обезьянами и начинает запись;
    • Экспериментатор раздает еду обезьянам;
    • Экспериментатор дразнит обезьян палкой (демонстрирует палку вбли­зи клетки с обезьяной; обезьяна проявляет смешанную реакцию: компоненты защитного поведения чередуются с агрессивными в зави­симости от характера обезьяны);
    • Экспериментатор дразнит обезьян рукой (производит резкие выпады рукой в сторону обезьяны);
    • Экспериментатор дразнит обезьян водой (пускает из спринцовки тон­кую струю воды в клетку);
    • Экспериментатор высаживает одну из обезьян из ее клетки в клетку-пе­реноску (тем самым вносит элемент новизны, радикально меняя при­вычную для обезьян обстановку);
    • Экспериментатор подносит клет­ку-переноску с обезьяной по оче­реди близко к каждой из остальных обезьян, тем самым предоставляя им возможность тесного визуального, но не физического контакта «лицо к лицу» так, как обычно обезьяны друг друга практически не видят;
    • Экспериментатор меняет лицо - надевает карнавальную маску (в от­личие от простой демонстрации маски, маска, надетая на лицо, вызывает сильную характерную за­щитную реакцию);
    • Экспериментатор издает звуки по­хожие на крики обезьян (тоже эле­мент новизны для животных);
    • Экспериментатор производит ма­нипуляции с пустой обезьяньей клеткой.
  2. Крики сиаманга (гиббона). Исполь­зовались видеофайлы, найденные в интернете (Stunning Siamang Vocal Performance). Всего 19 файлов сред­ней длительностью 9.81 сек (стандар­тное отклонение 5.66 сек). Длинные файлы разрезались на куски по 2 секунды каждый.
  3. Крики шимпанзе, собранные, проана­лизированные и рассортированные Michael L. Wilson в Kanyawara community of Kibale National Park, Uganda (исполь­зованы фрагменты из видео- и аудио­файлов с сайта Gombe Chimpanzees). Всего 14 файлов средней длительно­стью 2.37сек (стандартное отклонение 1.37 сек), рассортированных на сайте по разделам: Food_associated_calls, Pant- grunts_pant-barks, Pant-hoots, Screams_ whimpers.
  4. Крики павиана с единственным сюже­том отлова обезьяны в вольере ветеринаром (Baboon_attacks_vet). Всего 5 файлов средней длительностью 9.57 сек и (стандартное отклонение 5.52 сек). Файлы порезаны на фрагменты по 2 секунды.

Процедура анализа

Показатель вычислялся посредством следующего алгоритма:

  1. Для звукового фрагмента с помощью стандартных средств - быстрое пре­образование Фурье со сглаживанием в минимальном скользящем окне - вычислялась последовательность мгновенных спектров мощности сиг­нала (в диапазон от 0 до 4000 Гц с раз­решением 50 Гц).
  2. На основе последовательности мгно­венных спектров в скользящем окне (размером 20 мс и шагом сдвига 10 мс) вычислялся показатель микро­вариативности (стандартное отклонение) амплитуды (квадратного корня от мощности) на каждой частоте, ко­торый нормировался по частотному диапазону.
  3. Для вычисления интегральной оценки всего звукового образца использовалось простое усреднение предыдущего показателя по всему интервалу звучания и получение одного вектора (по часто­те) для каждого звукового образца.

Полученный массив данных в каждой группе был дополнен четырьмя вектора­ми, выраженными в том же частотном диапазоне, которые соответствовали вы­деленным ранее (Вартанов, 2013) четырем эмоциональным параметрам речи человека. Это давало возможность пря­мого количественного сопоставления получаемых спектральных характери­стик. Далее массив данных подвергался факторному анализу.

Условия и параметры наблюдения за обезьянами макака-резус

Обстановка:

В комнате в изолированных клет­ках в условиях отсутствия физическо­го контакта и затрудненной зрительной коммуникации находятся пять обезьян. Одна из них явный лидер (доминант), четыре остальные - субдоминанты. Ранговость между субдоминантами не ясна. Вероятно, один из них является субдоминантом низшей ступени.

Для каждого файла записи звуков ука­зывалось количество криков в записи, для каждого крика (по порядковой ну­мерации в каждой записи) отмечена его вероятная функциональная роль, статус обезьяны, которая его производит и ве­роятная причинная связь с предыдущи­ми криками в записи (если есть).

Были приняты обозначения и выде­лялись в записи следующие варианты функциональной роли криков обезьян:

  1. «Приветствие» - крик, явно адресо­ванный экспериментатору.
  2. «Просительный/подчиненный» - крик, выражающий явную степень подчине­ния (зависимости?). Свойственен фак­тически только одной обезьяне с са­мым низшим статусом.
  3. «Пищевой/получение пищи» - выра­жение удовлетворения при получении обезьяной пищи.
  4. «Испуг/агрессия» - смешанная реак­ция одновременного выражения ис­пуга и попытки напугать атакующего. Как правило, возникает, когда дей­ствие направлено непосредственно против этой обезьяны.
  5. «Агрессия» - выражение чистой аг­рессии, когда обезьяне ничего не уг­рожает. Как правило, возникает, ког­да объектом агрессии является другая обезьяна.
  6. «Испуг» - выражение чистого испуга. Как правило, возникает у субдоминант низших статусов.
  7. «Коммуникация» - все остальные кри­ки без явной причины в окружаю­щей обезьяну обстановке, роль кото­рых трудно установить. Несомненна их коммуникативная роль в ситуации, когда одна обезьяна таким криком пы­тается установить звуковой контакт, а другая (-ие) подтверждают его и воз­никает «перекличка». В остальных слу­чаях роль таких звуков неясна.

Результаты

В результате анализа полученных массивов данных была оценена размер­ность факторного пространства (рис. 1). Размерность всего многообразия зву­ковых сигналов (пересчитанных по вышеописанному алгоритму в частотном диапазоне от 50 до 4000 Гц) оказалась равной четырем почти для всех обезьян: макак-резус (89.90844% от всей диспер­сии), шимпанзе (91.73380% от всей ди­сперсии) и павианов (96.99263% от всей дисперсии). Для сиаманга (гиббо­на) четыре фактора определили толь­ко (84.25218% от всей дисперсии) и по графику распределения собственных значений (рис. 1) видно, что необходи­мо выделить еще два фактора, т.е. всего 6 факторов, которые будут описывать уже 91.29132% от всей дисперсии.


Рис. 1. График распределения собственных значений для исследованных звуковых сигналов по группам обезьян.

Полученные факторы для каждого набора данных вращались методом «Ва- римакс» с нормализацией для достиже­ния «простой структуры». Оказалось, что в результате первые 4 фактора всех обезьян (включая гиббонов) полностью совпали с аналогичными факторами, выделенными в эмоциях человека. По­лученные факторные нагрузки в спек­тральном выражении представлены на рис. 2.

Рис. 2. Спектральная характеристика (факторные нагрузки) четырех выделенных факторов по всем исследованным видам обезьян (обозначены соответствующими маркерами) в сопоставлении с эмоциональными параметрами речи человека (обозначены сплошной линией).

Как видно на этом рисунке, все четы­ре выделенных фактора для всех обсле­дованных видов обезьян очень хорошо соответствуют выделенным эмоциональ­ным параметрам в речи человека. Эти параметры занимают весь обследован­ный частотный диапазон, хотя в низко­частотной области (до 750 Гц) выражены только 3 и 4 факторы и то в противофа- зе, как бы компенсируя друг друга, ста­новясь взаимозависимыми. Это с точки зрения кодирования сигнала свидетельствует о несущественности данной обла­сти для распознавания эмоционального качества по этим двум показателям. До­полнительные два фактора «песни» гиб­бона, напротив, занимают низкочастот­ный диапазон, имея там два разнесенных максимума, тогда как в высокочастотной области (после 750 Гц) переходят в противофазу, т.е. компенсируют друг дру­га, освобождая место для оценки сигнала по первым четырем эмоциональным параметрам. По-видимому, это может говорить либо о более «тонком» пони­мании и выражении эмоций гиббона­ми по сравнению с другими обезьянами и человеком, либо о том, что при полной сохранности эмоциональной системы, общей для всех обследованных обезьян и человека, формируется еще один канал звуковой сигнализации, обслуживающей какие-то дополнительные потребности животных данного вида. Полное же отсутствие в исследованных звуковых сиг­налах других обезьян дополнительных факторов свидетельствует об ограни­ченности их системы звуковой сигнали­зации только областью эмоционального реагирования.

Характеристика выделенных параме­тров звуковых сигналов обезьян в со­поставлении с аналогичными параме­трами речевых сигналов человека была верифицирована по дополнительным данным с учетом возможности вычи­сления значения факторов и сопостав­ления проявлений соответствующих им эмоций в конкретных ситуациях. При этом (в соответствии с моделью эмоций) полученные значения факторов нормировались путем вычисления евк­лидового расстояния соответствующих четырехмерных векторов и деления ка­ждой координаты вектора на это число. В таблице 1 представлены результаты формального сопоставления значений четырех параметров эмоционального речевого сигнала человека в системе че­тырех факторов, соответствующих ка­ждому виду обезьян.

 

Human Factor 1

Human Factor 2

Human Factor 3

Human Factor 4

Chimpanzee Factor 1

0.9971

-0.0599

-0.1315

-0.0737

Chimpanzee Factor 2

-0.0056

0.9976

-0.1091

-0.0125

Chimpanzee Factor 3

0.0746

0.0343

0.9853

-0.0215

Chimpanzee Factor 4

-0.0111

-0.0074

0.0004

0.9970

Baboon Factor 1

0.9845

-0.0493

-0.1798

-0.0841

Baboon Factor 2

0.0088

0.9971

-0.0388

0.0351

Baboon Factor 3

0.1746

-0.0172

0.9341

0.2783

Baboon Factor 4

0.0149

-0.0555

-0.3058

0.9561

Macaca-Rh Factor 1

0.9851

-0.0937

-0.0453

-0.1660

Macaca-Rh Factor 2

-0.0300

0.9799

-0.1466

-0.1292

Macaca-Rh Factor 3

0.0834

0.1704

0.9880

0.1070

Macaca-Rh Factor 4

-0.1477

0.0450

-0.0167

0.9718

Gibbon Factor 1

0.9998

-0.0282

-0.0672

-0.1544

Gibbon Factor 2

0.0204

0.9898

0.0033

0.1681

Gibbon Factor 3

0.0061

-0.0472

0.8881

0.0203

Gibbon Factor 4

0.0031

-0.1314

-0.4547

0.9734

Таблица 1. Соотношение факторов эмоциональной речи человека и звуковых сигналов обезьян.

Проверка содержательной интерпре­тации выделенных факторов возможна также по соответствию формального описания звукового сигнала и содержа­ния ситуации, в которой издавался соответствующий звуковой сигнал. Так, для макак-резусов ситуации, в которых они издавали соответствующие звуки, были описаны и классифицированы. На рис. 3 представлены некоторые данные, иллю­стрирующие такое соответствие. Анало­гичные данные для шимпанзе приведе­ны на рис. 4.







Рис. 3. Характеристика ситуаций, в которых обезьяны макака-резус издавали крики, формально охарактеризованные в системе четырех факторов, соответствующих эмоциональным параметрам человека.


Рис. 4. Распределение формальных оценок звуковых сигналов шимпанзе в системе выделенных четырех факторов, которые соответствуют параметрам эмоций человека, в различных ситуациях, обозначенных внизу (типы ситуаций разделены на графике вертикальными линиями).

Развитие ситуации записи при отло­ве павиана в вольере ветеринаром (с пе­риодическими актами агрессии обезья­ны и ее бегства), когда в конце она была поймана и зафиксирована усилиями нескольких человек, сопровождалось ха­рактерными криками обезьяны. На рис. 5 представлена формальная характери­стика этих криков (запись фрагменти­рована по 2 сек), сделанная в соответствии с эмоциональными параметрами человеческой речи.


Рис. 5. Распределение по времени (2 сек фрагменты) формальных оценок звуковых сигналов павиана в системе выделенных четырех факторов, которые соответствуют параметрам эмоций человека.

Полученные данные свидетельству­ют о принципиальном сходстве звуко­вых сигналов всех обследованных видов обезьян и эмоциональной составляю­щей речи человека. Их интерпретация подтверждена не только прямым сопо­ставлением параметров сигналов, но и результатами наблюдений за пове­дением обезьян и ситуациями употре­бления ими соответствующих звуковых сигналов. При этом все разнообразие звуковых сигналов большинства обсле­дованных видов обезьян практически полностью исчерпывается этим видом сигнализации. Также обнаружено, что некоторые виды обезьян – сиаманги (гиббоны) способны усложнять репер­туар своих звуковых сигналов и созда­вать дополнительные каналы звуковой сигнализации в относительно свобод­ной частотной области, чтобы не ме­шать использованию общей с другими видами обезьян (и человека) эмоцио­нальной системы сигнализации.

Обсуждение

Полученные результаты позволяют вернуться к вопросам, поставленным во введении. Итак, обнаружено, что пер­вобытная система звуковой эмоцио­нальной коммуникации, наблюдаемая у современных обезьян и, по-видимому, характерная также для предков челове­ка, сохранилась в неприкосновенности и у сегодняшнего человека, продолжая сосуществовать в качестве системы вы­ражения чувств, параллельной с возник­шей независимо (Бурлак, 2011) звуковой системой членораздельной речи. Оказа­лось, что у сиамангов (гиббонов) тоже произошло усложнение репертуара зву­ковых сигналов, причем старая система не пострадала. Дополнительная система в ходе развития заняла свободную ча­стотную «нишу», чтобы не «потеснить» старую в звуковом сигнале. Совпадение факторных характеристик вокализации макак, павианов, шимпанзе и человека показывает, что данное усложнение яв­ляется инновацией, которая произошла в эволюционной линии, ведущей к гиб­бонам (после их отделения от прочих человекообразных обезьян). В дальней­ших исследованиях можно проверить, существует ли такая же система звуковой сигнализации у других видов животных.

В целом, полученные результаты о сходстве кодирования эмоций челове­ка и обезьян хорошо согласуются с из­вестными фактами (Жинкин, 1998; Зим­няя, 2001) о том, что эмоциональное значение голосовых звуков обезьян лю­ди-слушатели воспринимают совершен­но адекватно, то есть правильно опре­деляют то эмоциональное состояние, в котором находилось животное, издавая соответствующие звуки. Эти ре­зультаты подтверждают также правоту Ч. Дарвина, писавшего об общности го­лосовых средств выражения эмоций у человека и высших животных.

Полученное хорошее согласие па­раметров речевого сигнала не толь­ко человека, но и обезьян с параме­трами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодиро­вания информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработ­ке технических систем, в частности методов обработки речевого сигнала. С другой стороны, обнаруженное сов­падение подтверждает и выделен­ные ранее параметры психофизио­логической модели, дополнительно обосновывая предпочтительность (по сравнению с другими известными в ли­тературе) именно такой системы клас­сификации эмоций, как с точки зрения размерности, так и в отношении ориен­тации осей пространства модели.

В то же время, необходимо отметить, что выделенная система звукового ко­дирования эмоций основана на относи­тельной амплитудной микромодуляции сигнала в четырех разных частотных областях. Интересен вопрос о развитии членораздельной речи человека – поя­вилась ли эта способность на базе тако­го же принципа кодирования, как у сиа­манга (гиббона), или же для нее возник другой способ кодирования (возможно частотный или фазовый)? Все это требу­ет продолжения исследований звуковых сигналов животных и человека.

Выводы:

  1. С помощью формальных объектив­ных методов анализа показано прин­ципиальное сходство звуковых сигна­лов обезьян разных видов: шимпанзе, макак-резусов, павианов и сиамангов (гиббонов) с проявлениями эмоций в речи человека. Это свидетельствует о древности эмоциональной системы регуляции и о том, что она сохрани­лась у человека в неприкосновенно­сти, продолжая сосуществовать в ка­честве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи.
  2. Разработанная (на основе принципа относительного микроамплитудного кросс-частотного кодирования) си­стема формальных параметров оцен­ки эмоций в речи человека хорошо применима в качестве эксперимен­тальной процедуры для объективной оценки и интерпретации (в соответ­ствии с системой человеческих эмо­ций) звуковых сигналов обезьян. Это подтверждается обнаруженным соот­ветствием формальных оценок с результатами наблюдений за поведени­ем животных в разных ситуациях.
  3. Показано, что для большинства об­следованных видов обезьян (шим­панзе, макак-резусов и павианов) весь репертуар звуковых сигналов исчерпывается одним видом эмоци­ональной регуляции, но существуют виды - сиаманг (гиббон), у которых система голосовых сигналов получи­ла развитие, в частности, появилась дополнительная система изменения звукового сигнала, основанная на том же принципе кодирования, что и общая эмоциональная.

Литература.

Барулин А.Н. Семиотический рубикон в глоттогенезе / А.Н. Барулин // Вопросы языкового родства. - 2012. - № 8. - С. 33-74.

Бурлак С.А. Происхождение языка: Факты, исследования, гипотезы / С.А. Бурлак. - Москва: Астрель : CORPUS, 2011. - 464 с.

Вартанов А.В. Антропоморфный метод распознавания эмоций в звучащей речи / А.В. Вартанов // Национальный психологический журнал. - 2013. - № 2.

Вартанов А.В. Механизмы семантики: человек - нейрон - модель / А.В. Вартанов // Нейрокомпьютеры: разработка, применение. - 2011. -№ 12. - С. 54-64.

Вартанов А.В. Что такое эмоции? 4-х мерная сферическая модель аспектов переживания, выражения, восприятия и обозначения эмоций. // А.В. Вартанов, И.И. Вартанова // Культурно исторический подход и проблема творчества: Материалы вторых чтений памяти Л.С. Выготского / под ред. Е.Е. Кравцовой, В.Ф. Спиридонова, Ю.Е. Кравченко. - Москва, 2003. - С. 13-29.

Вартанов А.В. Эмоции, мотивация, потребность в филогенезе психики и мозга/ А.В. Вартанов, И.И. Вартанова // Вестник Московского Университета. Сер. 14 «Психология». - 2005. - № 3 - С. 20-35.

Вартанов А.ВЧетырехмерная сферическая модель эмоций и дистанционный речевой контроль состояния человека / А.В. Вартанов, Н.М. Видинеева // Тезисы докладов рабочей группы «Влияние информационных технологий на национальную безопасность» 4-й Ежегодной Конференции Консорциума ПРМ «Построение стратегического сообщества через образование и науку». Москва, 25-27 июня 2001 г. - Москва, 2001. - 35 с.

Виденеева Н.М. Эмоциональные характеристики звучащего слова / Н.М. Видинеева, О.О. Хлудова, А.В. Вартанов // Журнал высшей нервной деятельности. - 2000. - Т. 50. - Вып. 1. - С. 29-43.

Дарвин Ч. ОВыражении эмоций у человека и животных / Ч. Дарвин. - Санкт-Петербург : Питер, 2001. - 384 с.

Жинкин Н.И. Язык - речь - творчество : избранные труды / Н.И. Жинкин. - Москва : Лабиринт, 1998. - 368 с.

Зенкин С.Н. Французский романтизм и идея культуры (аспекты проблемы) / С.Н. Зенкин. -Москва : РГГУ 2001. - С. 21-31.

Зимняя И.А. Лингвопсихология речевой деятельности / И.А. Зимняя. - Москва : Московский психолого-социальный институт ; Воронеж : МОДЭК, 2001. - 432 с.

Морозов В.П. Занимательная биоакустика / В.П. Морозов. - Москва : Знание, 1987. - 208 с.

Никольский А.А. Амплитудная модуляция звуковых сигналов млекопитающих / А.А. Никольский // Журнал общей биологии. - 2012. - Т. 73. - № 3. - С. 225-240.

Руссо Ж. Ж. Об общественном договоре. Трактаты / Ж.Ж. Руссо. - Москва : КАНОН-пресс, 1998. - 416 с.

Сорокин В.Н. Моторная теория восприятия речи и теория внутренней модели / В.Н. Сорокин // Информационные процессы. - 2007. - Т. 7. - № 1. - С. 1-12.

Степанов Ю.С. Основы общего языкознания : учеб. пособие / Ю.С. Степанов. - Москва : Просвещение, 1975.

Фабри К.ЭОсновы зоопсихологии : учебник для студентов высших учебных заведений / К.Э. Фабри. - М.: Российское психологическое общество, 1999. -464 с.

Фридман В.С. (Вольф Кицес) Концепты ситуаций и происхождение человеческого языка. Электронный ресурс. - Режим доступа : http://wolf-kitses.livejournal.com/17339.html  - дата обращения: 22.04.2014.

Цейтлин С.Н. Язык и ребенок. Лингвистика детской речи / С.Н. Цейтлин. - Москва : ВЛАДОС, 2000. - 240 с.

Чебоксаров Н. Н. Народы, расы, культуры / Н.Н. Чебоксаров, И.А. Чебоксарова. - Москва : Наука, 1971.

Animal language: пойми тех, кого любишь. - Электронный ресурс. - Режим доступа : http://animalang.biggo.ru/

Atal B.S., Chang J.J., Mathews M.V., Tukey J.W. Inversion of articulatory-to-acoustic transformation in the vocal tract by a computer sorting technique. - J. Acoust. Soc. Am., 1978. - vol. 63. - pp. 1535-1555.

Baboon_attacks_vet. - Электронный ресурс : Режим доступа http://www.youtube.com/watch?v=9PT_VFdXob0 - дата обращения: 22.04.2012.

Boer de B. Loss of air sacs improved hominin speech abilities // Journal of Human Evolution. - 2011. - №. 1-6. Электронный ресурс. Режим доступа : http://www.sciencedirect.com/science/article/pii/S0047248411002004

Deacon T.W. The Symbolic Species: The co-evolution of language and the brain. - Norton & Company, NY, London. - 1967. - 527 p.

Dittus W. Toque macaque food calls: semantic communication concerning food distribution in the environment // Anim. Behav. - 1984. - Vol. 32. - №2. Р. 470-477.

Gombe Chimpanzees : http://gombechimpanzees.org/activities/vocal-communication/ Food associated calls, Pant-grunts and pant-barks, http://www.discoverchimpanzees.org/media/sounds/tofu14.mov , Screams, whimpers and other calls - дата обращения: 22.04.2014.

Kelemen G. Anatomy of the larynx as a vocal organ: evolutionary aspects // Logos 4. -1961. -Р. 46-55.

Lenneberg E.H. Biological foundation of Language. With appendicies by N. Chomsky and Otto Max. - N.-Y., London, Sydney: J. Wiley & Sons, Inc., 1967. - 489 p.

MacLarnon, A., & Hewitt, G. The evolution of human speech: The role of enhanced breathing control //American Journal of Physical Anthropology. 1999. - 109. - Р. 341-363.

Sorokin V., Olshansky V., Kozhanov L. Internal model in articulatory control: Evidence from speaking without larynx. // Speech Communication. - 1998. v. 25. - № 3. - Р. 249-268.

Stunning Siamang Vocal Performance. - Электронный документ. - Режим доступа : http://www.youtube.com/watch?v=zORPtx6uyUA - дата обращения: 22.04.2014.


Для цитирования статьи:

Вартанов А.В., Терещенко Л.В., Латанов А.В., Бурлак С.А. Звуковой язык эмоций человека и обезьян. // Национальный психологический журнал. – 2014. – № 4(16). – С. 79-92.

Vartanov A.V., Tereshchenko L.V., Latanov A.V., Burlak S.A. (2014). Sound language of human and simian emotions. National psychological journal. 4 (16), 79-92.

О журнале Редакция Номера Авторы Для авторов Индексирование Контакты
Национальный психологический журнал, 2006 - 2017
CC BY-NC

Все права защищены. Использование графической и текстовой информации разрешается только с письменного согласия руководства МГУ имени М.В. Ломоносова.

Дизайн сайта | Веб-мастер