ISSN 2079-6617
eISSN 2309-9828
Звуковой язык эмоций человека и обезьян

Звуковой язык эмоций человека и обезьян

Скачать в формате PDF

Поступила: 20.03.2014

Принята к публикации: 12.04.2014

Дата публикации в журнале: 31.12.2014

Страницы: 79-92

DOI: 10.11621/npj.2014.0409

Ключевые слова: эмоции; обезьяны; речевой сигнал; антропоморфный метод

Доступно в on-line версии с: 31.12.2014

Для цитирования статьи:

Вартанов А.В., Терещенко Л. В., Латанов А. В., Бурлак С.А. Звуковой язык эмоций человека и обезьян. // Национальный психологический журнал 2014. № 4. c.79-92. doi: 10.11621/npj.2014.0409

Скопировано в буфер обмена

Скопировать
Номер 4, 2014

Вартанов Александр Валентинович Московский государственный университет имени М.В. Ломоносова

Терещенко Леонид Викторович Московский государственный университет имени М.В. Ломоносова

Латанов Александр Васильевич Московский государственный университет имени М.В. Ломоносова

Бурлак Светлана А. Московский государственный университет имени М.В. Ломоносова

Аннотация

С помощью формальных объективных методов анализа обнаружено принципиальное сходство звуковых сигналов обезьян разных видов: шимпанзе, макак- резусов, павианов, сиамангов (гиббонов) с проявлениями эмоций в речи человека.

Показано, что разработанная (на основе принципа относительного микроамплитудного кроссчастотного кодирования) система формальных параметров оценки эмоций в речи человека хорошо применима в качестве экспериментальной процедуры для объективной оценки и интерпретации (в соответствии с системой человеческих эмоций) звуковых сигналов обезьян. Это подтверждается обнаруженным соответствием формальных оценок с результатами наблюдений за поведением животных в разных ситуациях.

Предложенный антропоморфный метод анализа звуковых сигналов животных базируется на четырехмерной сферической модели эмоций человека и принципах кодирования информации в нервной системе. Предлагаемая модель может служить общей классификационной системой для эмоциональных явлений, объединяя физиологические представления о мозговых механизмах эмоциональной регуляции и известные психологические классификации, полученные на основе разных экспериментальных данных. Она количественно объясняет также все возможные нюансы и плавные взаимопереходы эмоций, представляя каждую конкретную эмоцию как линейную комбинацию выделенных основных психофизиологических параметров. Хорошее согласие параметров речевого сигнала не только человека, но и обезьян с параметрами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодирования информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработке технических систем, в частности, к методам обработки речевого сигнала. С другой стороны, обнаруженное совпадение подтверждает и выделенные ранее параметры психофизиологической модели, дополнительно обосновывая предпочтительность (по сравнению с другими, известными в литературе) именно такой системы классификации эмоций, как с точки зрения размерности, так и в отношении ориентации осей пространства модели.

В целом, полученные результаты свидетельствуют о древности эмоциональной системы регуляции и о том, что она сохранилась у человека в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи. Кроме того показано, что у большинства обследованных видов обезьян (шимпанзе, макака- резус и павиан) весь репертуар звуковых сигналов исчерпывается этой эмоциональной регуляцией. Однако обнаружено, что некоторые виды обезьян – сиаманги (гиббоны) способны усложнять репертуар своих звуковых сигналов и создавать дополнительные каналы звуковой сигнализации в относительно свободной частотной области, чтобы не мешать использованию общей с другими видами обезьян (и человека) эмоциональной системы сигнализации. По-видимому, эта дополнительная система изменения звукового сигнала основана на том же принципе кодирования, что и общая эмоциональная.

Звуковая коммуникация

Звук, звуковая волна имеет большое значение в эволюции жизни на земле, поскольку она служит самым «перспек­тивным» средством передачи информа­ции в мире живых существ, что доказывается фактом появления звуковой речи и сознания у человека. Несмотря на то, что животные не говорят между собой в нашем человеческом понимании, язык звуков - немаловажный и для них спо­соб общения. Сейчас уже никто не отри­цает, что звуковая коммуникация, наряду с другими каналами, широко распростра­нена в животном мире, а эмоциональные реакции, хотя бы простые, свойствен­ны не только человеку, но и большинст­ву животных, не говоря уже об обезьянах. Речь животных имеет свою эволюцию: исторически звук проделал путь от ин­струментального «механического» голо­са к «истинному» голосу, использующему воздушную струю. С помощью модуля­ций голоса (известны три основных вида модуляций - амплитудная, частотная и фазовая) животные могут вкладывать в издаваемые ими звуки разнообразную информацию и кодировать ее большой объем в коротких сигналах. Например, А.А. Никольский (2012) в звуковых сигна­лах млекопитающих обнаружил пять вариантов амплитудной модуляции: ее от­сутствие, непрерывную, фрагментарную, гетерогенную и многоуровневую. Одни и те же формы амплитудной модуляции могут встречаться параллельно в звуках, издаваемых представителями различных отрядов млекопитающих. И, напротив, различные ее формы обнаружены в сиг­налах, выполняющих одну и ту же фун­кцию.

Обстоятельные исследования акусти­ческой структуры обезьяньего языка, проведенные в лаборатории Г.В. Гершуни (Морозов, 1987), показали, что в обезья­ньем языке имеется много звуковых эле­ментов, сходных по звучанию с фонети­ческими элементами человеческой речи - гласными, согласными, слогами. Но са­мым интересным оказалось, что эмо­циональное значение голосовых звуков обезьян — угрозу, страх, радость, насто­роженность, гнев, удовольствие, жалобу и т.п. - слушатели-люди воспринимают совершенно адекватно, то есть правиль­но (с вероятностью до 95%) определяют то эмоциональное состояние, в котором находилось животное, издавая соответст­вующие звуки (Морозов, 1987). При этом у современных обезьян средства обще­ния, коммуникации отличаются не толь­ко своим многообразием, но и выражен­ной адресованностью и выполнением побуждающей функции, направленной на изменение поведения членов стада (Фабри, 1999). Эти звуки имеют опреде­ленный смысл, как показали исследова­ния Н.И. Жинкина звуковой коммуни­кации обезьян в Сухумском обезьяньем питомнике. Спрятавшись за большой камень в свободном вольере, Николай Иванович издавал похожие на «обезья­ний язык» звуки. Настороженное молча­ние обитателей вольера вскоре начинало прерываться ответными криками или же животные убегали. Эти реакции означа­ли, что издаваемый человеком звук понят, то есть коммуникация установлена (Зим­няя, 2001). Замечено также, что в некото­рых пределах эти звуки самодостаточ­ны и правильно воспринимаются даже в записи. Часто приводится такой при­мер наблюдения (Морозов, 1987). В яр­кий солнечный день стадо обезьян рез­вилось в заповеднике. Вдруг неожиданно набежала туча и пошел дождь. Обезьяны с криками скрылись под навесом. Звуки их голосов при этом были записаны на магнитофон. В другой такой же солнеч­ный день, когда дождя совсем не предви­делось, эти магнитофонные записи были воспроизведены резвящимся обезьянам. В результате обезьяны, услышав свои крики, устремились под навес. Но следу­ет ли из этого заключать, как Н.И. Моро­зов, что в «лексиконе» обезьяньего языка есть звуки, обозначающие «дождь» (Мо­розов, 1987)? Или это просто сигнал-пре­дупреждение, побуждающий прятаться? Н.И. Тих считает, что в отличие от чело­века, у обезьян коммуникативные средст­ва: звуки и телодвижения лишены семан­тической функции и поэтому не служат орудием мышления (Фабри, 1999). Ком­муникация у высших обезьян носит не­специфический характер - акустические сигналы неспецифичны, а ритуализи­рованные демонстрации редуцированы (Фридман, 2012). Пример неспецифиче­ской успешной коммуникации - это так называемый «пищевой крик» цейлонских макак (Macaca sinica). Эмоциональной ос­новой крика служит общее возбуждение, своего рода эйфория, стимулированная находками новых источников или ви­дов пищи. Доказательством неспецифич- ности сигнала служит тот факт, что ин­дивидуальные различия в реактивности макак существенно влияют на интенсив­ность звуковой активности и на частот­ные характеристики самих звуков. К тому же признаки сигнала не зависят от кон­кретных особенностей пищевых объек­тов, то есть пищевой сигнал макак лишен иконического смысла. Такой неспецифический пищевой крик, тем не менее, служит эффективным и надежным средством коммуникации. В адекватной ситу­ации крик зарегистрирован в 154 случа­ях из 169. Положительная реакция других особей на крик обнаружена в 135 случа­ях из 154. Члены стада, услышавшие крик, сбегаются на него с расстояния до 100 м (Dittus, 1984).

Таким образом, можно отметить большую выразительность и разнообра­зие звуковых средств общения обезьян (в частности, у всех узконосых обезьян звук играет важную роль в коммуникации) и сходство их звуков с эмоцио­нальными средствами коммуникации у человека. При этом все же остается проблема интерпретации звуковых сиг­налов животных - правильное распоз­навание их человеком базируется на его собственном «здравом смысле» и его же интерпретации ситуации (которое мо­жет и не совпадать с восприятием дан­ной ситуации животными). Но, что тог­да означает факт правильного и точного опознания человеком эмоций живот­ного по его крику? Может быть, только простое соответствие созданных им по своим понятиям классов криков и си­туаций (что тоже немаловажно), но во­все не соответствие эмоций, которые должны испытывать животные, тем эмо­циям, которые испытывал бы сам чело­век в этой ситуации. То есть, получается порочный круг, когда исходная аксио­ма - что человек способен классифи­цировать ситуации и соответствующие им звуки на основании собственных признаков, превращается в утвержде­ние - эти же признаки приписываются животным. Вопрос остается открытым, пока не будет разработан объективный метод сопоставления соответствующих звуковых сигналов и определения соот­ветствия качества эмоций человека этим звуковым сигналам. Только тогда можно будет по-настоящему доказать наличие сходства эмоциональных звуковых сиг­налов человека и животных и доказать предположение, выдвинутое еще Ч. Дар­вином (2001) о родстве эмоций челове­ка и обезьян.

Что касается речевых способностей ныне живущих видов обезьян, то прин­ципиальная невозможность обучения их членораздельному языку была неодно­кратно доказана (Фабри, 1999). Как же возникла речь у человека, если он про­изошел от общих с обезьянами предков? Что должно было измениться у человека, чтобы он приобрел способность к чле­нораздельной речи? Или что было утра­чено нынешними видами обезьян, из-за чего они утеряли такую возможность?

О специфике звукопроизводства обезьян и человека

По сравнению с человеком, у обезьян (в частности, у шимпанзе) слишком вы­соко расположена гортань (Жинкин, 1998; Lenneberg, 1967). Это очень удоб­но, поскольку позволяет есть и дышать практически одновременно. Низкое же положение гортани открывает возмож­ности для четкого произнесения звуков человеческого языка. У человеческих младенцев гортань, как и у шимпан­зе, расположена высоко (это позволяет одновременно сосать и дышать). При­мерно к трем годам гортань опускается и это приблизительно совпадает со вре­менем полного овладения звуковой стороной языка. Справедливости ради сле­дует сказать, что положение гортани не остается неизменным в течение жизни не только у человека: по данным группы японских ученых, некоторое опуска­ние гортани наблюдается и у шимпанзе (Бурлак, 2011). Относительно того, для чего нужно низкое положение гортани, существует несколько гипотез. Согла­сно одной, представляющейся наибо­лее правдоподобной, это необходимо именно для членораздельной звучащей речи, поскольку дает возможность язы­ку двигаться внутри речевого тракта, как в горизонтальной, так и в вертикальной плоскости. Что, в свою очередь, позволя­ет создавать различные конфигурации ротовой полости и глотки независимо и тем самым сильно расширяет набор возможных фонем, различающихся по тому, на каких частотах звук усилен, а на каких, наоборот, приглушен. Такое по­нижение гортани дает возможность из­давать более низкие звуки. Таким обра­зом, низкое положение гортани можно рассматривать как видовой признак - это одно из приспособлений для чле­нораздельной звучащей речи (Бурлак, 2011).

Кроме этих анатомических особенно­стей можно упомянуть (Барулин, 2012) об отсутствии у человека естественных диастем (промежутка между зубами, в ко­тором размещаются клыки, например, у шимпанзе), а так же об отличающей­ся от человеческой лицевой мускулатуре обезьян (Lenneberg, 1967) и о небольшом по сравнению с гейдельбергским челове­ком, палеоантропом и неоантропом ди­аметре позвоночного столба в грудном отделе, что свидетельствует об отсутст­вии способности к тонкому регулирова­нию потока воздуха, направляемого на голосовые связки, т.е. на отсутствие спе­циального, речевого режима дыхания у обезьян (MacLarnon, Hewitt, 1999). Немаловажным является и тот факт, что обезьяны с одинаковым комфортом из­влекают звук как на выдохе, так и на вдохе (Kelemen,1961; Lenneberg, 1967; Deacon, 1997), в то время как голосовая щель человека приспособлена к тому, чтобы управляемо работать только на выдохе (Lenneberg, 1967; Deacon, 1997). У некоторых видов приматов (в том чи­сле, у человека и шимпанзе) в дополне­ние к истинным голосовым складкам имеется пара ложных голосовых связок, развитых значительно слабее. При этом шимпанзе, в отличие от человека, может использовать при звукопроизводстве обе пары связок независимо, хотя их актива­ция требует большего давления воздуш­ной струи (Lenneberg, 1967). У человека ложные голосовые связки могут начать использоваться только после специ­альной программы тренировок, напри­мер, при горловом пении или в резуль­тате лечения у логопеда, когда выходят из строя истинные голосовые связки. У всех гоминоидов, кроме людей, име­ются так называемые горловые или гортанные мешки (de Boer, 2011), которые создают при производстве звука допол­нительный низкочастотный резонанс, из-за чего частоты оригинальных резо­нансов смещаются и сближаются, что негативно влияет на различимость зву­ков по тембру.

«Правильная» конструкция и функци­онирование моторного аппарата мо­жет иметь значение не только для про­изводства речи, но и для ее восприятия. Противоречие между наблюдаемым разнообразием акустических параметров и кажущейся устойчивостью восприя­тия фонетических элементов речи че­ловеком привели к формулировке раз­личных вариантов моторной теории восприятия речи (Сорокин, 2007). Пред­ставление о том, что при восприятии речи каким-то образом используется информация о свойствах речеобразования, опирается на способность челове­ка к обучению речи. Определенную роль сыграло и явление так называемой вну­тренней речи, т.е. наблюдающееся иног­да проговаривание «про себя» читаемо­го текста. Накапливались и наблюдения за компенсацией естественных и искус­ственных нарушений процесса образо­вания или восприятия речи. Неврологам и логопедам давно известно, что при парезе или параличе отдельных лице­вых или внутриротовых мышц разбор­чивость речи может и не пострадать. Например, при парезе мышц, управля­ющих движениями нижней челюсти, артикуляция губных звуков осуществ­ляется за счет большей амплитуды дви­жений губ. Начиная носить зубные про­тезы с искусственных твердым небом, в ряде случаев люди сохраняли разбор­чивость своей речи. Иногда больные с удаленной гортанью полностью вос­станавливали в своей речи не только различие между звонкими и глухими со­гласными, но и правильную фразовую интонацию (Sorokin et al., 1998) и даже могли петь. Имеются сведения о том, что замена удаленного языка пластиковым протезом позволила больному сохра­нить сравнительно разборчивую речь (Сорокин, 2007). Все эти факты говорят о широком диапазоне возможностей подстройки речевого аппарата и устой­чивости системы восприятия и поро­ждения речи в целом.

Предложенная В.Н. Сорокиным (2007) теория внутренней модели объе­диняет процессы образования и воспри­ятия речи и позволяет понять механизм вышеописанной устойчивости. Внутренняя модель является элементом си­стемы управления артикуляцией, обес­печивая текущий контроль и коррекцию артикуляции при различных наруше­ниях путем решения обратных задач: «проприоцепция - управление» и «аку­стика - управление». Для успешной де­ятельности внутренняя модель должна основываться на данных механики, аэ­родинамики, акустики речеобразования и фонетике языка. Было установлено, что при наличии акустической информации нет необходимости измерения всей формы речевого тракта, достаточ­но знания о положении губ, нижней че­люсти и передней части языка. Тем са­мым при решении задач коррекции артикуляции или компенсации наруше­ний ослабляются требования к точно­сти проприоцептивных сигналов. Это повышает вероятность того, что систе­ма управления артикуляцией способна решать обратные задачи с целью контр­оля качества генерируемого речевого сигнала и соответствия его установившимся фонетическим нормам в данном языке (Сорокин, 2007). С помощью вычислительного эксперимента было так­же показано, что форма речевого трак­та, выявленная посредством решения обратной задачи с использованием одновременно и акустических и артикуляторных данных, хорошо совпадает с результатами, полученными на осно­ве одних только акустических параме­тров. Это означает, что такая организация восприятия и порождения реальной речи вполне возможна. В процессе этих исследований было также установлено, что для успешного решения обратной задачи можно использовать не только формальные процедуры, но и так называемую «кодовую книгу» (Atal et al. 1978). Ее идея состоит в предварительном вы­числении набора соответствий меж­ду заданными векторами артикулятор­ных параметров и соответствующими им векторами акустических параметров. Можно предположить, что, начиная с пе­риода детского лепета, внутренняя мо­дель, пользуясь методом проб и ошибок, отслеживает процесс изменения ана­томических размеров речевого тракта и соответствующим образом корректи­рует содержание «кодовой книги». Примеры восстановления голосового источника после удаления гортани указывают также на удивительную пластичность системы управления речеобразованием, способной не только отслеживать воз­растные изменения параметров рече­вого тракта, но и менять саму структуру внутренней модели. При этом роль суррогатного голосового источника при­нимает на себя сфинктер, образованный пищеводом и мышцами-сжимателями глотки, которым и передаются тонкие функции мышц удаленной гортани (Со­рокин, 2007). Все это говорит в пользу того, что «функция», т.е. необходимость говорить, в значительной степени определяет и «структуру» - способ управле­ния речедвигательным аппаратом. Поэ­тому, аргумент об отсутствии у обезьян и до какого-то момента у наших предков хорошо приспособленного к речи го­лосового аппарата, как причины отсут­ствия у них речи, не корректен. Скорее наоборот, отсутствие необходимости речи («функции») не приводит к изменениям структуры. По-видимому, речь могла начать формироваться раньше, чем произошли анатомические измене­ния, которые ныне хорошо заметны при сопоставлении человека с не говорящи­ми обезьянами, и которые являются уже результатом (и показателем) развития речи, а не условием ее становления.

Эмоции и происхождение языка

Нынешний человек и нынешние обезьяны различаются и строением ре­чевого аппарата, и возможностями зву­ковой коммуникации. Но каким был язык, речь человека, когда человек толь­ко начал выделятся из мира животных? Чем различаются и чем сходны звуки, издаваемые в различных ситуациях сов­ременными животными, хотя бы теми, что генетически ближе всего к челове­ку – обезьянами, от звуков человеческой речи? Вопрос о происхождении языка занимал многих выдающихся мыслите­лей, но ставился и решался весьма раз­лично. Среди множества теорий мож­но упомянуть теорию эмоционального происхождения языка и развивающую ее теорию междометий. Родоначальни­ком этой теории был Жан Жак Руссо (1712-1778). В своем трактате по пово­ду происхождения языков Руссо (1998) писал, что первый язык человека, наиболее всеобщий, наиболее выразительный и единственный язык – это крик самой природы. Так как этот крик исторгался у человека лишь силою некоторого рода инстинкта в случаях настоятельной не­обходимости, чтобы умолять о помощи при большой опасности или при тяж­ких страданиях, то им редко пользова­лись в повседневной жизни, где царят чувства более умеренные. Когда пред­ставления человека стали расширяться и усложняться, когда между людьми установилось более тесное общение, они постарались найти знаки более многочисленные и язык более развитый. Они увеличили число изменений голоса и присоединили к ним жесты, которые по природе своей более выразитель­ны, и смысл которых менее зависит от предварительного условия (Руссо, 1998). Эмоциональная теория Руссо получи­ла развитие и стала называться теорией междометий. Один из защитников этой теории русский лингвист Д.Н. Кудрявс­кий (1867-1920) считал, что междоме­тия были своеобразными первыми сло­вами человека. Междометия являлись наиболее эмоциональными словами, в которые первобытный человек вкла­дывал различные значения в зависи­мости от той или иной ситуации (Сте­панов, 1975). По мнению Кудрявского, в междометиях звук и значения еще были соединены неразрывно. Впослед­ствии, по мере превращения междоме­тий в слова, звук и значения разошлись, причем этот переход междометий в сло­ва и был связан с возникновением чле­нораздельной речи (Степанов, 1975).

Однако язык эмоций современных животных, в том числе обезьян, и, по-видимому, предков человека, вполне до­статочен, чтобы они могли решать все свои проблемы взаимодействия в группе, в том числе и повседневного, не тре­бующего крайнего напряжения. Остав­ляя вопрос о причинах или движущих силах эволюции языка, приведших к по­явлению человеческой речи, вернемся к вопросу средств и «технической» базы развития звуковой речи. Сохранилась ли у человека первобытная система зву­ковой эмоциональной коммуникации в неприкосновенности, продолжая со­существовать в качестве системы выра­жения чувств, параллельно с возникшей независимо звуковой системой члено­раздельной речи? В звучащей нормаль­ной речи современных людей эмоцио­нальная составляющая вполне хорошо заметна. Благодаря ей бывает можно по­нять, является ли говорящий радостным или огорченным, разгневанным, испуганным, удивленным и т.д. Эта составля­ющая может быть выделена даже тогда, когда слова разобрать по тем или иным причинам невозможно. Отличить прось­бу от утвердительного ответа или отказа несложно при прослушивании магнито­фонных записей «высказываний», произнесенных детьми, которые еще не ов­ладели словами (Цейтлин, 2000). Как же эта эмоциональная составляющая взаи­модействует со звуковой системой чле­нораздельной речи? Может быть в ходе развития языка она трансформирова­лась таким образом, что новая система членораздельной речи использовала, хотя бы частично, ее средства и «поте­снила» ее в звуковом сигнале? Если эмо­циональная звуковая система человека является общим наследием его предков и ныне живущих родственных видов обезьян, то она должна быть так схожа у них, как и у разных видов современных обезьян между собой. Если же развитие человеческого языка пошло по пути ре­дукции эмоциональной составляющей и развития членораздельной речи на ее основе, то можно ожидать существенно­го различия этих сигналов.

Задачей данного исследования было – формально сопоставить структуру голо­совых сигналов обезьян и эмоциональ­ных сигналов человека.

Подход к экспериментальному исследованию

Возможность такого сопоставления предоставляет недавно разработанный новый метод автоматического распоз­навания эмоций человека по речевому сигналу (Вартанов, 2013). Предложен­ный метод базируется на четырехмер­ной сферической модели эмоций и принципах кодирования информации в нервной системе (Виденеева, Хлудо­ва, Вартанов, 2000; Вартанов, Виденее­ва, 2001; Вартанов, Вартанова, 2003; Вар­танов, Вартанова, 2005; Вартанов, 2011). Четыре оси пространства эмоций были выделены на основе психофизических экспериментов и получили интерпре­тацию как определенные нейронные (мозговые) механизмы эмоций, а угло­вые характеристики - как субъектив­ные качества эмоций. Первые две евкли­довы оси пространства модели связаны с оценкой ситуации: ось 1 - по знаку (хорошо, полезно, приятно или плохо, вредно, неприятно), ось 2 - по степени информационной определенности (уве­ренность - удивление). Система третьей и четвертой осей связана с побуждени­ем: ось 3 - притяжение, ось 4 - отвер­жение (оборонительная реакция) актив­ное (агрессия) или пассивное избегание (страх, затаивание). Предлагаемая че­тырехмерная сферическая модель мо­жет служить общей классификационной системой для эмоциональных явлений, объединяя как физиологические пред­ставления о мозговых механизмах эмо­циональной регуляции, так и известные психологические классификации, полу­ченные на основе разных эксперимен­тальных данных. Она количественно объясняет также все возможные нюан­сы и плавные взаимопереходы эмоций, представляя каждую конкретную эмо­цию как линейную комбинацию основ­ных выделенных психофизиологиче­ских параметров.

В результате экспериментальной про­верки предложенного принципа отно­сительного кросс-частотного амплитуд­но-вариабельного кодирования эмоций человека в речевом сигнале были выде­лены параметры звукового сигнала, хо­рошо соответствующие модели эмоций (Вартанов, 2013). Применение этого же метода к образцам звуковых сигналов обезьян позволяет формально количе­ственно описать характер этих сигналов и сопоставить их с эмоциональным ком­понентом речевой продукции человека.

Методика

Материал

Были проанализированы четыре группы данных:

  1. Специально записанные кри­ки макак-резусов в различных условиях, документированных и интерпретированных опытными зоо­логами биологического факультета МГУ им. М. В. Ломоносова. Всего 151 файл, длительностью в среднем 1.308 сек (стандартное отклонение 1.5 сек). Каж­дый файл соответствует определенной ситуации из следующих возможных:
    • Экспериментатор входит в помеще­ние с обезьянами и начинает запись;
    • Экспериментатор раздает еду обезьянам;
    • Экспериментатор дразнит обезьян палкой (демонстрирует палку вбли­зи клетки с обезьяной; обезьяна проявляет смешанную реакцию: компоненты защитного поведения чередуются с агрессивными в зави­симости от характера обезьяны);
    • Экспериментатор дразнит обезьян рукой (производит резкие выпады рукой в сторону обезьяны);
    • Экспериментатор дразнит обезьян водой (пускает из спринцовки тон­кую струю воды в клетку);
    • Экспериментатор высаживает одну из обезьян из ее клетки в клетку-пе­реноску (тем самым вносит элемент новизны, радикально меняя при­вычную для обезьян обстановку);
    • Экспериментатор подносит клет­ку-переноску с обезьяной по оче­реди близко к каждой из остальных обезьян, тем самым предоставляя им возможность тесного визуального, но не физического контакта «лицо к лицу» так, как обычно обезьяны друг друга практически не видят;
    • Экспериментатор меняет лицо - надевает карнавальную маску (в от­личие от простой демонстрации маски, маска, надетая на лицо, вызывает сильную характерную за­щитную реакцию);
    • Экспериментатор издает звуки по­хожие на крики обезьян (тоже эле­мент новизны для животных);
    • Экспериментатор производит ма­нипуляции с пустой обезьяньей клеткой.
  2. Крики сиаманга (гиббона). Исполь­зовались видеофайлы, найденные в интернете (Stunning Siamang Vocal Performance). Всего 19 файлов сред­ней длительностью 9.81 сек (стандар­тное отклонение 5.66 сек). Длинные файлы разрезались на куски по 2 секунды каждый.
  3. Крики шимпанзе, собранные, проана­лизированные и рассортированные Michael L. Wilson в Kanyawara community of Kibale National Park, Uganda (исполь­зованы фрагменты из видео- и аудио­файлов с сайта Gombe Chimpanzees). Всего 14 файлов средней длительно­стью 2.37сек (стандартное отклонение 1.37 сек), рассортированных на сайте по разделам: Food_associated_calls, Pant- grunts_pant-barks, Pant-hoots, Screams_ whimpers.
  4. Крики павиана с единственным сюже­том отлова обезьяны в вольере ветеринаром (Baboon_attacks_vet). Всего 5 файлов средней длительностью 9.57 сек и (стандартное отклонение 5.52 сек). Файлы порезаны на фрагменты по 2 секунды.

Процедура анализа

Показатель вычислялся посредством следующего алгоритма:

  1. Для звукового фрагмента с помощью стандартных средств - быстрое пре­образование Фурье со сглаживанием в минимальном скользящем окне - вычислялась последовательность мгновенных спектров мощности сиг­нала (в диапазон от 0 до 4000 Гц с раз­решением 50 Гц).
  2. На основе последовательности мгно­венных спектров в скользящем окне (размером 20 мс и шагом сдвига 10 мс) вычислялся показатель микро­вариативности (стандартное отклонение) амплитуды (квадратного корня от мощности) на каждой частоте, ко­торый нормировался по частотному диапазону.
  3. Для вычисления интегральной оценки всего звукового образца использовалось простое усреднение предыдущего показателя по всему интервалу звучания и получение одного вектора (по часто­те) для каждого звукового образца.

Полученный массив данных в каждой группе был дополнен четырьмя вектора­ми, выраженными в том же частотном диапазоне, которые соответствовали вы­деленным ранее (Вартанов, 2013) четырем эмоциональным параметрам речи человека. Это давало возможность пря­мого количественного сопоставления получаемых спектральных характери­стик. Далее массив данных подвергался факторному анализу.

Условия и параметры наблюдения за обезьянами макака-резус

Обстановка:

В комнате в изолированных клет­ках в условиях отсутствия физическо­го контакта и затрудненной зрительной коммуникации находятся пять обезьян. Одна из них явный лидер (доминант), четыре остальные - субдоминанты. Ранговость между субдоминантами не ясна. Вероятно, один из них является субдоминантом низшей ступени.

Для каждого файла записи звуков ука­зывалось количество криков в записи, для каждого крика (по порядковой ну­мерации в каждой записи) отмечена его вероятная функциональная роль, статус обезьяны, которая его производит и ве­роятная причинная связь с предыдущи­ми криками в записи (если есть).

Были приняты обозначения и выде­лялись в записи следующие варианты функциональной роли криков обезьян:

  1. «Приветствие» - крик, явно адресо­ванный экспериментатору.
  2. «Просительный/подчиненный» - крик, выражающий явную степень подчине­ния (зависимости?). Свойственен фак­тически только одной обезьяне с са­мым низшим статусом.
  3. «Пищевой/получение пищи» - выра­жение удовлетворения при получении обезьяной пищи.
  4. «Испуг/агрессия» - смешанная реак­ция одновременного выражения ис­пуга и попытки напугать атакующего. Как правило, возникает, когда дей­ствие направлено непосредственно против этой обезьяны.
  5. «Агрессия» - выражение чистой аг­рессии, когда обезьяне ничего не уг­рожает. Как правило, возникает, ког­да объектом агрессии является другая обезьяна.
  6. «Испуг» - выражение чистого испуга. Как правило, возникает у субдоминант низших статусов.
  7. «Коммуникация» - все остальные кри­ки без явной причины в окружаю­щей обезьяну обстановке, роль кото­рых трудно установить. Несомненна их коммуникативная роль в ситуации, когда одна обезьяна таким криком пы­тается установить звуковой контакт, а другая (-ие) подтверждают его и воз­никает «перекличка». В остальных слу­чаях роль таких звуков неясна.

Результаты

В результате анализа полученных массивов данных была оценена размер­ность факторного пространства (рис. 1). Размерность всего многообразия зву­ковых сигналов (пересчитанных по вышеописанному алгоритму в частотном диапазоне от 50 до 4000 Гц) оказалась равной четырем почти для всех обезьян: макак-резус (89.90844% от всей диспер­сии), шимпанзе (91.73380% от всей ди­сперсии) и павианов (96.99263% от всей дисперсии). Для сиаманга (гиббо­на) четыре фактора определили толь­ко (84.25218% от всей дисперсии) и по графику распределения собственных значений (рис. 1) видно, что необходи­мо выделить еще два фактора, т.е. всего 6 факторов, которые будут описывать уже 91.29132% от всей дисперсии.


Рис. 1. График распределения собственных значений для исследованных звуковых сигналов по группам обезьян.

Полученные факторы для каждого набора данных вращались методом «Ва- римакс» с нормализацией для достиже­ния «простой структуры». Оказалось, что в результате первые 4 фактора всех обезьян (включая гиббонов) полностью совпали с аналогичными факторами, выделенными в эмоциях человека. По­лученные факторные нагрузки в спек­тральном выражении представлены на рис. 2.

Рис. 2. Спектральная характеристика (факторные нагрузки) четырех выделенных факторов по всем исследованным видам обезьян (обозначены соответствующими маркерами) в сопоставлении с эмоциональными параметрами речи человека (обозначены сплошной линией).

Как видно на этом рисунке, все четы­ре выделенных фактора для всех обсле­дованных видов обезьян очень хорошо соответствуют выделенным эмоциональ­ным параметрам в речи человека. Эти параметры занимают весь обследован­ный частотный диапазон, хотя в низко­частотной области (до 750 Гц) выражены только 3 и 4 факторы и то в противофа- зе, как бы компенсируя друг друга, ста­новясь взаимозависимыми. Это с точки зрения кодирования сигнала свидетельствует о несущественности данной обла­сти для распознавания эмоционального качества по этим двум показателям. До­полнительные два фактора «песни» гиб­бона, напротив, занимают низкочастот­ный диапазон, имея там два разнесенных максимума, тогда как в высокочастотной области (после 750 Гц) переходят в противофазу, т.е. компенсируют друг дру­га, освобождая место для оценки сигнала по первым четырем эмоциональным параметрам. По-видимому, это может говорить либо о более «тонком» пони­мании и выражении эмоций гиббона­ми по сравнению с другими обезьянами и человеком, либо о том, что при полной сохранности эмоциональной системы, общей для всех обследованных обезьян и человека, формируется еще один канал звуковой сигнализации, обслуживающей какие-то дополнительные потребности животных данного вида. Полное же отсутствие в исследованных звуковых сиг­налах других обезьян дополнительных факторов свидетельствует об ограни­ченности их системы звуковой сигнали­зации только областью эмоционального реагирования.

Характеристика выделенных параме­тров звуковых сигналов обезьян в со­поставлении с аналогичными параме­трами речевых сигналов человека была верифицирована по дополнительным данным с учетом возможности вычи­сления значения факторов и сопостав­ления проявлений соответствующих им эмоций в конкретных ситуациях. При этом (в соответствии с моделью эмоций) полученные значения факторов нормировались путем вычисления евк­лидового расстояния соответствующих четырехмерных векторов и деления ка­ждой координаты вектора на это число. В таблице 1 представлены результаты формального сопоставления значений четырех параметров эмоционального речевого сигнала человека в системе че­тырех факторов, соответствующих ка­ждому виду обезьян.

 

Human Factor 1

Human Factor 2

Human Factor 3

Human Factor 4

Chimpanzee Factor 1

0.9971

-0.0599

-0.1315

-0.0737

Chimpanzee Factor 2

-0.0056

0.9976

-0.1091

-0.0125

Chimpanzee Factor 3

0.0746

0.0343

0.9853

-0.0215

Chimpanzee Factor 4

-0.0111

-0.0074

0.0004

0.9970

Baboon Factor 1

0.9845

-0.0493

-0.1798

-0.0841

Baboon Factor 2

0.0088

0.9971

-0.0388

0.0351

Baboon Factor 3

0.1746

-0.0172

0.9341

0.2783

Baboon Factor 4

0.0149

-0.0555

-0.3058

0.9561

Macaca-Rh Factor 1

0.9851

-0.0937

-0.0453

-0.1660

Macaca-Rh Factor 2

-0.0300

0.9799

-0.1466

-0.1292

Macaca-Rh Factor 3

0.0834

0.1704

0.9880

0.1070

Macaca-Rh Factor 4

-0.1477

0.0450

-0.0167

0.9718

Gibbon Factor 1

0.9998

-0.0282

-0.0672

-0.1544

Gibbon Factor 2

0.0204

0.9898

0.0033

0.1681

Gibbon Factor 3

0.0061

-0.0472

0.8881

0.0203

Gibbon Factor 4

0.0031

-0.1314

-0.4547

0.9734

Таблица 1. Соотношение факторов эмоциональной речи человека и звуковых сигналов обезьян.

Проверка содержательной интерпре­тации выделенных факторов возможна также по соответствию формального описания звукового сигнала и содержа­ния ситуации, в которой издавался соответствующий звуковой сигнал. Так, для макак-резусов ситуации, в которых они издавали соответствующие звуки, были описаны и классифицированы. На рис. 3 представлены некоторые данные, иллю­стрирующие такое соответствие. Анало­гичные данные для шимпанзе приведе­ны на рис. 4.







Рис. 3. Характеристика ситуаций, в которых обезьяны макака-резус издавали крики, формально охарактеризованные в системе четырех факторов, соответствующих эмоциональным параметрам человека.


Рис. 4. Распределение формальных оценок звуковых сигналов шимпанзе в системе выделенных четырех факторов, которые соответствуют параметрам эмоций человека, в различных ситуациях, обозначенных внизу (типы ситуаций разделены на графике вертикальными линиями).

Развитие ситуации записи при отло­ве павиана в вольере ветеринаром (с пе­риодическими актами агрессии обезья­ны и ее бегства), когда в конце она была поймана и зафиксирована усилиями нескольких человек, сопровождалось ха­рактерными криками обезьяны. На рис. 5 представлена формальная характери­стика этих криков (запись фрагменти­рована по 2 сек), сделанная в соответствии с эмоциональными параметрами человеческой речи.


Рис. 5. Распределение по времени (2 сек фрагменты) формальных оценок звуковых сигналов павиана в системе выделенных четырех факторов, которые соответствуют параметрам эмоций человека.

Полученные данные свидетельству­ют о принципиальном сходстве звуко­вых сигналов всех обследованных видов обезьян и эмоциональной составляю­щей речи человека. Их интерпретация подтверждена не только прямым сопо­ставлением параметров сигналов, но и результатами наблюдений за пове­дением обезьян и ситуациями употре­бления ими соответствующих звуковых сигналов. При этом все разнообразие звуковых сигналов большинства обсле­дованных видов обезьян практически полностью исчерпывается этим видом сигнализации. Также обнаружено, что некоторые виды обезьян – сиаманги (гиббоны) способны усложнять репер­туар своих звуковых сигналов и созда­вать дополнительные каналы звуковой сигнализации в относительно свобод­ной частотной области, чтобы не ме­шать использованию общей с другими видами обезьян (и человека) эмоцио­нальной системы сигнализации.

Обсуждение

Полученные результаты позволяют вернуться к вопросам, поставленным во введении. Итак, обнаружено, что пер­вобытная система звуковой эмоцио­нальной коммуникации, наблюдаемая у современных обезьян и, по-видимому, характерная также для предков челове­ка, сохранилась в неприкосновенности и у сегодняшнего человека, продолжая сосуществовать в качестве системы вы­ражения чувств, параллельной с возник­шей независимо (Бурлак, 2011) звуковой системой членораздельной речи. Оказа­лось, что у сиамангов (гиббонов) тоже произошло усложнение репертуара зву­ковых сигналов, причем старая система не пострадала. Дополнительная система в ходе развития заняла свободную ча­стотную «нишу», чтобы не «потеснить» старую в звуковом сигнале. Совпадение факторных характеристик вокализации макак, павианов, шимпанзе и человека показывает, что данное усложнение яв­ляется инновацией, которая произошла в эволюционной линии, ведущей к гиб­бонам (после их отделения от прочих человекообразных обезьян). В дальней­ших исследованиях можно проверить, существует ли такая же система звуковой сигнализации у других видов животных.

В целом, полученные результаты о сходстве кодирования эмоций челове­ка и обезьян хорошо согласуются с из­вестными фактами (Жинкин, 1998; Зим­няя, 2001) о том, что эмоциональное значение голосовых звуков обезьян лю­ди-слушатели воспринимают совершен­но адекватно, то есть правильно опре­деляют то эмоциональное состояние, в котором находилось животное, издавая соответствующие звуки. Эти ре­зультаты подтверждают также правоту Ч. Дарвина, писавшего об общности го­лосовых средств выражения эмоций у человека и высших животных.

Полученное хорошее согласие па­раметров речевого сигнала не толь­ко человека, но и обезьян с параме­трами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодиро­вания информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработ­ке технических систем, в частности методов обработки речевого сигнала. С другой стороны, обнаруженное сов­падение подтверждает и выделен­ные ранее параметры психофизио­логической модели, дополнительно обосновывая предпочтительность (по сравнению с другими известными в ли­тературе) именно такой системы клас­сификации эмоций, как с точки зрения размерности, так и в отношении ориен­тации осей пространства модели.

В то же время, необходимо отметить, что выделенная система звукового ко­дирования эмоций основана на относи­тельной амплитудной микромодуляции сигнала в четырех разных частотных областях. Интересен вопрос о развитии членораздельной речи человека – поя­вилась ли эта способность на базе тако­го же принципа кодирования, как у сиа­манга (гиббона), или же для нее возник другой способ кодирования (возможно частотный или фазовый)? Все это требу­ет продолжения исследований звуковых сигналов животных и человека.

Выводы:

  1. С помощью формальных объектив­ных методов анализа показано прин­ципиальное сходство звуковых сигна­лов обезьян разных видов: шимпанзе, макак-резусов, павианов и сиамангов (гиббонов) с проявлениями эмоций в речи человека. Это свидетельствует о древности эмоциональной системы регуляции и о том, что она сохрани­лась у человека в неприкосновенно­сти, продолжая сосуществовать в ка­честве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи.
  2. Разработанная (на основе принципа относительного микроамплитудного кросс-частотного кодирования) си­стема формальных параметров оцен­ки эмоций в речи человека хорошо применима в качестве эксперимен­тальной процедуры для объективной оценки и интерпретации (в соответ­ствии с системой человеческих эмо­ций) звуковых сигналов обезьян. Это подтверждается обнаруженным соот­ветствием формальных оценок с результатами наблюдений за поведени­ем животных в разных ситуациях.
  3. Показано, что для большинства об­следованных видов обезьян (шим­панзе, макак-резусов и павианов) весь репертуар звуковых сигналов исчерпывается одним видом эмоци­ональной регуляции, но существуют виды - сиаманг (гиббон), у которых система голосовых сигналов получи­ла развитие, в частности, появилась дополнительная система изменения звукового сигнала, основанная на том же принципе кодирования, что и общая эмоциональная.

Литература.

Барулин А.Н. Семиотический рубикон в глоттогенезе / А.Н. Барулин // Вопросы языкового родства. - 2012. - № 8. - С. 33-74.

Бурлак С.А. Происхождение языка: Факты, исследования, гипотезы / С.А. Бурлак. - Москва: Астрель : CORPUS, 2011. - 464 с.

Вартанов А.В. Антропоморфный метод распознавания эмоций в звучащей речи / А.В. Вартанов // Национальный психологический журнал. - 2013. - № 2.

Вартанов А.В. Механизмы семантики: человек - нейрон - модель / А.В. Вартанов // Нейрокомпьютеры: разработка, применение. - 2011. -№ 12. - С. 54-64.

Вартанов А.В. Что такое эмоции? 4-х мерная сферическая модель аспектов переживания, выражения, восприятия и обозначения эмоций. // А.В. Вартанов, И.И. Вартанова // Культурно исторический подход и проблема творчества: Материалы вторых чтений памяти Л.С. Выготского / под ред. Е.Е. Кравцовой, В.Ф. Спиридонова, Ю.Е. Кравченко. - Москва, 2003. - С. 13-29.

Вартанов А.В. Эмоции, мотивация, потребность в филогенезе психики и мозга/ А.В. Вартанов, И.И. Вартанова // Вестник Московского Университета. Сер. 14 «Психология». - 2005. - № 3 - С. 20-35.

Вартанов А.ВЧетырехмерная сферическая модель эмоций и дистанционный речевой контроль состояния человека / А.В. Вартанов, Н.М. Видинеева // Тезисы докладов рабочей группы «Влияние информационных технологий на национальную безопасность» 4-й Ежегодной Конференции Консорциума ПРМ «Построение стратегического сообщества через образование и науку». Москва, 25-27 июня 2001 г. - Москва, 2001. - 35 с.

Виденеева Н.М. Эмоциональные характеристики звучащего слова / Н.М. Видинеева, О.О. Хлудова, А.В. Вартанов // Журнал высшей нервной деятельности. - 2000. - Т. 50. - Вып. 1. - С. 29-43.

Дарвин Ч. ОВыражении эмоций у человека и животных / Ч. Дарвин. - Санкт-Петербург : Питер, 2001. - 384 с.

Жинкин Н.И. Язык - речь - творчество : избранные труды / Н.И. Жинкин. - Москва : Лабиринт, 1998. - 368 с.

Зенкин С.Н. Французский романтизм и идея культуры (аспекты проблемы) / С.Н. Зенкин. -Москва : РГГУ 2001. - С. 21-31.

Зимняя И.А. Лингвопсихология речевой деятельности / И.А. Зимняя. - Москва : Московский психолого-социальный институт ; Воронеж : МОДЭК, 2001. - 432 с.

Морозов В.П. Занимательная биоакустика / В.П. Морозов. - Москва : Знание, 1987. - 208 с.

Никольский А.А. Амплитудная модуляция звуковых сигналов млекопитающих / А.А. Никольский // Журнал общей биологии. - 2012. - Т. 73. - № 3. - С. 225-240.

Руссо Ж. Ж. Об общественном договоре. Трактаты / Ж.Ж. Руссо. - Москва : КАНОН-пресс, 1998. - 416 с.

Сорокин В.Н. Моторная теория восприятия речи и теория внутренней модели / В.Н. Сорокин // Информационные процессы. - 2007. - Т. 7. - № 1. - С. 1-12.

Степанов Ю.С. Основы общего языкознания : учеб. пособие / Ю.С. Степанов. - Москва : Просвещение, 1975.

Фабри К.ЭОсновы зоопсихологии : учебник для студентов высших учебных заведений / К.Э. Фабри. - М.: Российское психологическое общество, 1999. -464 с.

Фридман В.С. (Вольф Кицес) Концепты ситуаций и происхождение человеческого языка. Электронный ресурс. - Режим доступа : http://wolf-kitses.livejournal.com/17339.html  - дата обращения: 22.04.2014.

Цейтлин С.Н. Язык и ребенок. Лингвистика детской речи / С.Н. Цейтлин. - Москва : ВЛАДОС, 2000. - 240 с.

Чебоксаров Н. Н. Народы, расы, культуры / Н.Н. Чебоксаров, И.А. Чебоксарова. - Москва : Наука, 1971.

Animal language: пойми тех, кого любишь. - Электронный ресурс. - Режим доступа : http://animalang.biggo.ru/

Atal B.S., Chang J.J., Mathews M.V., Tukey J.W. Inversion of articulatory-to-acoustic transformation in the vocal tract by a computer sorting technique. - J. Acoust. Soc. Am., 1978. - vol. 63. - pp. 1535-1555.

Baboon_attacks_vet. - Электронный ресурс : Режим доступа http://www.youtube.com/watch?v=9PT_VFdXob0 - дата обращения: 22.04.2012.

Boer de B. Loss of air sacs improved hominin speech abilities // Journal of Human Evolution. - 2011. - №. 1-6. Электронный ресурс. Режим доступа : http://www.sciencedirect.com/science/article/pii/S0047248411002004

Deacon T.W. The Symbolic Species: The co-evolution of language and the brain. - Norton & Company, NY, London. - 1967. - 527 p.

Dittus W. Toque macaque food calls: semantic communication concerning food distribution in the environment // Anim. Behav. - 1984. - Vol. 32. - №2. Р. 470-477.

Gombe Chimpanzees : http://gombechimpanzees.org/activities/vocal-communication/ Food associated calls, Pant-grunts and pant-barks, http://www.discoverchimpanzees.org/media/sounds/tofu14.mov , Screams, whimpers and other calls - дата обращения: 22.04.2014.

Kelemen G. Anatomy of the larynx as a vocal organ: evolutionary aspects // Logos 4. -1961. -Р. 46-55.

Lenneberg E.H. Biological foundation of Language. With appendicies by N. Chomsky and Otto Max. - N.-Y., London, Sydney: J. Wiley & Sons, Inc., 1967. - 489 p.

MacLarnon, A., & Hewitt, G. The evolution of human speech: The role of enhanced breathing control //American Journal of Physical Anthropology. 1999. - 109. - Р. 341-363.

Sorokin V., Olshansky V., Kozhanov L. Internal model in articulatory control: Evidence from speaking without larynx. // Speech Communication. - 1998. v. 25. - № 3. - Р. 249-268.

Stunning Siamang Vocal Performance. - Электронный документ. - Режим доступа : http://www.youtube.com/watch?v=zORPtx6uyUA - дата обращения: 22.04.2014.


Для цитирования статьи:

Вартанов А.В., Терещенко Л. В., Латанов А. В., Бурлак С.А.Звуковой язык эмоций человека и обезьян. // Национальный психологический журнал. 2014. № 4. c.79-92. doi: 10.11621/npj.2014.0409

Скопировано в буфер обмена

Скопировать