Звуковой язык эмоций человека и обезьян

Скачать в формате PDF

Поступила: 20.03.2014

Принята к публикации: 12.04.2014

Дата публикации в журнале: 31.12.2014

Страницы: 79-92

DOI: 10.11621/npj.2014.0409

Ключевые слова: эмоции; обезьяны; речевой сигнал; антропоморфный метод

Доступно в on-line версии с: 31.12.2014

Для цитирования статьи:

Вартанов, А.В., Терещенко Л. В., Латанов А. В., Бурлак С.А. (2014). Звуковой язык эмоций человека и обезьян. Национальный психологический журнал, (4) , 79-92. https://doi.org/10.11621/npj.2014.0409

Скопировано в буфер обмена

Скопировать

Вартанов Александр Валентинович Московский государственный университет имени М.В. Ломоносова

Терещенко Леонид Викторович Московский государственный университет имени М.В. Ломоносова

Латанов Александр Васильевич Московский государственный университет имени М.В. Ломоносова

Бурлак Светлана А. Московский государственный университет имени М.В. Ломоносова

Аннотация

С помощью формальных объективных методов анализа обнаружено принципиальное сходство звуковых сигналов обезьян разных видов: шимпанзе, макак- резусов, павианов, сиамангов (гиббонов) с проявлениями эмоций в речи человека.

Показано, что разработанная (на основе принципа относительного микроамплитудного кроссчастотного кодирования) система формальных параметров оценки эмоций в речи человека хорошо применима в качестве экспериментальной процедуры для объективной оценки и интерпретации (в соответствии с системой человеческих эмоций) звуковых сигналов обезьян. Это подтверждается обнаруженным соответствием формальных оценок с результатами наблюдений за поведением животных в разных ситуациях.

Предложенный антропоморфный метод анализа звуковых сигналов животных базируется на четырехмерной сферической модели эмоций человека и принципах кодирования информации в нервной системе. Предлагаемая модель может служить общей классификационной системой для эмоциональных явлений, объединяя физиологические представления о мозговых механизмах эмоциональной регуляции и известные психологические классификации, полученные на основе разных экспериментальных данных. Она количественно объясняет также все возможные нюансы и плавные взаимопереходы эмоций, представляя каждую конкретную эмоцию как линейную комбинацию выделенных основных психофизиологических параметров. Хорошее согласие параметров речевого сигнала не только человека, но и обезьян с параметрами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодирования информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработке технических систем, в частности, к методам обработки речевого сигнала. С другой стороны, обнаруженное совпадение подтверждает и выделенные ранее параметры психофизиологической модели, дополнительно обосновывая предпочтительность (по сравнению с другими, известными в литературе) именно такой системы классификации эмоций, как с точки зрения размерности, так и в отношении ориентации осей пространства модели.

В целом, полученные результаты свидетельствуют о древности эмоциональной системы регуляции и о том, что она сохранилась у человека в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи. Кроме того показано, что у большинства обследованных видов обезьян (шимпанзе, макака- резус и павиан) весь репертуар звуковых сигналов исчерпывается этой эмоциональной регуляцией. Однако обнаружено, что некоторые виды обезьян – сиаманги (гиббоны) способны усложнять репертуар своих звуковых сигналов и создавать дополнительные каналы звуковой сигнализации в относительно свободной частотной области, чтобы не мешать использованию общей с другими видами обезьян (и человека) эмоциональной системы сигнализации. По-видимому, эта дополнительная система изменения звукового сигнала основана на том же принципе кодирования, что и общая эмоциональная.

Звуковая коммуникация

Звук, звуковая волна имеет большое значение в эволюции жизни на земле, поскольку она служит самым «перспективным» средством передачи информации в мире живых существ, что доказывается фактом появления звуковой речи и сознания у человека. Несмотря на то, что животные не говорят между собой в нашем человеческом понимании, язык звуков - немаловажный и для них способ общения. Сейчас уже никто не отрицает, что звуковая коммуникация, наряду с другими каналами, широко распространена в животном мире, а эмоциональные реакции, хотя бы простые, свойственны не только человеку, но и большинству животных, не говоря уже об обезьянах. Речь животных имеет свою эволюцию: исторически звук проделал путь от инструментального «механического» голоса к «истинному» голосу, использующему воздушную струю. С помощью модуляций голоса (известны три основных вида модуляций - амплитудная, частотная и фазовая) животные могут вкладывать в издаваемые ими звуки разнообразную информацию и кодировать ее большой объем в коротких сигналах. Например, А.А. Никольский (2012) в звуковых сигналах млекопитающих обнаружил пять вариантов амплитудной модуляции: ее отсутствие, непрерывную, фрагментарную, гетерогенную и многоуровневую. Одни и те же формы амплитудной модуляции могут встречаться параллельно в звуках, издаваемых представителями различных отрядов млекопитающих. И, напротив, различные ее формы обнаружены в сигналах, выполняющих одну и ту же функцию.

Обстоятельные исследования акустической структуры обезьяньего языка, проведенные в лаборатории Г.В. Гершуни (Морозов, 1987), показали, что в обезьяньем языке имеется много звуковых элементов, сходных по звучанию с фонетическими элементами человеческой речи - гласными, согласными, слогами. Но самым интересным оказалось, что эмоциональное значение голосовых звуков обезьян — угрозу, страх, радость, настороженность, гнев, удовольствие, жалобу и т.п. - слушатели-люди воспринимают совершенно адекватно, то есть правильно (с вероятностью до 95%) определяют то эмоциональное состояние, в котором находилось животное, издавая соответствующие звуки (Морозов, 1987). При этом у современных обезьян средства общения, коммуникации отличаются не только своим многообразием, но и выраженной адресованностью и выполнением побуждающей функции, направленной на изменение поведения членов стада (Фабри, 1999). Эти звуки имеют определенный смысл, как показали исследования Н.И. Жинкина звуковой коммуникации обезьян в Сухумском обезьяньем питомнике. Спрятавшись за большой камень в свободном вольере, Николай Иванович издавал похожие на «обезьяний язык» звуки. Настороженное молчание обитателей вольера вскоре начинало прерываться ответными криками или же животные убегали. Эти реакции означали, что издаваемый человеком звук понят, то есть коммуникация установлена (Зимняя, 2001). Замечено также, что в некоторых пределах эти звуки самодостаточны и правильно воспринимаются даже в записи. Часто приводится такой пример наблюдения (Морозов, 1987). В яркий солнечный день стадо обезьян резвилось в заповеднике. Вдруг неожиданно набежала туча и пошел дождь. Обезьяны с криками скрылись под навесом. Звуки их голосов при этом были записаны на магнитофон. В другой такой же солнечный день, когда дождя совсем не предвиделось, эти магнитофонные записи были воспроизведены резвящимся обезьянам. В результате обезьяны, услышав свои крики, устремились под навес. Но следует ли из этого заключать, как Н.И. Морозов, что в «лексиконе» обезьяньего языка есть звуки, обозначающие «дождь» (Морозов, 1987)? Или это просто сигнал-предупреждение, побуждающий прятаться? Н.И. Тих считает, что в отличие от человека, у обезьян коммуникативные средства: звуки и телодвижения лишены семантической функции и поэтому не служат орудием мышления (Фабри, 1999). Коммуникация у высших обезьян носит неспецифический характер - акустические сигналы неспецифичны, а ритуализированные демонстрации редуцированы (Фридман, 2012). Пример неспецифической успешной коммуникации - это так называемый «пищевой крик» цейлонских макак (Macaca sinica). Эмоциональной основой крика служит общее возбуждение, своего рода эйфория, стимулированная находками новых источников или видов пищи. Доказательством неспецифич- ности сигнала служит тот факт, что индивидуальные различия в реактивности макак существенно влияют на интенсивность звуковой активности и на частотные характеристики самих звуков. К тому же признаки сигнала не зависят от конкретных особенностей пищевых объектов, то есть пищевой сигнал макак лишен иконического смысла. Такой неспецифический пищевой крик, тем не менее, служит эффективным и надежным средством коммуникации. В адекватной ситуации крик зарегистрирован в 154 случаях из 169. Положительная реакция других особей на крик обнаружена в 135 случаях из 154. Члены стада, услышавшие крик, сбегаются на него с расстояния до 100 м (Dittus, 1984).

Таким образом, можно отметить большую выразительность и разнообразие звуковых средств общения обезьян (в частности, у всех узконосых обезьян звук играет важную роль в коммуникации) и сходство их звуков с эмоциональными средствами коммуникации у человека. При этом все же остается проблема интерпретации звуковых сигналов животных - правильное распознавание их человеком базируется на его собственном «здравом смысле» и его же интерпретации ситуации (которое может и не совпадать с восприятием данной ситуации животными). Но, что тогда означает факт правильного и точного опознания человеком эмоций животного по его крику? Может быть, только простое соответствие созданных им по своим понятиям классов криков и ситуаций (что тоже немаловажно), но вовсе не соответствие эмоций, которые должны испытывать животные, тем эмоциям, которые испытывал бы сам человек в этой ситуации. То есть, получается порочный круг, когда исходная аксиома - что человек способен классифицировать ситуации и соответствующие им звуки на основании собственных признаков, превращается в утверждение - эти же признаки приписываются животным. Вопрос остается открытым, пока не будет разработан объективный метод сопоставления соответствующих звуковых сигналов и определения соответствия качества эмоций человека этим звуковым сигналам. Только тогда можно будет по-настоящему доказать наличие сходства эмоциональных звуковых сигналов человека и животных и доказать предположение, выдвинутое еще Ч. Дарвином (2001) о родстве эмоций человека и обезьян.

Что касается речевых способностей ныне живущих видов обезьян, то принципиальная невозможность обучения их членораздельному языку была неоднократно доказана (Фабри, 1999). Как же возникла речь у человека, если он произошел от общих с обезьянами предков? Что должно было измениться у человека, чтобы он приобрел способность к членораздельной речи? Или что было утрачено нынешними видами обезьян, из-за чего они утеряли такую возможность?

О специфике звукопроизводства обезьян и человека

По сравнению с человеком, у обезьян (в частности, у шимпанзе) слишком высоко расположена гортань (Жинкин, 1998; Lenneberg, 1967). Это очень удобно, поскольку позволяет есть и дышать практически одновременно. Низкое же положение гортани открывает возможности для четкого произнесения звуков человеческого языка. У человеческих младенцев гортань, как и у шимпанзе, расположена высоко (это позволяет одновременно сосать и дышать). Примерно к трем годам гортань опускается и это приблизительно совпадает со временем полного овладения звуковой стороной языка. Справедливости ради следует сказать, что положение гортани не остается неизменным в течение жизни не только у человека: по данным группы японских ученых, некоторое опускание гортани наблюдается и у шимпанзе (Бурлак, 2011). Относительно того, для чего нужно низкое положение гортани, существует несколько гипотез. Согласно одной, представляющейся наиболее правдоподобной, это необходимо именно для членораздельной звучащей речи, поскольку дает возможность языку двигаться внутри речевого тракта, как в горизонтальной, так и в вертикальной плоскости. Что, в свою очередь, позволяет создавать различные конфигурации ротовой полости и глотки независимо и тем самым сильно расширяет набор возможных фонем, различающихся по тому, на каких частотах звук усилен, а на каких, наоборот, приглушен. Такое понижение гортани дает возможность издавать более низкие звуки. Таким образом, низкое положение гортани можно рассматривать как видовой признак - это одно из приспособлений для членораздельной звучащей речи (Бурлак, 2011).

Кроме этих анатомических особенностей можно упомянуть (Барулин, 2012) об отсутствии у человека естественных диастем (промежутка между зубами, в котором размещаются клыки, например, у шимпанзе), а так же об отличающейся от человеческой лицевой мускулатуре обезьян (Lenneberg, 1967) и о небольшом по сравнению с гейдельбергским человеком, палеоантропом и неоантропом диаметре позвоночного столба в грудном отделе, что свидетельствует об отсутствии способности к тонкому регулированию потока воздуха, направляемого на голосовые связки, т.е. на отсутствие специального, речевого режима дыхания у обезьян (MacLarnon, Hewitt, 1999). Немаловажным является и тот факт, что обезьяны с одинаковым комфортом извлекают звук как на выдохе, так и на вдохе (Kelemen,1961; Lenneberg, 1967; Deacon, 1997), в то время как голосовая щель человека приспособлена к тому, чтобы управляемо работать только на выдохе (Lenneberg, 1967; Deacon, 1997). У некоторых видов приматов (в том числе, у человека и шимпанзе) в дополнение к истинным голосовым складкам имеется пара ложных голосовых связок, развитых значительно слабее. При этом шимпанзе, в отличие от человека, может использовать при звукопроизводстве обе пары связок независимо, хотя их активация требует большего давления воздушной струи (Lenneberg, 1967). У человека ложные голосовые связки могут начать использоваться только после специальной программы тренировок, например, при горловом пении или в результате лечения у логопеда, когда выходят из строя истинные голосовые связки. У всех гоминоидов, кроме людей, имеются так называемые горловые или гортанные мешки (de Boer, 2011), которые создают при производстве звука дополнительный низкочастотный резонанс, из-за чего частоты оригинальных резонансов смещаются и сближаются, что негативно влияет на различимость звуков по тембру.

«Правильная» конструкция и функционирование моторного аппарата может иметь значение не только для производства речи, но и для ее восприятия. Противоречие между наблюдаемым разнообразием акустических параметров и кажущейся устойчивостью восприятия фонетических элементов речи человеком привели к формулировке различных вариантов моторной теории восприятия речи (Сорокин, 2007). Представление о том, что при восприятии речи каким-то образом используется информация о свойствах речеобразования, опирается на способность человека к обучению речи. Определенную роль сыграло и явление так называемой внутренней речи, т.е. наблюдающееся иногда проговаривание «про себя» читаемого текста. Накапливались и наблюдения за компенсацией естественных и искусственных нарушений процесса образования или восприятия речи. Неврологам и логопедам давно известно, что при парезе или параличе отдельных лицевых или внутриротовых мышц разборчивость речи может и не пострадать. Например, при парезе мышц, управляющих движениями нижней челюсти, артикуляция губных звуков осуществляется за счет большей амплитуды движений губ. Начиная носить зубные протезы с искусственных твердым небом, в ряде случаев люди сохраняли разборчивость своей речи. Иногда больные с удаленной гортанью полностью восстанавливали в своей речи не только различие между звонкими и глухими согласными, но и правильную фразовую интонацию (Sorokin et al., 1998) и даже могли петь. Имеются сведения о том, что замена удаленного языка пластиковым протезом позволила больному сохранить сравнительно разборчивую речь (Сорокин, 2007). Все эти факты говорят о широком диапазоне возможностей подстройки речевого аппарата и устойчивости системы восприятия и порождения речи в целом.

Предложенная В.Н. Сорокиным (2007) теория внутренней модели объединяет процессы образования и восприятия речи и позволяет понять механизм вышеописанной устойчивости. Внутренняя модель является элементом системы управления артикуляцией, обеспечивая текущий контроль и коррекцию артикуляции при различных нарушениях путем решения обратных задач: «проприоцепция - управление» и «акустика - управление». Для успешной деятельности внутренняя модель должна основываться на данных механики, аэродинамики, акустики речеобразования и фонетике языка. Было установлено, что при наличии акустической информации нет необходимости измерения всей формы речевого тракта, достаточно знания о положении губ, нижней челюсти и передней части языка. Тем самым при решении задач коррекции артикуляции или компенсации нарушений ослабляются требования к точности проприоцептивных сигналов. Это повышает вероятность того, что система управления артикуляцией способна решать обратные задачи с целью контроля качества генерируемого речевого сигнала и соответствия его установившимся фонетическим нормам в данном языке (Сорокин, 2007). С помощью вычислительного эксперимента было также показано, что форма речевого тракта, выявленная посредством решения обратной задачи с использованием одновременно и акустических и артикуляторных данных, хорошо совпадает с результатами, полученными на основе одних только акустических параметров. Это означает, что такая организация восприятия и порождения реальной речи вполне возможна. В процессе этих исследований было также установлено, что для успешного решения обратной задачи можно использовать не только формальные процедуры, но и так называемую «кодовую книгу» (Atal et al. 1978). Ее идея состоит в предварительном вычислении набора соответствий между заданными векторами артикуляторных параметров и соответствующими им векторами акустических параметров. Можно предположить, что, начиная с периода детского лепета, внутренняя модель, пользуясь методом проб и ошибок, отслеживает процесс изменения анатомических размеров речевого тракта и соответствующим образом корректирует содержание «кодовой книги». Примеры восстановления голосового источника после удаления гортани указывают также на удивительную пластичность системы управления речеобразованием, способной не только отслеживать возрастные изменения параметров речевого тракта, но и менять саму структуру внутренней модели. При этом роль суррогатного голосового источника принимает на себя сфинктер, образованный пищеводом и мышцами-сжимателями глотки, которым и передаются тонкие функции мышц удаленной гортани (Сорокин, 2007). Все это говорит в пользу того, что «функция», т.е. необходимость говорить, в значительной степени определяет и «структуру» - способ управления речедвигательным аппаратом. Поэтому, аргумент об отсутствии у обезьян и до какого-то момента у наших предков хорошо приспособленного к речи голосового аппарата, как причины отсутствия у них речи, не корректен. Скорее наоборот, отсутствие необходимости речи («функции») не приводит к изменениям структуры. По-видимому, речь могла начать формироваться раньше, чем произошли анатомические изменения, которые ныне хорошо заметны при сопоставлении человека с не говорящими обезьянами, и которые являются уже результатом (и показателем) развития речи, а не условием ее становления.

Эмоции и происхождение языка

Нынешний человек и нынешние обезьяны различаются и строением речевого аппарата, и возможностями звуковой коммуникации. Но каким был язык, речь человека, когда человек только начал выделятся из мира животных? Чем различаются и чем сходны звуки, издаваемые в различных ситуациях современными животными, хотя бы теми, что генетически ближе всего к человеку – обезьянами, от звуков человеческой речи? Вопрос о происхождении языка занимал многих выдающихся мыслителей, но ставился и решался весьма различно. Среди множества теорий можно упомянуть теорию эмоционального происхождения языка и развивающую ее теорию междометий. Родоначальником этой теории был Жан Жак Руссо (1712-1778). В своем трактате по поводу происхождения языков Руссо (1998) писал, что первый язык человека, наиболее всеобщий, наиболее выразительный и единственный язык – это крик самой природы. Так как этот крик исторгался у человека лишь силою некоторого рода инстинкта в случаях настоятельной необходимости, чтобы умолять о помощи при большой опасности или при тяжких страданиях, то им редко пользовались в повседневной жизни, где царят чувства более умеренные. Когда представления человека стали расширяться и усложняться, когда между людьми установилось более тесное общение, они постарались найти знаки более многочисленные и язык более развитый. Они увеличили число изменений голоса и присоединили к ним жесты, которые по природе своей более выразительны, и смысл которых менее зависит от предварительного условия (Руссо, 1998). Эмоциональная теория Руссо получила развитие и стала называться теорией междометий. Один из защитников этой теории русский лингвист Д.Н. Кудрявский (1867-1920) считал, что междометия были своеобразными первыми словами человека. Междометия являлись наиболее эмоциональными словами, в которые первобытный человек вкладывал различные значения в зависимости от той или иной ситуации (Степанов, 1975). По мнению Кудрявского, в междометиях звук и значения еще были соединены неразрывно. Впоследствии, по мере превращения междометий в слова, звук и значения разошлись, причем этот переход междометий в слова и был связан с возникновением членораздельной речи (Степанов, 1975).

Однако язык эмоций современных животных, в том числе обезьян, и, по-видимому, предков человека, вполне достаточен, чтобы они могли решать все свои проблемы взаимодействия в группе, в том числе и повседневного, не требующего крайнего напряжения. Оставляя вопрос о причинах или движущих силах эволюции языка, приведших к появлению человеческой речи, вернемся к вопросу средств и «технической» базы развития звуковой речи. Сохранилась ли у человека первобытная система звуковой эмоциональной коммуникации в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи? В звучащей нормальной речи современных людей эмоциональная составляющая вполне хорошо заметна. Благодаря ей бывает можно понять, является ли говорящий радостным или огорченным, разгневанным, испуганным, удивленным и т.д. Эта составляющая может быть выделена даже тогда, когда слова разобрать по тем или иным причинам невозможно. Отличить просьбу от утвердительного ответа или отказа несложно при прослушивании магнитофонных записей «высказываний», произнесенных детьми, которые еще не овладели словами (Цейтлин, 2000). Как же эта эмоциональная составляющая взаимодействует со звуковой системой членораздельной речи? Может быть в ходе развития языка она трансформировалась таким образом, что новая система членораздельной речи использовала, хотя бы частично, ее средства и «потеснила» ее в звуковом сигнале? Если эмоциональная звуковая система человека является общим наследием его предков и ныне живущих родственных видов обезьян, то она должна быть так схожа у них, как и у разных видов современных обезьян между собой. Если же развитие человеческого языка пошло по пути редукции эмоциональной составляющей и развития членораздельной речи на ее основе, то можно ожидать существенного различия этих сигналов.

Задачей данного исследования было – формально сопоставить структуру голосовых сигналов обезьян и эмоциональных сигналов человека.

Подход к экспериментальному исследованию

Возможность такого сопоставления предоставляет недавно разработанный новый метод автоматического распознавания эмоций человека по речевому сигналу (Вартанов, 2013). Предложенный метод базируется на четырехмерной сферической модели эмоций и принципах кодирования информации в нервной системе (Виденеева, Хлудова, Вартанов, 2000; Вартанов, Виденеева, 2001; Вартанов, Вартанова, 2003; Вартанов, Вартанова, 2005; Вартанов, 2011). Четыре оси пространства эмоций были выделены на основе психофизических экспериментов и получили интерпретацию как определенные нейронные (мозговые) механизмы эмоций, а угловые характеристики - как субъективные качества эмоций. Первые две евклидовы оси пространства модели связаны с оценкой ситуации: ось 1 - по знаку (хорошо, полезно, приятно или плохо, вредно, неприятно), ось 2 - по степени информационной определенности (уверенность - удивление). Система третьей и четвертой осей связана с побуждением: ось 3 - притяжение, ось 4 - отвержение (оборонительная реакция) активное (агрессия) или пассивное избегание (страх, затаивание). Предлагаемая четырехмерная сферическая модель может служить общей классификационной системой для эмоциональных явлений, объединяя как физиологические представления о мозговых механизмах эмоциональной регуляции, так и известные психологические классификации, полученные на основе разных экспериментальных данных. Она количественно объясняет также все возможные нюансы и плавные взаимопереходы эмоций, представляя каждую конкретную эмоцию как линейную комбинацию основных выделенных психофизиологических параметров.

В результате экспериментальной проверки предложенного принципа относительного кросс-частотного амплитудно-вариабельного кодирования эмоций человека в речевом сигнале были выделены параметры звукового сигнала, хорошо соответствующие модели эмоций (Вартанов, 2013). Применение этого же метода к образцам звуковых сигналов обезьян позволяет формально количественно описать характер этих сигналов и сопоставить их с эмоциональным компонентом речевой продукции человека.

Методика

Материал

Были проанализированы четыре группы данных:

Специально записанные крики макак-резусов в различных условиях, документированных и интерпретированных опытными зоологами биологического факультета МГУ им. М. В. Ломоносова. Всего 151 файл, длительностью в среднем 1.308 сек (стандартное отклонение 1.5 сек). Каждый файл соответствует определенной ситуации из следующих возможных:

Экспериментатор входит в помещение с обезьянами и начинает запись;
Экспериментатор раздает еду обезьянам;
Экспериментатор дразнит обезьян палкой (демонстрирует палку вблизи клетки с обезьяной; обезьяна проявляет смешанную реакцию: компоненты защитного поведения чередуются с агрессивными в зависимости от характера обезьяны);
Экспериментатор дразнит обезьян рукой (производит резкие выпады рукой в сторону обезьяны);
Экспериментатор дразнит обезьян водой (пускает из спринцовки тонкую струю воды в клетку);
Экспериментатор высаживает одну из обезьян из ее клетки в клетку-переноску (тем самым вносит элемент новизны, радикально меняя привычную для обезьян обстановку);
Экспериментатор подносит клетку-переноску с обезьяной по очереди близко к каждой из остальных обезьян, тем самым предоставляя им возможность тесного визуального, но не физического контакта «лицо к лицу» так, как обычно обезьяны друг друга практически не видят;
Экспериментатор меняет лицо - надевает карнавальную маску (в отличие от простой демонстрации маски, маска, надетая на лицо, вызывает сильную характерную защитную реакцию);
Экспериментатор издает звуки похожие на крики обезьян (тоже элемент новизны для животных);
Экспериментатор производит манипуляции с пустой обезьяньей клеткой.

Крики сиаманга (гиббона). Использовались видеофайлы, найденные в интернете (Stunning Siamang Vocal Performance). Всего 19 файлов средней длительностью 9.81 сек (стандартное отклонение 5.66 сек). Длинные файлы разрезались на куски по 2 секунды каждый.
Крики шимпанзе, собранные, проанализированные и рассортированные Michael L. Wilson в Kanyawara community of Kibale National Park, Uganda (использованы фрагменты из видео- и аудиофайлов с сайта Gombe Chimpanzees). Всего 14 файлов средней длительностью 2.37сек (стандартное отклонение 1.37 сек), рассортированных на сайте по разделам: Food_associated_calls, Pant- grunts_pant-barks, Pant-hoots, Screams_ whimpers.
Крики павиана с единственным сюжетом отлова обезьяны в вольере ветеринаром (Baboon_attacks_vet). Всего 5 файлов средней длительностью 9.57 сек и (стандартное отклонение 5.52 сек). Файлы порезаны на фрагменты по 2 секунды.

Процедура анализа

Показатель вычислялся посредством следующего алгоритма:

Для звукового фрагмента с помощью стандартных средств - быстрое преобразование Фурье со сглаживанием в минимальном скользящем окне - вычислялась последовательность мгновенных спектров мощности сигнала (в диапазон от 0 до 4000 Гц с разрешением 50 Гц).
На основе последовательности мгновенных спектров в скользящем окне (размером 20 мс и шагом сдвига 10 мс) вычислялся показатель микровариативности (стандартное отклонение) амплитуды (квадратного корня от мощности) на каждой частоте, который нормировался по частотному диапазону.
Для вычисления интегральной оценки всего звукового образца использовалось простое усреднение предыдущего показателя по всему интервалу звучания и получение одного вектора (по частоте) для каждого звукового образца.

Полученный массив данных в каждой группе был дополнен четырьмя векторами, выраженными в том же частотном диапазоне, которые соответствовали выделенным ранее (Вартанов, 2013) четырем эмоциональным параметрам речи человека. Это давало возможность прямого количественного сопоставления получаемых спектральных характеристик. Далее массив данных подвергался факторному анализу.

Условия и параметры наблюдения за обезьянами макака-резус

Обстановка:

В комнате в изолированных клетках в условиях отсутствия физического контакта и затрудненной зрительной коммуникации находятся пять обезьян. Одна из них явный лидер (доминант), четыре остальные - субдоминанты. Ранговость между субдоминантами не ясна. Вероятно, один из них является субдоминантом низшей ступени.

Для каждого файла записи звуков указывалось количество криков в записи, для каждого крика (по порядковой нумерации в каждой записи) отмечена его вероятная функциональная роль, статус обезьяны, которая его производит и вероятная причинная связь с предыдущими криками в записи (если есть).

Были приняты обозначения и выделялись в записи следующие варианты функциональной роли криков обезьян:

«Приветствие» - крик, явно адресованный экспериментатору.
«Просительный/подчиненный» - крик, выражающий явную степень подчинения (зависимости?). Свойственен фактически только одной обезьяне с самым низшим статусом.
«Пищевой/получение пищи» - выражение удовлетворения при получении обезьяной пищи.
«Испуг/агрессия» - смешанная реакция одновременного выражения испуга и попытки напугать атакующего. Как правило, возникает, когда действие направлено непосредственно против этой обезьяны.
«Агрессия» - выражение чистой агрессии, когда обезьяне ничего не угрожает. Как правило, возникает, когда объектом агрессии является другая обезьяна.
«Испуг» - выражение чистого испуга. Как правило, возникает у субдоминант низших статусов.
«Коммуникация» - все остальные крики без явной причины в окружающей обезьяну обстановке, роль которых трудно установить. Несомненна их коммуникативная роль в ситуации, когда одна обезьяна таким криком пытается установить звуковой контакт, а другая (-ие) подтверждают его и возникает «перекличка». В остальных случаях роль таких звуков неясна.

Результаты

В результате анализа полученных массивов данных была оценена размерность факторного пространства (рис. 1). Размерность всего многообразия звуковых сигналов (пересчитанных по вышеописанному алгоритму в частотном диапазоне от 50 до 4000 Гц) оказалась равной четырем почти для всех обезьян: макак-резус (89.90844% от всей дисперсии), шимпанзе (91.73380% от всей дисперсии) и павианов (96.99263% от всей дисперсии). Для сиаманга (гиббона) четыре фактора определили только (84.25218% от всей дисперсии) и по графику распределения собственных значений (рис. 1) видно, что необходимо выделить еще два фактора, т.е. всего 6 факторов, которые будут описывать уже 91.29132% от всей дисперсии.

Рис. 1. График распределения собственных значений для исследованных звуковых сигналов по группам обезьян.

Полученные факторы для каждого набора данных вращались методом «Ва- римакс» с нормализацией для достижения «простой структуры». Оказалось, что в результате первые 4 фактора всех обезьян (включая гиббонов) полностью совпали с аналогичными факторами, выделенными в эмоциях человека. Полученные факторные нагрузки в спектральном выражении представлены на рис. 2.

Рис. 2. Спектральная характеристика (факторные нагрузки) четырех выделенных факторов по всем исследованным видам обезьян (обозначены соответствующими маркерами) в сопоставлении с эмоциональными параметрами речи человека (обозначены сплошной линией).

Как видно на этом рисунке, все четыре выделенных фактора для всех обследованных видов обезьян очень хорошо соответствуют выделенным эмоциональным параметрам в речи человека. Эти параметры занимают весь обследованный частотный диапазон, хотя в низкочастотной области (до 750 Гц) выражены только 3 и 4 факторы и то в противофа- зе, как бы компенсируя друг друга, становясь взаимозависимыми. Это с точки зрения кодирования сигнала свидетельствует о несущественности данной области для распознавания эмоционального качества по этим двум показателям. Дополнительные два фактора «песни» гиббона, напротив, занимают низкочастотный диапазон, имея там два разнесенных максимума, тогда как в высокочастотной области (после 750 Гц) переходят в противофазу, т.е. компенсируют друг друга, освобождая место для оценки сигнала по первым четырем эмоциональным параметрам. По-видимому, это может говорить либо о более «тонком» понимании и выражении эмоций гиббонами по сравнению с другими обезьянами и человеком, либо о том, что при полной сохранности эмоциональной системы, общей для всех обследованных обезьян и человека, формируется еще один канал звуковой сигнализации, обслуживающей какие-то дополнительные потребности животных данного вида. Полное же отсутствие в исследованных звуковых сигналах других обезьян дополнительных факторов свидетельствует об ограниченности их системы звуковой сигнализации только областью эмоционального реагирования.

Характеристика выделенных параметров звуковых сигналов обезьян в сопоставлении с аналогичными параметрами речевых сигналов человека была верифицирована по дополнительным данным с учетом возможности вычисления значения факторов и сопоставления проявлений соответствующих им эмоций в конкретных ситуациях. При этом (в соответствии с моделью эмоций) полученные значения факторов нормировались путем вычисления евклидового расстояния соответствующих четырехмерных векторов и деления каждой координаты вектора на это число. В таблице 1 представлены результаты формального сопоставления значений четырех параметров эмоционального речевого сигнала человека в системе четырех факторов, соответствующих каждому виду обезьян.

	Human Factor 1	Human Factor 2	Human Factor 3	Human Factor 4
Chimpanzee Factor 1	0.9971	-0.0599	-0.1315	-0.0737
Chimpanzee Factor 2	-0.0056	0.9976	-0.1091	-0.0125
Chimpanzee Factor 3	0.0746	0.0343	0.9853	-0.0215
Chimpanzee Factor 4	-0.0111	-0.0074	0.0004	0.9970
Baboon Factor 1	0.9845	-0.0493	-0.1798	-0.0841
Baboon Factor 2	0.0088	0.9971	-0.0388	0.0351
Baboon Factor 3	0.1746	-0.0172	0.9341	0.2783
Baboon Factor 4	0.0149	-0.0555	-0.3058	0.9561
Macaca-Rh Factor 1	0.9851	-0.0937	-0.0453	-0.1660
Macaca-Rh Factor 2	-0.0300	0.9799	-0.1466	-0.1292
Macaca-Rh Factor 3	0.0834	0.1704	0.9880	0.1070
Macaca-Rh Factor 4	-0.1477	0.0450	-0.0167	0.9718
Gibbon Factor 1	0.9998	-0.0282	-0.0672	-0.1544
Gibbon Factor 2	0.0204	0.9898	0.0033	0.1681
Gibbon Factor 3	0.0061	-0.0472	0.8881	0.0203
Gibbon Factor 4	0.0031	-0.1314	-0.4547	0.9734

Таблица 1. Соотношение факторов эмоциональной речи человека и звуковых сигналов обезьян.

Проверка содержательной интерпретации выделенных факторов возможна также по соответствию формального описания звукового сигнала и содержания ситуации, в которой издавался соответствующий звуковой сигнал. Так, для макак-резусов ситуации, в которых они издавали соответствующие звуки, были описаны и классифицированы. На рис. 3 представлены некоторые данные, иллюстрирующие такое соответствие. Аналогичные данные для шимпанзе приведены на рис. 4.

Рис. 3. Характеристика ситуаций, в которых обезьяны макака-резус издавали крики, формально охарактеризованные в системе четырех факторов, соответствующих эмоциональным параметрам человека.

Рис. 4. Распределение формальных оценок звуковых сигналов шимпанзе в системе выделенных четырех факторов, которые соответствуют параметрам эмоций человека, в различных ситуациях, обозначенных внизу (типы ситуаций разделены на графике вертикальными линиями).

Развитие ситуации записи при отлове павиана в вольере ветеринаром (с периодическими актами агрессии обезьяны и ее бегства), когда в конце она была поймана и зафиксирована усилиями нескольких человек, сопровождалось характерными криками обезьяны. На рис. 5 представлена формальная характеристика этих криков (запись фрагментирована по 2 сек), сделанная в соответствии с эмоциональными параметрами человеческой речи.

Рис. 5. Распределение по времени (2 сек фрагменты) формальных оценок звуковых сигналов павиана в системе выделенных четырех факторов, которые соответствуют параметрам эмоций человека.

Полученные данные свидетельствуют о принципиальном сходстве звуковых сигналов всех обследованных видов обезьян и эмоциональной составляющей речи человека. Их интерпретация подтверждена не только прямым сопоставлением параметров сигналов, но и результатами наблюдений за поведением обезьян и ситуациями употребления ими соответствующих звуковых сигналов. При этом все разнообразие звуковых сигналов большинства обследованных видов обезьян практически полностью исчерпывается этим видом сигнализации. Также обнаружено, что некоторые виды обезьян – сиаманги (гиббоны) способны усложнять репертуар своих звуковых сигналов и создавать дополнительные каналы звуковой сигнализации в относительно свободной частотной области, чтобы не мешать использованию общей с другими видами обезьян (и человека) эмоциональной системы сигнализации.

Обсуждение

Полученные результаты позволяют вернуться к вопросам, поставленным во введении. Итак, обнаружено, что первобытная система звуковой эмоциональной коммуникации, наблюдаемая у современных обезьян и, по-видимому, характерная также для предков человека, сохранилась в неприкосновенности и у сегодняшнего человека, продолжая сосуществовать в качестве системы выражения чувств, параллельной с возникшей независимо (Бурлак, 2011) звуковой системой членораздельной речи. Оказалось, что у сиамангов (гиббонов) тоже произошло усложнение репертуара звуковых сигналов, причем старая система не пострадала. Дополнительная система в ходе развития заняла свободную частотную «нишу», чтобы не «потеснить» старую в звуковом сигнале. Совпадение факторных характеристик вокализации макак, павианов, шимпанзе и человека показывает, что данное усложнение является инновацией, которая произошла в эволюционной линии, ведущей к гиббонам (после их отделения от прочих человекообразных обезьян). В дальнейших исследованиях можно проверить, существует ли такая же система звуковой сигнализации у других видов животных.

В целом, полученные результаты о сходстве кодирования эмоций человека и обезьян хорошо согласуются с известными фактами (Жинкин, 1998; Зимняя, 2001) о том, что эмоциональное значение голосовых звуков обезьян люди-слушатели воспринимают совершенно адекватно, то есть правильно определяют то эмоциональное состояние, в котором находилось животное, издавая соответствующие звуки. Эти результаты подтверждают также правоту Ч. Дарвина, писавшего об общности голосовых средств выражения эмоций у человека и высших животных.

Полученное хорошее согласие параметров речевого сигнала не только человека, но и обезьян с параметрами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодирования информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработке технических систем, в частности методов обработки речевого сигнала. С другой стороны, обнаруженное совпадение подтверждает и выделенные ранее параметры психофизиологической модели, дополнительно обосновывая предпочтительность (по сравнению с другими известными в литературе) именно такой системы классификации эмоций, как с точки зрения размерности, так и в отношении ориентации осей пространства модели.

В то же время, необходимо отметить, что выделенная система звукового кодирования эмоций основана на относительной амплитудной микромодуляции сигнала в четырех разных частотных областях. Интересен вопрос о развитии членораздельной речи человека – появилась ли эта способность на базе такого же принципа кодирования, как у сиаманга (гиббона), или же для нее возник другой способ кодирования (возможно частотный или фазовый)? Все это требует продолжения исследований звуковых сигналов животных и человека.

Выводы:

С помощью формальных объективных методов анализа показано принципиальное сходство звуковых сигналов обезьян разных видов: шимпанзе, макак-резусов, павианов и сиамангов (гиббонов) с проявлениями эмоций в речи человека. Это свидетельствует о древности эмоциональной системы регуляции и о том, что она сохранилась у человека в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи.
Разработанная (на основе принципа относительного микроамплитудного кросс-частотного кодирования) система формальных параметров оценки эмоций в речи человека хорошо применима в качестве экспериментальной процедуры для объективной оценки и интерпретации (в соответствии с системой человеческих эмоций) звуковых сигналов обезьян. Это подтверждается обнаруженным соответствием формальных оценок с результатами наблюдений за поведением животных в разных ситуациях.
Показано, что для большинства обследованных видов обезьян (шимпанзе, макак-резусов и павианов) весь репертуар звуковых сигналов исчерпывается одним видом эмоциональной регуляции, но существуют виды - сиаманг (гиббон), у которых система голосовых сигналов получила развитие, в частности, появилась дополнительная система изменения звукового сигнала, основанная на том же принципе кодирования, что и общая эмоциональная.

Литература.

Барулин А.Н. Семиотический рубикон в глоттогенезе / А.Н. Барулин // Вопросы языкового родства. - 2012. - № 8. - С. 33-74.

Бурлак С.А. Происхождение языка: Факты, исследования, гипотезы / С.А. Бурлак. - Москва: Астрель : CORPUS, 2011. - 464 с.

Вартанов А.В. Антропоморфный метод распознавания эмоций в звучащей речи / А.В. Вартанов // Национальный психологический журнал. - 2013. - № 2.

Вартанов А.В. Механизмы семантики: человек - нейрон - модель / А.В. Вартанов // Нейрокомпьютеры: разработка, применение. - 2011. -№ 12. - С. 54-64.

Вартанов А.В. Что такое эмоции? 4-х мерная сферическая модель аспектов переживания, выражения, восприятия и обозначения эмоций. // А.В. Вартанов, И.И. Вартанова // Культурно исторический подход и проблема творчества: Материалы вторых чтений памяти Л.С. Выготского / под ред. Е.Е. Кравцовой, В.Ф. Спиридонова, Ю.Е. Кравченко. - Москва, 2003. - С. 13-29.

Вартанов А.В. Эмоции, мотивация, потребность в филогенезе психики и мозга/ А.В. Вартанов, И.И. Вартанова // Вестник Московского Университета. Сер. 14 «Психология». - 2005. - № 3 - С. 20-35.

Вартанов А.В. Четырехмерная сферическая модель эмоций и дистанционный речевой контроль состояния человека / А.В. Вартанов, Н.М. Видинеева // Тезисы докладов рабочей группы «Влияние информационных технологий на национальную безопасность» 4-й Ежегодной Конференции Консорциума ПРМ «Построение стратегического сообщества через образование и науку». Москва, 25-27 июня 2001 г. - Москва, 2001. - 35 с.

Виденеева Н.М. Эмоциональные характеристики звучащего слова / Н.М. Видинеева, О.О. Хлудова, А.В. Вартанов // Журнал высшей нервной деятельности. - 2000. - Т. 50. - Вып. 1. - С. 29-43.

Дарвин Ч. О. Выражении эмоций у человека и животных / Ч. Дарвин. - Санкт-Петербург : Питер, 2001. - 384 с.

Жинкин Н.И. Язык - речь - творчество : избранные труды / Н.И. Жинкин. - Москва : Лабиринт, 1998. - 368 с.

Зенкин С.Н. Французский романтизм и идея культуры (аспекты проблемы) / С.Н. Зенкин. -Москва : РГГУ 2001. - С. 21-31.

Зимняя И.А. Лингвопсихология речевой деятельности / И.А. Зимняя. - Москва : Московский психолого-социальный институт ; Воронеж : МОДЭК, 2001. - 432 с.

Морозов В.П. Занимательная биоакустика / В.П. Морозов. - Москва : Знание, 1987. - 208 с.

Никольский А.А. Амплитудная модуляция звуковых сигналов млекопитающих / А.А. Никольский // Журнал общей биологии. - 2012. - Т. 73. - № 3. - С. 225-240.

Руссо Ж. Ж. Об общественном договоре. Трактаты / Ж.Ж. Руссо. - Москва : КАНОН-пресс, 1998. - 416 с.

Сорокин В.Н. Моторная теория восприятия речи и теория внутренней модели / В.Н. Сорокин // Информационные процессы. - 2007. - Т. 7. - № 1. - С. 1-12.

Степанов Ю.С. Основы общего языкознания : учеб. пособие / Ю.С. Степанов. - Москва : Просвещение, 1975.

Фабри К.Э. Основы зоопсихологии : учебник для студентов высших учебных заведений / К.Э. Фабри. - М.: Российское психологическое общество, 1999. -464 с.

Фридман В.С. (Вольф Кицес) Концепты ситуаций и происхождение человеческого языка. Электронный ресурс. - Режим доступа : http://wolf-kitses.livejournal.com/17339.html - дата обращения: 22.04.2014.

Цейтлин С.Н. Язык и ребенок. Лингвистика детской речи / С.Н. Цейтлин. - Москва : ВЛАДОС, 2000. - 240 с.

Чебоксаров Н. Н. Народы, расы, культуры / Н.Н. Чебоксаров, И.А. Чебоксарова. - Москва : Наука, 1971.

Animal language: пойми тех, кого любишь. - Электронный ресурс. - Режим доступа : http://animalang.biggo.ru/

Atal B.S., Chang J.J., Mathews M.V., Tukey J.W. Inversion of articulatory-to-acoustic transformation in the vocal tract by a computer sorting technique. - J. Acoust. Soc. Am., 1978. - vol. 63. - pp. 1535-1555.

Baboon_attacks_vet. - Электронный ресурс : Режим доступа http://www.youtube.com/watch?v=9PT_VFdXob0 - дата обращения: 22.04.2012.

Boer de B. Loss of air sacs improved hominin speech abilities // Journal of Human Evolution. - 2011. - №. 1-6. Электронный ресурс. Режим доступа : http://www.sciencedirect.com/science/article/pii/S0047248411002004

Deacon T.W. The Symbolic Species: The co-evolution of language and the brain. - Norton & Company, NY, London. - 1967. - 527 p.

Dittus W. Toque macaque food calls: semantic communication concerning food distribution in the environment // Anim. Behav. - 1984. - Vol. 32. - №2. Р. 470-477.

Gombe Chimpanzees : http://gombechimpanzees.org/activities/vocal-communication/ Food associated calls, Pant-grunts and pant-barks, http://www.discoverchimpanzees.org/media/sounds/tofu14.mov , Screams, whimpers and other calls - дата обращения: 22.04.2014.

Kelemen G. Anatomy of the larynx as a vocal organ: evolutionary aspects // Logos 4. -1961. -Р. 46-55.

Lenneberg E.H. Biological foundation of Language. With appendicies by N. Chomsky and Otto Max. - N.-Y., London, Sydney: J. Wiley & Sons, Inc., 1967. - 489 p.

MacLarnon, A., & Hewitt, G. The evolution of human speech: The role of enhanced breathing control //American Journal of Physical Anthropology. 1999. - 109. - Р. 341-363.

Sorokin V., Olshansky V., Kozhanov L. Internal model in articulatory control: Evidence from speaking without larynx. // Speech Communication. - 1998. v. 25. - № 3. - Р. 249-268.

Stunning Siamang Vocal Performance. - Электронный документ. - Режим доступа : http://www.youtube.com/watch?v=zORPtx6uyUA - дата обращения: 22.04.2014.

Для цитирования статьи:

Вартанов, А.В., Терещенко Л. В., Латанов А. В., Бурлак С.А.Звуковой язык эмоций человека и обезьян. // Национальный психологический журнал. 2014. № 4. , 79-92. doi: 10.11621/npj.2014.0409

Скопировано в буфер обмена

Скопировать