Модификацию потока воздуха гортанью называют фонацией, которая формирует для каждого звука то, что известно под названием «частоты основного тона». Частота основного тона — это скорость вибрации голосовых связок во время фонации. Она различается в зависимости от размера, формы и толщины стенок гортани. У невысокого, маленького человека обычно более высокий голос (то есть более высокие основные частоты), чем у крупного. У взрослых более глубокие голоса, более низкие основные частоты, чем у детей; у мужчин голос ниже, чем у женщин; у высоких людей голос часто глубже, чем у низкорослых.
Частота основного тона, которая обычно обозначается как Fo, — это один из способов узнать, с кем вы разговариваете. Мы привыкаем к диапазону частот голосов других людей. Изменение частоты вибрации голосовых связок — основа пения и управления высотой звука в тональных языках, например мандарине или пираха, а также сотнях других языков, в которых тон слога имеет такое же значение для формирования смысла слова, как гласные и согласные звуки. Возможность контролировать частоту звука также важна для продуцирования и восприятия относительной высоты тона в пределах фраз и предложений. Это называется интонацией. Благодаря Fo некоторые языки также применяют свист, используя либо относительную высоту слогов, либо частоты, присущие отдельным звукам речи.
Однако Fo — это еще не все. Помимо основной частоты при извлечении каждого звука речи продуцируются гармонические частоты, или форманты, связанные исключительно с конкретным звуком. Эти форманты позволяют нам различать конкретные гласные и согласные звуки в родном языке. Например, человек непосредственно не воспринимает слог [dad]. Мы слышим форманты и их изменения, связанные с этими звуками. Форманту можно представить визуально. Возьмем камертон, дающий ноту «ми», ударим по нему и поставим на корпус акустической гитары рядом с резонаторным отверстием. Если гитара настроена верно, то струна «ми» той же октавы, что и камертон, тоже начнет вибрировать. Различные гармоники или форманты каждого звука формирует резонанс. Эти форманты видны на спектрограмме, где каждый формант имеет определенную кратность основной частоте звука (рис. 24).
Рис. 24. Спектрограмма гласных звуков.
На этой спектрограмме отражены четыре гласных звука. В нижней ее части расположена частота основного тона, от которой вверх поднимаются темные полосы. Каждая такая полоса, связанная с частотой, указанной в левой части спектрограммы, — это гармонический резонанс, или форманта соответствующего гласного звука. Горизонтальная ось — это время продуцирования звука. Чем темнее полоса, тем больше относительная громкость звука. Именно форманты являются «отпечатками пальцев» для всех звуков речи. Человеческое ухо эволюционировало для восприятия этих звуков, с отбором тех формант, которые отражают физическое строение нашего речевого тракта. Форманты, в порядке возрастания частоты, обозначают как F1, F2, F3 и т. д. Они формируются под воздействием резонаторов, таких как форма языка, округление губ и других механизмов артикуляции звука.
Формантные частоты гласных указаны на спектрограмме в герцах (Гц). Удивительно не то, что мы слышим различия в частоте звуков речи, а что слышим их, совершенно не осознавая этого, хотя продуцируем и воспринимаем эти форманты безошибочно. Это как раз тот вид невыражаемого знания, который часто приводит лингвистов к предположениям о врожденных, а не приобретенных способностях. Некоторые аспекты, безусловно, являются врожденными. Человеческий рот и уши — подобранный комплект. Спасибо естественному отбору.
Для подробного обсуждения физиологической интерпретации звуков ушами и мозгом (фонетика восприятия) у науки пока слишком мало данных. Но акустики и артикуляции звуков вполне достаточно, чтобы начать разговор о ходе эволюции этих способностей.
Если язык предшествовал речи, то следовало бы ожидать, что Homo erectus, хотя он и изобрел символы и язык G1, все же не обладал передовыми человеческими речевыми способностями. Он и не обладал. У него гортань была больше похожа на обезьянью, чем на человеческую. В действительности, несмотря на то, что неандертальцы имели относительно современное строение гортани, эректусы в этом плане остались далеко позади.
Основные различия между речевым аппаратом эректуса и сапиенса: отсутствие гиоидной кости и дочеловеческие рудименты, например воздушные мешки в центре гортани. Текумсе Фитч — один из первых биологов, отметивших, что воздушные мешки имеют отношение к человеческой вокализации. Из-за них многие извлекаемые звуки получаются не такими четкими, как у сапиенсов. Свидетельства того, что у них были воздушные мешки, основаны на удачных находках — окаменелых гиоидных костях эректусов. Гиоидная кость располагается над гортанью и прикрепляется к ней с помощью соединительных и мышечных тканей. Сокращение мышц, соединяющих гортань с гиоидной костью, позволяет людям поднимать и опускать гортань, изменяя Fo и другие параметры речи. А вот у гиоидной кости эректуса, в отличие от более поздних ископаемых видов Homo, мест крепления мышц не обнаружено. И на этом отличия не заканчиваются. Голосовой аппарат у эректусов и сапиенсов отличается настолько, что Крелин делает следующий вывод: «Полагаю, что голосовой тракт [эректуса] практически обезьяний». Другие исследователи пишут:
Авторы описывают тело гиоидной кости, без рогов, приписываемой Homo erectus из Кастель-ди-Гьюдо (Рим, Италия), датируемой примерно 400000 лет до н. э. Тело гиоидной кости имеет брусковидную форму, характерную для Homo, в отличие от булавовидной формы у африканских приматов и австралопитеков. Ее измерения отличаются от снятых с единственного целого образца вымершего вида людей и ранних гоминид (кебарский неандерталец и афарский австралопитек), а также от средних величин, характерных для современных людей. Почти полное отсутствие следов мышц на вентральной поверхности тела кости говорит об относительно слабой способности к поднятию этой гиоидной кости и, соответственно, модуляции длины голосового тракта у Homo erectus. Щитообразная форма, вероятно, небольшой размер больших рогов и данные рентгенограммы указывают на архаичные характеристики; есть ряд сходств с нечеловекообразными, на основании чего можно предположить, что морфологические основы человеческой речи не были заложены у Homo erectus
[125].
Следовательно, эректус никак не мог обладать тем же качеством речи, что и современный человек, в плане способности различать такой же спектр звуков речи при ее продуцировании и восприятии. Однако все это не означает, что у эректуса не было языка. У эректусов была достаточно развитая память, чтобы удерживать в ней большое количество символов, не менее нескольких тысяч (собаки, кстати, могут помнить до нескольких сотен). Эректусы могли бы, используя контекст и культуру, различать символы, недостаточно различимые в их формантах вследствие более скромных артикуляционных возможностей. Однако следовало бы ожидать того, что зависимость от языка создала бы эффект Болдуина, то есть естественный отбор действовал бы в пользу потомства с расширенными способностями к продуцированию и восприятию речи в плане развития как голосового аппарата, так и различных центров мозга. Со временем люди дошли от плохо различимой речи эректуса до современной ясной речи.