← Содержание

Перевод статьи Lexy Munroe Music theory for nerds

Теория музыки для ботанов

Не для ботанов-музыкантов, конечно.

Я не знаю о музыке вообще ничего. Знаю, что есть буквенная нотация, но иногда у букв бывают закорючки; знаю, что октава удваивает высоту звука; знаю, что можно написать песню, используя всего четыре аккорда. На этом всё.

Остальное мне всегда казалось совершенно произвольным. Почему полутонов двенадцать, а обозначений нот всего семь? Откуда взялись знаки при ключе? Почему на эту тему невозможно понять статью из Википедии, не прочитав все остальные статьи, на которую она ссылается?

Пару дней назад наконец-то начало доходить. Я чувствовала себя глупой из-за того, что не поняла сразу: бесполезно объяснять музыку через нотную грамоту. В ней нет смысла, пока не поймешь почему она устроена именно так.

Здесь собрано все, что мог узнать человек, который освоил только до-ре-ми во втором классе. Я переживаю, что плаваю в теме и пост ужасен. Если вы профессиональный музыкант, то, пожалуйста, не читайте — будете смеяться.

Звуки и волны

Музыка — это разновидность звука. Звук — это упругая волна.

Представьте что происходит, когда вы бьете в барабан. Мембрана эластична и, когда вы ударяете по ней, она деформируется внутрь, затем отскакивает наружу, потом снова внутрь, и так, пока не закончится энергия. Если смотреть на точку в центре мембраны, то ее движения будут очень похожи на движения пружинки-радуги, когда держите ее за один край, а другой отпускаете.

Когда мембрана отскакивает наружу, она толкает воздух. Воздух толкает больше воздуха, который толкает еще больше воздуха, создавая трехмерную волну, уходящую за пределы барабана. Тем временем мембрана отскакивает внутрь, образуя вакуум, в который устремляется воздух, тем самым образуя новый вакуум снова и так далее. В результате получается, что любая молекула воздуха совершает повторяющиеся движения вперед-назад от исходной позиции, как мембрана барабана.

В итоге упругая волна достигает барабанной перепонки, которая вибрирует точно так же, как мембрана барабана, и вы интерпретируете это как музыку. Или как шум, в зависимости от вашего вкуса.

Я бы с удовольствием проиллюстрировала сказанное, но проблема в том, что рисунок будет выглядеть как рябь на пруду, волны которого идут вверх. Звук возникает в трех измерениях и движется к источнику и от источника.

Давайте вместо рисунка обратимся к графику. Вот синусоидальная волна:

Не важно, что это синусоида. Главное, что это волна и её просто показать на графике. В таких графиках время начинается от нуля и продолжается вправо. Волна показывает сколько воздуха перемещается в барабанную перепонку из исходной позиции. Абсолютная тишина будет соответствовать нулю на всей оси X.

Все звуки, которые вы когда-либо слышали — это вот такой график, ничего больше. Если откроете песню в Audacity, то увидите волну. Она будет сложнее синусоиды, но это будет волна.

Волны описывают тремя характеристиками: частотой, амплитудой и формой. Особенность звука, который вы слышите — та, которая позволяет отличать гитару от скрипки — это форма волны, которую музыканты называют тембром.

Синусоидальная волна звучит примерно так:

Синусоидальная волна

Амплитуда — это дистанция между самой высокой и самой низкой точкой волны. Или, в зависимости от того, кому задаете вопрос, амплитуда может быть половиной дистанции — между самой высокой точкой и нулем. В звуке амплитуда определяет громкость. Это логично, потому что в физических терминах, амплитуда — наибольшее расстояние от среднего. Если вы слегка похлопываете по барабану, он двигается соответствующе. Если бьете по нему, он двигается интенсивнее и звук становится громче.

Частота — это, в буквальном смысле, ответ на вопрос «Как часто возникает волна?». Если каждая из волн узкая, то вместе они более частые, т.е. они имеют более высокую частоту колебаний. Если каждая из волн широкая, то вместе они менее частые и имеют более низкую частоту. Музыканты называют частоту колебаний высотой звука.

Частота измеряется в Герцах (Гц), 1 Гц — это одна волна в секунду. Если условная точка на одной волне возвращается за полсекунды в свое исходное положение на следующей волне, то частота будет равна 2 Гц (две волны в секунду). Звук в примере выше имеет частоту 440 Гц.

Одно из важнейших свойств человеческого слуха, которое определяет почти всё наше музыкальное восприятие — это то, что при увеличении или уменьшении частоты звука вдвое, мы считаем звучание примерно одинаковым. Конечно, мы заметим, что один звук выше, а другой ниже, но «ощущать» их будем как один и тот же.

Сравните эти три синусоидальные волны. Первая — это та, что была ранее; частота второй больше первой в 1,5 раза; частота третьей — в 2 раза. Первая и третья волна больше похожи друг на друга, чем вторая на какую-либо из них.

440 Гц

660 Гц

880 Гц

Ноты и октавы

Прим. пер.: здесь будет использоваться английская традиция буквенной нотации. В русской традиции нота си обозначается как латинская H, а си-бемоль как B. В английской си — это B, си-бемоль — B♭ (B-flat); буква H не используется. Таблица соответствия:

C D E F G A B
до ре ми фа соль ля си

Трудность с пониманием музыки в том, что она может казаться как совершенно произвольной, так и построенной по строгим правилам, но вы не поймете разницу, просто слушая музыку.

Начнем с фактов о человеческом слухе: звук с удвоенной высотой (частотой) каким-то неописуемым образом будет звучать примерно как без удвоения. Для любой начальной высоты звука f можно получить бесконечное количество других высот, которые для нас будут звучать одинаково: ½f, 2f, ¼f, 4f и так далее. Конечно, только часть из них будет лежать в пределах слышимости. У этих звуков есть общий признак, поэтому сгруппируем их в ноты. Хотя под нотой обычно подразумевают одну конкретную высоту и правильней был бы термин «высотный класс» («модальное тождество»), но здесь я буду использовать ноту именно в таком значении.

Если мы говорим, что частота 440 Гц соответствует ноте А, то 880, 220, 1760, 110 Гц и т. д. тоже будут звучать как A. Важное следствие из этого: все различимые ноты, которые мы могли придумать, должны находиться где-то в промежутке между 440 и 880 Гц. Поэтому звук любой частоты, попавший в этот интервал после увеличения или уменьшения вдвое, будет восприниматься как нота.

Такой интервал называется октавой. Каждая нота в октаве встречается только один раз, в независимости от того, как вы её определяли. Нота с частотой f это та же самая нота, что и с частотой 2f, поэтому 2f будет началом следующей октавы.

Хорошо, значит мы можем выбрать какие-нибудь ноты в маленьком диапазоне — любом маленьком диапазоне от f до 2f — и, увеличивая частоту в два или полтора раза, получить стандартный набор нот, охватывающий весь диапазон человеческого слуха.

Тогда как мы выберем высоту звука? Кажется, что это просто. Поскольку мы в любом случае идем от f к 2f, то просто выбираем высоты на f, 1,1f, 1,2f, 1,3f, 1,4f и так далее. Расстояние между ними одинаково, так что они настолько разные, насколько это возможно. Отличный план. К сожалению, это не совсем так — если попробуете, то поймете, что разница между f и 1,1f почти в два раза выше, чем между 1,9f и 2f.

Человеческое ухо различает высоты, основанные на соотношениях, из-за которых возникает эффект увеличения или уменьшения вдвое. От f до 1,1f — увеличение на 10%; от 1,9f до 2f — увеличение примерно на 5%.

Поэтому нам нужно не увеличивать значение частоты на постоянный коэффициент, а подобрать кратное значение. Если нам нужно n высот, то надо подобрать число, на которое можно умножать f, пока не получится 2f.

f × x × x × x × … × x = 2f
fxⁿ = 2f xⁿ = 2 x = ⁿ√2

О, значит нам нужен корень n-й степени из двух. Это странновато, ведь мы получим иррациональное число для любого n > 1.

Интервалы в классической музыке

Музыкальный строй в классической музыке состоит из 12 ступеней, которые соответствуют определенной высоте тона. Это условное деление — у числа 12 есть несколько интересных математических свойств, но в целом такая система деления на 12 полутонов совсем не обязательна. Вы могли бы создать собственный строй с 11 ступенями, с 17, с сотней или с пятью. И музыка с такими строями существует.

В равномерно темперированном строе соотношение между высотой и следующей за ней высотой равно корню 12-й степени из двух, ¹²√2 ≈ 1.0594631. Начиная с 440 Гц, умножая на это число, мы получим 12 высот, пока не упремся в 880 Гц.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
0    440 Гц
1    466.16
2    493.88
3    523.25
4    554.36
5    587.33
6    622.25
7    659.26
8    698.46
9    739.99
10   783.99
11   830.61
12   880 Гц

Никто не хочет работать с такими цифрами — и когда система была изобретена, никто и не думал про цифры. Вместо них музыка прекрасно описывается в терминах соотношений.

Соотношение между двумя высотами называют интервалом, а интервал размером ¹²√2 — полутоном. Таким образом, мы можем избавиться от всех этих ужасных иррациональных чисел и говорить только о целых.

На самом деле всё, чем мы тут занимаемся, работает в логарифмическом масштабе. Знаю, что для многих «логарифмический» звучит страшно, но это значит лишь то, что мы говорим «добавить» в значении «умножить».

Итак, запомните — человеческое ухо любит соотношения. Особенно любит соотношения маленьких целых чисел — вот почему удвоение высоты звучит «так же». Потому что оно создает соотношение 2:1 — наименьшее и наицелочисленное из возможных.

Хотя корень 12-й степени из двух иррационален, он оказался весьма пригоден для создания почти идеальных музыкальных интервалов. Вот высоты всех двенадцати нот, выраженные в отношении к первой. Некоторые очень близки к обыкновенным дробям.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
0    1.000          = 1:1   (чистая прима)
1    1.059                  (полутон; малая секунда)
2    1.122   1.125 = 9:8   (целый тон; большая секунда)
3    1.189                  (малая терция)
4    1.260   1.250 = 5:4   (большая терция)
5    1.335   1.333 = 4:3   (чистая кварта)
6    1.414                  (тритон; увелич. кварта или уменьш. квинта)
7    1.498   1.500 = 3:2   (чистая квинта)
8    1.587                  (малая секста)
9    1.682   1.667 = 5:3   (большая секста)
10   1.782                  (малая септима)
11   1.888   1.889 = 17:9  (большая септима)
12   2              = 2:1   (чистая октава)

Здесь семь довольно приятных дробей, не считая октавы. Хм, семь, какое знакомое число.

Звукоряд

Сюрприз. Эти приятные дроби образуют мажорный лад. Начиная с C образуется гамма C мажор — натуральный звукоряд. Используя ♯ (диез) в значении «на полутон вверх» и ♭ (бемоль) в значении «на полутон вниз», мы обозначаем все ноты этой гаммы.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
0    1.000          = 1:1   C           (чистая прима)
1    1.059                  C или D    (полутон; малая секунда)
2    1.122   1.125 = 9:8   D           (целый тон; большая секунда)
3    1.189                  D или E    (малая терция)
4    1.260   1.250 = 5:4   E           (большая терция)
5    1.335   1.333 = 4:3   F           (чистая кварта)
6    1.414                  F или G   (тритон; увелич. кварта или уменьш. квинта)
7    1.498   1.500 = 3:2   G           (чистая квинта)
8    1.587                  G или A    (малая секста)
9    1.682   1.667 = 5:3   A           (большая секста)
10   1.782                  A или B    (малая септима)
11   1.888   1.889 = 17:9  B           (большая септима)
12   2              = 2:1   C           (чистая октава)

Теперь понятно откуда берутся интервалы. Квинта (чистая квинта) — это интервал между первой и пятой нотой. Октава охватывает все восемь нот. Аналогично, самый маленький интервал у полутона. Поскольку большинство нот находятся в двух шагах друг от друга, расстояние получается размером в целый тон.

Интервал между нотами, следующими друг за другом, записывается, например, так: тон-тон-полутон-тон-тон-тон-полутон. Поскольку октавы повторяются, можно повернуть эту последовательность, чтобы воспроизвести семь разновидностей, в зависимости от того, с какой ноты вы начали. В результате получится звукоряд, который называется диатонической гаммой, а нота, выбранная начальной, называется тоникой. Вот все семь, пронумерованных римскими цифрами, обозначающими тоники. Я выбрала разные тоники для каждой колонки, получив все «натуральные» гаммы (то есть без диезов и бемолей).

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
                    I  II  III  IV  V  VI  VII
0    1.000  = 1:1  |C|  D   E   F   G  |A|  B
1    1.059         | |      F          | |  C
2    1.122  ≈ 9:8  |D|  E       G   A  |B|  
3    1.189         | |  F   G          |C|  D
4    1.260  ≈ 5:4  |E|          A   B  | |  
5    1.335  ≈ 4:3  |F|  G   A       C  |D|  E
6    1.414         | |          B      | |  F
7    1.498  ≈ 3:2  |G|  A   B   C   D  |E|  
8    1.587         | |      C          |F|  G
9    1.682  ≈ 5:3  |A|  B       D   E  | |  
10   1.782         | |  C   D       F  |G|  A
11   1.888  ≈ 17:9 |B|          E      | |  
12   2      = 2:1  |C|  D   E   F   G  |A|  B

И выделила две колонки. Колонка I отображает мажорный лад, колонка VI отображает натуральный минорный ряд. Это объясняет название остальных интервалов: малая терция — это промежуток между первой и третьей нотой в минорном ладе, в то время как большая терция — промежуток между первой и третьей нотой в мажорном ладе. Четвертая и пятая ноты одинаковы.

Вы можете начать откуда угодно, чтобы представить мажорную или минорную гамму, пока будете следовать шаблону интервалов. В сумме с двенадцатью нотами существует 24 мажорных и минорных лада, которые можно представить в виде большой скучной таблицы. Вот несколько мажорных ладов:

1
2
3
4
5
6
7
A мажор:    A       B       C#  D       E       F#      G#  A
A# мажор:   A#      C       D   D#      F       G       A   A#
B мажор:    B       C#      D#  E       F#      G#      A#  B
C мажор:    C       D       E   F       G       A       B   C
C# мажор:   C#      D#      F   F#      G#      A#      C   C#
D мажор:    D       E       F#  G       A       B       C#  D
D# мажор:   D#      F       G   G#      A#      C       D   D#

Если повернете гамму, чтобы начать с C, то таблица будет выглядеть так:

1
2
3
4
5
6
7
A мажор:        C#  D       E       F#      G#  A       B       C#
A# мажор:   C       D   D#      F       G       A   A#      C
B мажор:        C#      D#  E       F#      G#      A#  B       C#
C мажор:    C       D       E   F       G       A       B   C
C# мажор:       C#      D#      F   F#      G#      A#      C   C#
D мажор:        C#  D       E       F#  G       A       B       C#
D# мажор:   C       D   D#      F       G   G#      A#      C

Вот несколько минорных гамм, созданных тем же способом:

1
2
3
4
5
6
7
F# минор:       C#  D       E       F#      G#  A       B       C#
G минор:    C       D   D#      F       G       A   A#      C
G# минор:       C#      D#  E       F#      G#      A#  B       C#
A минор:    C       D       E   F       G       A       B   C
A# минор:       C#      D#      F   F#      G#      A#      C   C#
B минор:        C#  D       E       F#  G       A       B       C#
C минор:    C       D   D#      F       G   G#      A#      C

Хм, у каждой мажорной гаммы есть эквивалентная минорная, которая начинается с предпоследней ноты мажорной гаммы и проходит по всей октаве. Это параллельный минор и мажор соответственно; вместе — параллельные тональности.

А ещё у такой системы есть небольшая проблемка — ужасная запись.

Нотная запись и тональности

Если вы сталкивались с нотной грамотой, вам, наверное, известно, что на нотном стане нет места для записи нот, которые на полутон выше или ниже.

Если надо написать ноту на полтона выше или ниже, то вы пишете её на той же линии, но с ♯ или ♭ перед ней. Ноты в D мажоре, которые включают F♯ и C♯, написаны так, будто они F и C, но с дополнительными знаками ♯, разбросанными там и сям. Такая запись неудобна, поэтому вместо нее знаки ставят в самое начало нотного стана сразу за ключом — такое написание принимает форму с несколькими ♯ или ♭ и означает какие ноты повышены или понижены. И тогда ноты на этой позиции без диеза или бемоля будут играться как с диезом или бемолем.

На самом деле ноты могут находиться ниже или выше на дополнительных линиях, а слева может отображаться не скрипичный, а басовый ключ.

Не уверена, что это удобно. Если ваша музыка в основном строится на семи нотах в определенной тональности, то можно использовать обозначения только семи нот, изменяя их тон при необходимости. Так?

Однако, это полностью скрывает связь расстояний между нотами. Без запоминания вы даже не сможете сказать где какая тональность у нот. В примере выше диезы стоят для C и F; как понять что это D?

Взгляните на C♯ мажор ещё раз:

1
C# мажор:   C#      D#      F   F#      G#      A#      C   C#

Две пары нот обозначаются одной и той же буквой — C и C♯, F и F♯ — поэтому они занимают одну и ту же позицию на нотном стане. Чтобы исправить это, воспользуюсь следующим трюком. C на полтона выше B, поэтому напишу B♯. F на полтона выше E, поэтому E♯. Вот что получится:

1
C# мажор:   C#      D#     (E#) F#      G#      A#     (B#) C#

Теперь все семь букв используются только один раз.

Всё очень запутано. Надо мысленно перевести C в C♯, а потом взять эту ноту на инструменте. Чего мы этим добьемся? Это делает нотную запись компактнее — семь, а не двенадцать нот для целой октавы — но других причин я не вижу.

Я предполагаю, что можно изменить звучание целого куска, просто изменив знак при ключе, не изменяя сами ноты. Интересно, как это работает с музыкой, которая использует ноты за пределами тональности? Этот вопрос скорее о композиции, в которой я совершенно ничего не понимаю.

Кое-что об аккордах

Здесь всё ещё более запутанно.

Как мы уже знаем, мажорные и минорные гаммы идут парами. У каждой мажорной гаммы есть соответствующая минорная с точно таким же набором нот, и наоборот. Таким образом C мажор идентичен A минору. Зачем нам обе гаммы? Более того, они используют одни и те же знаки при ключе. Как понять, какая часть музыки использует ту или иную тональность?

Мне пытались объяснить, что они нужны для выражения настроения, другого звучания и всякого такого, но это не ответы, а смещение вопроса. В общем, насколько я поняла, вопрос с двойным дном.

Первое: музыка написана в определённой тональности, которая включает обе гаммы, аккорды и может ещё что-нибудь. Аккорд — это несколько нот, сыгранных вместе или почти вместе. Вы можете построить сколько угодно аккордов, но чаще всего будут играться мажорное и минорное трезвучие, которые находятся в первых, третьих и пятых нотах гаммы. Аккорд C мажор, двусмысленно обозначаемый как C, включает C, E и G. При этом аккорд A минор, обозначаемый как Am включает A, C и E.

Мажорное трезвучие состоит из тоники, из ноты, которая на 4 полутона выше основного, и из ноты, которая на 7 полутонов выше основного — более топорно: {0, 4, 7}. Минорное трезвучие: {0, 3, 7}. Первая и последняя нота обоих трезвучий — чистая квинта с соотношением 3:2. Мажорное и минорное трезвучие с одинаковым основным тоном звучат в некотором роде одинаково, но, поскольку средняя нота немного ниже в минорном трезвучии, оно обычно звучит чуть драматичнее или грустнее.

Кое-что интереснее произойдет если сравнить мажорную и минорную гамму, начиная с одной и той же ноты. Они очень похожи, за исключением того, что в мажорной гамме три ноты выше на полутон.

1
2
C мажор:    C       D       E   F       G       A       B   C
C минор:    C       D   D#      F       G   G#      A#      C

В каждой мажорной и минорной гамме можно построить семь аккордов на каждой ступени. К примеру, D-F-A — второй аккорд в C мажоре будет D минором. Да, именно минором; то же расположение нот, что и в первом аккорде.

Иногда встречаются аккорды обозначенные римскими цифрами, заглавными для мажорных трезвучий и прописными для минорных. Мажорные — это I, ii, iii, IV, V, vi и vii; минорные — i, ii, III, iv, v, VI и VII. I значит, что аккорд строится с первой ноты и так далее. Это говорит о том, что аккордовые последовательности не зависят от знаков при ключе.

Возвращаемся к вопросу — зачем нам и C мажор, и A минор? Зачем нам два трезвучия?

Второе: так исторически сложилось. В классической музыке есть правила, но музыканты сами решают как ими пользоваться. Музыка, написанная в C мажоре, часто начинается и/или заканчивается на ноту C или даже на аккорд C мажор; музыка, написанная в A миноре — на ноту A или аккорд A минор. Насколько я могу судить, в этих двух параллельных тональностях нет фундаментальной разницы, и нет жестких требований следовать правилам.

Думаю, что преимущество такое же как при любой другой стандартизации: ваша запись становится понятнее другим специалистам. Например, перенос тональности (транспонирование), имеет смысл только если вы уверены какая тональность была в оригинале. Кстати, кто-то дал мне ссылку на пример того, как играют пьесу Бетховена «К Элизе» в A мажоре, несмотря на то, что она написана в A миноре. И если вы будете играть её в C мажоре, то она будет звучать как… так, я сама запуталась.

То, что есть куча условных обозначений, не должно нас удивлять. Гармонический минор — это минор с повышенной седьмой ступенью. Мелодический минор отличается от натурального когда играется вверх, но не когда играется вниз. Ещё есть увеличенное трезвучиеувеличенный интервал), у которого верхняя нота повышена на полтона, и уменьшенное трезвучиеуменьшенный интервал), у которого верхняя нота понижена на полтона. И так далее. Все эти вещи хаотично пересекаются и порождают противоречивые названия одной и той же сущности, потому что пытаются описать человеческий замысел, а не свойства звуковой волны.

***

Квинтовый круг (quinta — пять, интервал от первой до пятой ступени) показывает все мажорные и минорные тональности — он получится, если вы обозначите и расположите их в правильном порядке. У каждой тональности свое количество диезов или бемолей и нет тональностей с совпадающим количеством диезов и бемолей. «Расположить в правильном порядке» — значит расположить ноты в квинтовом круге на расстоянии семи полутонов, начиная от C до G до D и так далее. В тональности добавляется диез, если двигаться по часовой стрелке, или бемоль, если двигаться против, и тогда в нотах проще разобраться.

И да, целочисленные соотношения, возможно, приятны нашему слуху, потому что при сложении волн они получаются определенной формы. Вот как выглядит чистая квинта — два верхних тона A4 и E5, использующие не-совсем-идеальный корень 12-й степени из двух. Поскольку у них приятное соотношение 3:2, их совмещение создает повторяющийся набор из шести волн, который сам напоминает волну.

A4 — это нота A первой октавы. Первая октава начинается с ноты C в середине клавиатуры фортепиано. Настройка начинается именно с ноты A первой октавы на 440 Гц.

И наконец, ноты с «одинаковыми» названиями могут звучать по-разному, в зависимости от настройки инструмента. Различные варианты записи нот делают аккорды не просто имеющими приблизительное соотношение, а точное целое соотношение между звуками. Таких вариантов больше, чем просто E♯. Я слышала о странном обозначении Gдубль-диез (G дубль-диез), которое бы упростила до ноты A.

Это в общем-то все, что я знаю. Больше я не знаю ничего.

В заключение

Наверное, жаргон и обозначения в музыке одни из самых худших.

Я хотела кое-что сочинить, погрузилась в тему и почувствовала абсолютную беспомощность от полного непонимания. Не уверена, что для сочинения музыки хоть какие-то термины помогли, но сейчас я в них более-менее ориентируюсь.

Похоже, что не всё можно выразить чисто через арифметику и волны гораздо сложнее. Берите любой набор из 12 нот и сочиняйте музыку на его основе. Мне сказали, что если играть на пианино, пользуясь только черными клавишами (т.е. исключив натуральный звукоряд), то получится пентатоника, в которой ничто не может звучать плохо, потому что нет двух нот ближе целого тона. Ещё можно пользоваться высотами за пределом этих 12 нот, как это происходит в джазе, этнической и другой неклассической музыке.

Мне кажется, что рассматривать совокупность аккордов и ключей как некий набор правил — все равно, что учиться на живописи эпохи Возрождения, решив, что это и есть искусство. Но это не так. Делайте что угодно, лишь бы хорошо звучало. Я пойду попробую.