Попробуем образами. Без формул.
Представим себе пустую длинную ванну с забитой пробкой стока, в которой стоят в ряд, близко друг от друга, разные сосуды с водой. Все одного диаметра, но разной высоты, от одного конца ванны и до другого.
Ванна это наше музыкальное произведение, а сосуды - его отдельные его фрагменты. Соответственно в каждом сосуде разное колличество воды, чем сосуд выше, тем воды больше, что означает что этот фрагмент громче.
Выльем теперь все сосуды в ванну. Вода заполнит ванну на определенную высоту. Это и есть RMS. Если больше высоких сосудов, RMS будет выше, если больше низких - ниже.
Представим себе что один сосуд высокий, а остальные низкие. Если судить о колличестве воды выбирая только высокий сосуд, то может показаться что RMS высокий, но это будет только один громкий момент (или несколько, если высоких будет несколько), но так как низких будет больше, то средний уровень вылитой воды будет низким. Значит судить о громкости большей части музыкального произведения по одному или нескольким фрагментам будет неверно. Вот так происходит если выравнивать громкость по RMS. В танцевальной современной музыке разница между высокими и низкими фрагментами невелика и сравнивать по RMS можно, а вот в динамичной музыке, особенно в академической, джазе, фолке, ошибка оценки громкости по RMS будет очень велика, ибо там может быть много тихих моментов, которые снижают средний RMS.