Попробовал представленный пример импульсом обработать - вроде похоже, но мозг не получается обмануть, даже с учётом того, что интершум подложил. Открыл окно, в соседнем дворе на площадке мужики в футбол режутся. Обратил внимание - большей частью долетают только обрывки фраз, на грани разборчивости.
Имхо, в этом тоже закавыка - меняется не только частотка и добавляются многочисленные отражения, но части фраз рассеиваются в воздухе, прежде чем дойдут до нашего уха.
В случае с микрофонной записью мы этого эффекта не наблюдаем, более того, если нам важно передать информационное наполнение, а не изобразить гур-гур — превращать речь в обрывки нельзя, режиссёр (и зритель!) нас не поймут.
Плюс опять же - мы, допустим, «отдаляем» обьект на 30-50 метров по нашей «улице», а сама фраза произнесена с обычной подачей, не криком. В реальных условиях мы бы банально не расслышали эту фразу, потому, поместив её в виртуальные отражения «двора» или «улицы», получаем скорее эффект громкоговорителя в городском пространстве.
А вот с шумом - взрывом, криком, ударом вполне прокатывает, по опыту.