Når du spiller harmonisk kompliserte lyder, bidrar overlappingen av de nedre tonene til harmoniene innenfor tonehøydeområdet til de øvre tonene til gjørme, som Laurence Payne har svart. Når du bruker harmonisk enklere lyder, kommer imidlertid en annen faktor til spill.
En kombinasjon av signaler ved to frekvenser f1 og f2 kan oppfattes enten som to separate tonehøyder, eller som en enkelt tonehøyde (f1 + f2) / 2 som, avhengig av den relative amplituden til originalsignalene, svinger med en hastighet på enten f2-f1 eller 2 (f2-f1). Jo større forskjell mellom f1 og f2, desto mer sannsynlig er det at de blir oppfattet som separate tonehøyder, og jo mindre sannsynlig blir de oppfattet som en enkelt modulert tonehøyde.
Hvis en organist skulle bruke en 8 fløyte stopper for å spille en C, E nederst på keyboardet (den nedre tonen vil være den lave C av en cello, selv om en cello ville være mye rikere harmonisk), ville tonehøyde være henholdsvis 65,4Hz og 82,4Hz, med en forskjell på 17,0Hz. Denne forskjellsfrekvensen er lav nok til at en lytter sannsynligvis vil oppfatte en enkelt tone på 73,4Hz - omtrent D mellom de to tonene - som vrir ved 17Hz (litt mindre enn dobbelt så raskt som 10Hz-pulser fra en roterende telefon) .
Merk at jo mer harmonisk tynne tonene er, desto mer uttalt vil denne effekten være. Mange oppfatter telefonens "ringback" -lyd som brukes i USA og mange andre land (som kombinerer rene toner ved 440Hz og 480Hz) som en tone med en veldig rask klingring, til tross for at 40Hz ville være høy nok til å bli hørt som en tone i seg selv). På den annen side produserer de fleste instrumentene nok overtoner til at lyden av å spille C og E en oktav høyere enn de ovenfor, vil bli oppfattet som to forskjellige toner til tross for at forskjellen bare er 34Hz.