Na geração da voz humana, a garganta e a cavidade oral agem como um tubo, com uma extremidade aproximadamente fechada na base da laringe, onde estão as cordas vocais, e uma extremidade aberta na boca. Nessas condições, sons são emitidos com maior intensidade nas frequências e comprimentos de ondas para as quais há um nó (N) na extremidade fechada e um ventre (V) na extremidade aberta, como ilustra a figura. As frequências geradas são chamadas harmônicos ou modos normais de vibração. Em um adulto, este tubo do trato vocal tem aproximadamente 17 cm. A voz normal de um adulto ocorre em frequências situadas aproximadamente entre o primeiro e o terceiro harmônicos.
Considerando que a velocidade do som no ar é 340 m/s, os valores aproximados, em hertz, das frequências dos três primeiros harmônicos da voz normal de um adulto são: