Remover voz de canções não é simples. O som que é ouvido dos sistemas áudio é uma onda com várias modulações. Essa onda é o resultado de vários "geradores sonoros", tais como os instrumentos musicais e a voz. Uma vez misturados na gravação, o processo inverso nunca será perfeito. O que se costuma fazer é mascarar a influência de cada "gerador sonoro" através da equalização das principais frequências resultantes do mesmo, ficando os resultados muito aquém do desejado. Um exemplo disso são os karaokes, que baixam o volume das frequências mais próximas da voz (~3/7 kHz). Há outros casos de músicas para karaoke que são feitos na fase de gravação, excluindo a voz antes da mistura final.