Convertendo profundidade em audio em C#

Este post é uma tradução do post original anterior, Converting Audio Bit Depths in C#, em inglês

Sinais de áudio digitais podem ser armazenados em muitos tipos de formatos diferentes. Por exemplo, um sinal de áudio poderia ser armazenado como um sinal PCM de 16-bits dentro de um arquivo WAVE ou codificado em um formato com perdas como o MP3. Mas em todos os casos, todos sinais digitais são representados como uma sequência de valores, denominadas amostras, as quais são resultado da mensuração de uma determinada característica do som em função do tempo, para que possam ser manipuladas digitalmente.

Amostras (ou samples) formam um sinal discreto (digital) tipicamente originado de um sinal contínuo (analógico, como as ondas sonoras), obtido através de algum tipo de procedimento ou algorítmo de conversão (de amostragem). Assim existem, portanto, muitas maneiras de se representar uma amostra, como com bytes de 8-bits, inteiros de 32-bits ou números de ponto flutuante (floats) de 32-bits. E, por vezes, a conversão entre estes vários tipos de representações são um requerimento inicial em diversas aplicações.

Convertendo entre diferentes representações de amostras de áudio em C#

Para converter entre diferentes representações de amostras, além de modificar o tipo de dado (sua profundidade em bits) ainda é preciso adequar nossas amostras em uma nova escala. Por exemplo, para converter de um float de 32-bits para um unsigned byte de 8-bits, nós temos que transportar a amostra original de seu intervalo de [-1;1] para seu novo intervalo de [0;255].

Para realizar este processo, a classe a seguir contém um único (exaustivamente sobrecarregado) método que permite converter, por exemplo, amostras de 16-bit para 8-bit, 16-bit para float, float para 16-bit, entre outros. De fato, são possíveis conversões entre quaisquer um dos seguintes tipos: unsigned 8-bit bytes, signed 16-bit integers, signed 32-bit integers e 32-bit floating point single precision numbers. Espero que o código seguinte seja útil a alguem que esteja interessado!

Considerações

Note, porém, que conversões raramente são perfeitas. Isto é verdade para quase tudo, especialmente para sinais digitais. Converter de uma codifiação para outra pode introduzir erros de conversão nos dados. Para ajudar nesta questão, foi inventada a técnica conhecida como dithering. Dithering é o mesmo que propositalmente adicionar ruído num sinal.

Ruído? Sim, ruído. Ruído não é sempre uma coisa ruim. Basta dar uma olhada nos exemplos de imagens na Wikipedia e você logo entenderá isto. Infelizmente, esta classe ainda não suporta dithering, poderá suportar no futuro caso surja necessidade.

Até mais!

1 Comment

Leave a Reply

Your email address will not be published. Required fields are marked *