Вы находитесь на странице: 1из 16

udio Digital

As ondas sonoras se propagam de modo contnuo no tempo e no espao. Para que sejam representadas no meio digital, seu comportamento analgico (contnuo) tem que ser convertido numa srie de valores discretos (descontnuos). Esses valores so nmeros (dgitos) que representam amostras ( samples em ingls) instantneas do som. Isso realizado por meio de um conversor analgico/digital (CAD). Se quisermos ouvir novamente o som, torna-se necessrio que os sinais digitais representados por nmeros binrios sejam reconvertidos em sinais analgicos por meio de um conversor digital/analgico (CDA).

Amostragem
A converso do sinal analgico para o digital realizada por uma sequncia de amostras da variao de voltagem do sinal original. Cada amostra arredondada para o nmero mais prximo da escala usada e depois convertida em um nmero digital binrio (formado por "uns" e "zeros") para ser armazenado.

Taxa de Amostragem
As amostras so medidas em intervalos fixos. O nmeros de vezes em que se realiza a amostragem em uma unidade de tempo a taxa de amostragem, geralmente medida em Hertz. Assim, dizer que a taxa de amostragem de udio em um CD de 44.100 Hz,

significa que a cada segundo de som so tomadas 44.100 medidas da variao de voltagem do sinal. Dessa maneira, quanto maior for a taxa de amostragem, mais precisa a representao do sinal, porm necessrio que se realize mais medies e que se utilize mais espao para armazenar esses valores.

Teorema de Nyquist
A taxa de amostragem dever ser pelo menos duas vezes a maior frequncia que se deseja registrar. Esse valor conhecido como frequncia de Nyquist. Ao se tentar reproduzir uma frequncia maior do que a frequncia de Nyquist ocorre um fenmeno chamado alising (ou foldover ), em que a frequncia "espelhada" ou "rebatida" para uma uma regio mais grave do espectro. A figura abaixo representa uma onda de 17.500 Hz (em amarelo) digitalizada com uma taxa de amostragem de 20.000 Hz. Cada amostra representada pelos pontos verdes. A onda em azul a onda resultante do efeito de aliasing .

A figura abaixo apresenta o efeito de aliasing (ou foldover) descrito acima:

Assim, como ouvimos numa faixa que vai aproximadamente de 20 a 20kHz, uma taxa de amostragem deveria ser de pelo menos 40khz para que todas as frequncias audveis pudessem ser registradas. Taxas maiores permitem o uso de filtros com decaimentos mais suaves que causam menos distores de fase, especialmente nas frequncias mais agudas.

Resoluo
Refere-se ao nmero de bits usados para representar cada amostra. Uma amostra representada por apenas um bit poderia receber apenas dois valores: "0" ou "1". J uma representao com 3 bits poderia receber 8 valores diferentes (23 = 8): 000, 001, 010, 100, 110, 101, 011, 111. Um CD tem uma resoluo de 16 bits o que permite uma resoluo binria com 65.534 (216) valores.

No grfico acima, a digitalizao com uma taxa de amostragem e resoluo muito baixas gera uma represntao muito distorcida do sinal original.

Com o aumento da taxa de amostragem e da resoluo, a onda representada se aproxima cada vez mais da forma de onda do sinal original.

Faixa de Extenso Dinmica


Cada bit acrescentado na resoluo dobra o nmero de passos (ou valores) usados para representar a variao de amplitude da onda e com isso adiciona 6dB na escala de dinmica que pode ser representada. Resolues mais altas oferecem tambm maior relao sinal rudo.

Relao Sinal/Rudo
a diferena, em dB, entre o nvel mximo de amplitude que pode ser representado numa determinada resoluo e o rudo do sistema. Quanto maior a resoluo, ou seja, quanto mais bits so usados para representar a amplitude do som, maior ser a diferena entre o nvel mais alto de reproduo e o rudo.

Embora sistemas com 16 bits sejam suficientes para representar udio com boa qualidade, s vezes desejvel ter alguns bits extras. Na realidade o sistema nunca usa todos os bits para a representao da amplitude do sinal. Num conversor de 16 bits so gerados de 3 a 6 dB de rudo, o que j "rouba" 1 bit da resoluo e diminui a faixa de dinmica usvel de 96 dB para 90dB. Se o material musical tem uma mdia de 78dB com picos ocasionais em 90dB, na maior parte do tempo o sinal no estar usando toda a faixa dinmica possvel, reduzindo em um ou dois bits (6 a 12dB) o outro extremo da escala. Na melhor das hipteses, boa parte do tempo o sistema estar utilizando apenas 13 ou 14 bits de resoluo disponvel. Deve-se notar tambm que quando o udio processado, so realizadas operaes matemticas em cada uma das amostras ( samples ) digitalizadas. Como os nmeros que representam essas amostras so finitos, a cada operao introduzido um pequeno erro. Quando o sinal passa por sucessivas tranformaes ou por transformaes que envolvem operaes complexas, esses erros vo se acumulando e passam a ser audveis

na forma de rudo. Quanto maior a resoluo de amostragem, menores (e menos audveis) sero esses erros.

Erro de quantizao
Quando feita a amostragem do sinal, o valor medido aproximado (quantizado) para o patamar mais prximo na escala de amplitude gerando pequenos desvios em relao ao valor do sinal original. Esses desvios, chamados erros de quantizao modificam o sinal original introduzindo rudo nas frequncias mais altas. Pode-se minimizar os erros de quantizao com o aumento da resoluo em bits.

Alguns sistemas introduzem um processo chamado dithering que a adio de rudo aleatrio ao sinal para distribuir os erros e minimizar os efeitos auditivos causados por eles.

Clipping
Uma vez que a extenso dinmica do udio digital determinada pelo nmero de bits utilizados, no possvel representar valores acima de um determinado limite. O valor mais alto que pode ser representado geralmente expresso como sendo 0 dB. Se a amplitude da onda ultrapassa esse valor, ocorre um corte ( clipping ) da crista da onda, mudando sua forma original e ocasionando uma distoro do som.

Tamanho de Arquivos
Resolues e taxas de amostragem maiores implicam em arquivos maiores e que precisam de mais espao para serem armazenados, mais tempo para serem transmitidos e mais poder de processamento para que sejam processados. Para se calcular o tamanho em bytes de uma arquivo pode-se usar a seguinte frmula: TA * R/8 * C * t Onde:
y y y y

TA = taxa de amostragem em Hz R = resoluo em bits (como queremos o valor em bytes e cada byte tem 8 bits, preciso dividir por 8) C = nmero de canais de udio t = tempo em segundos

Assim, num CD em que o udio armazenado com 44,1 kHz/16 bits, em dois canais (estreo), um minuto de msica ocuparia aproximadamente 10Mb de espao: (44.100 Hz) X (16 bits / 8) x (2 canais) x (60 segundos) = 10.584.000 bytes, ou aproximadamente 10 Mb.

Envie comentrios, correes e adies para Fernando Iazzetta http://www.eca.usp.br/prof/iazzetta/tutor/audio/a_digital/a_digital.html

O som
Processamento do som
Quando se fala em processamento, fala-se de clculos. Para se fazerem clculos, necessrio quantificar grandezas. Quando se processa o som, a grandeza essencial a medir a variao da intensidade do som, ao longo do tempo. A unidade de medida da intensidade do som (nvel de presso acstica) mais utilizada o decibel (dB). Para se ter uma ideia de quais os valores das intensidades sonoras, em debibis, de certas situaes familiares a que estamos expostos no nosso dia-a-dia, atente-se na seguinte tabela:
Intensidade 10-20 dB (SPL) espao aberto sossegado 40-45 dB (SPL) conversa em espao aberto 60-65 dB (SPL) rudo de trfego citadino 85-90 dB (SPL) rudo de maquinaria pesada 100-120 dB (SPL) escavadoras de presso 120-130 dB (SPL) concerto rock ao vivo 140-... dB (SPL) disparo de uma arma de fogo ou dinamite

Cenrio tpico

De notar que estes dados so meramente indicativos, por forma a que tenhamos ideia nos nveis de intensidade a que expomos os nossos ouvidos em certas situaes, de uma forma aproximada.

1. udio analgico
Neste sub-tpico vo ser apresentados os princpios base presentes nos dispositivos analgicos de udio mais comuns. Um microfone um dispositivo transdutor na medida em que converte uma forma fsica de energia, numa outra forma, concretamente, uma variao de presso acstica correspondente ao som, numa variao correspondente de tenso elctrica (ou potencial elctrico). A um valor alto de presso acstica corresponder um valor alto de tenso elctrica no cabo do microfone e vice-versa. Sendo representado por um sinal elctrico, o som facilmente processado por um sistema electrnico analgico como por exemplo um amplificador de alta fidelidade, ou por um sistema digital como exemplo um digitalizador e gravador de CDs.

Como o sinal elctrico sada do microfone de muito baixa amplitude, muitas vezes necessrio amplific-lo por forma a elevar a tenso elctrica. Para isso usa-se um amplificador. Um amplificador tpico caracterizado por algumas imperfeies funcionais, sobretudo no-linearidades, que degradam a forma de onda do sinal. Contudo, o nvel de degradao to mais baixo quanto maior for a qualidade do amplificador, podendo ser imperceptvel se o amplificador for de boa qualidade. O altifalante , semelhana do que acontece com o microfone, um dispositivo transdutor. S que neste caso o processo o inverso: na entrada do altifalante apresenta-se uma variao de tenso elctrica que ele vai tratar de converter para variaes de presso acstica na sua sada.

H basicamente duas maneiras de efectuar uma gravao analgica: ou por registo magntico em fita magntica ou por enrugamento da superfcie de um disco (caso do vinil). No caso da fita magntica (cassete), o som armazenado de uma forma contnua sob a forma de variaes de magnetismo na prpria fita. No caso de um disco de vinil, por exemplo, a sua superfcie "escavada", de modo a reflectir a variao de amplitude do som que est a ser gravado em relevo na prpria superfcie de vinil. medida que forem envelhecendo, bem como medida que forem mais vezes utilizadas, as gravaes efectuadas sob estes formatos tendem a perder qualidade.

2. udio digital
Em udio digital, a forma de onda de som repartida em amostras individuais, regularmente espaadas no tempo, constituindo uma aproximao forma de onda original. Este processo o que se chama de converso analgico-digital, ou tambm de amostragem.

Por taxa de amostragem ou frequncia de amostragem entende-se o nmero de amostras retiradas da forma de onda original, por segundo. Quanto mais elevada for a taxa de amostragem, melhor ser a aproximao onda original.

A taxa de amostragem limita a gama de frequncias que o sinal a amostrar pode conter, sendo que o limite mximo para essa gama metade do valor da taxa de amostragem. Este valor provm de um teorema muito conhecido na gria do udio: o Teorema de Nyquist. Portanto, para um sinal com frequncias at 8000 Hertz, necessrio que a taxa de amostragem seja maior ou igual a 16000 Hertz. Por exemplo, nos sistemas baseados em Compact Disc Audio (CD), a taxa de amostragem de 44100 Hertz (44100 amostras por segundo), visto que a frequncia mxima que um ouvido humano pode captar de cerca de 20000 Hertz. O som representado ento por uma sequncia de amostras, regularmente espaadas no tempo. Essas amostras so representadas numericamente, em formato digital. Este formato consiste num cdigo, chamado cdigo binrio, em que

os nmeros so representados sob a forma de uma sequncia de bits. Um bit pode apenas apresentar o valor '0' ou o valor '1', retratando dois estados possveis: ligado ('on') ou desligado ('off'). Portanto, se usarmos apenas um bit, apenas temos a capacidade de exprimir dois nmeros. Se acrescentarmos mais um bit, o nmero de combinaes possveis duplica: '00', '01', '10' ou '11', o que significa que j podemos exprimir 2x2= quatro nmeros. O nmero de bits usados para representao determina a preciso (ou resoluo) em amplitude do processo de amostragem referido atrs. Quanto mais bits forem usados, maior ser essa resoluo. Para obtermos uma resoluo equivalente de um sistema CD de udio, so necessrios 16 bits, o que significa que temos 65536 combinaes numricas possveis. Os valores de amplitude amostrados so sempre arredondados para o cdigo binrio mais prximo.

O processo de reproduo o inverso: as amostras so postas em sequncia, entrada de um outro dispositivo, um conversor digital-analgico, que vai tratar de reconstrur o sinal analgico, pronto para ser enviado para um altifalante, por exemplo. Como se pode ver, h sempre qualquer coisa de natureza analgica quando se toma contacto com um sistema, qualquer que seja ele. A gravao digital efectuada armazenando os valores das amostras, bit a bit, em sequncia ordenada. Por exemplo, no caso da gravao em CD, cada bit inscrito numa superfcie reflectora de luz, alterando a caracterstica de reflexo nesse ponto de maneira diferente, conforme se trate de um bit '1' ou '0'. Se a superfcie do CD se mantiver em condies aceitveis, qualquer leitor de CDs ter pouca dificuldade em reconhecer um bit como '0' ou '1'. Assim, uma gravao feita neste formato pode durar "uma vida". H porm um tipo de registo digital que realizado em suporte magntico (como no caso dos discos rgidos nos computadores). As placas de aquisio/reproduo de som presentes nos computadores (mais conhecidas como placas de som) servem como meio intermedirio entre os computadores e o exterior. Elas so capazes de fazer a converso analgico-digital do sinal elctrico proveniente de um microfone, por exemplo, bem como a

converso digital-analgica. As taxas de amostragem e nmero de bits que a placa usa para aquisio no so fixos e podem ser programveis. Quando usamos um programa de computador que faz a aquisio de som atravs da placa de som, ele "diz-lhe" qual a taxa de amostragem e nmero de bits que deve usar para essa aquisio. As amostras de som sero recebidas sequencialmente pelo programa, submetendo-as ao processamento desejado. Quando um programa de computador faz a reproduo de som, a placa de som informada (pelo programa) da resoluo em amplitude (nmero de bits) e do nmero de amostras por segundo com que a converso digital-analgica deve ser realizada, antes do som ser reproduzido. Os dados sero enviados sequencialmente, e a placa de som tratar do resto.

Taxa de Amostragem (Hz): nmero de amostras horizontais, ou seja temporais. Resoluo (bits): cada bit captura 6dB (vertical; amplitude)

Tecnologias de plug-ins e drivers de udio

Srgio Izecksohn

VST, TDM, RTAS, WDM, ASIO, DXi... Todos os que trabalham com udio no computador j se depararam com a sopa de letrinhas. Mas, afinal, o que significam estas siglas e o que ns fazemos com elas? Muito mais importante do que a maioria dos usurios imagina, a escolha correta dentre as diversas tecnologias disponveis pode fazer toda a diferena. A diferena entre um sistema de gravao que funciona e outro que no funciona. Vamos conhecer aqui um pouco sobre os tipos de controladores ou drivers de udio do mercado e tambm as principais tecnologias de plug-ins com efeitos de udio e instrumentos virtuais.

Formatos dos drivers de udio

Os controladores ou drivers so componentes de software que traduzem as linguagens do computador e de uma interface de udio ou placa de som. Todo o trnsito do som entrando e saindo do computador administrado pelo driver. De acordo com o computador e o programa escolhido, devemos adotar um determinado driver. Os drivers so fornecidos com as placas de som. Podemos usar mais de um tipo de driver, mas eventualmente eles podem entrar em conflito e paralisar o computador.

comum o fabricante incluir vrios tipos de drivers com um mesmo produto e o usurio deve escolher o(s) tipo(s) adequado(s) ao seu caso.

Alm da funcionalidade, um critrio decisivo na escolha do driver a latncia ou o atraso percebido entre um comando e a sua execuo. Por exemplo, se tocamos um instrumento virtual e as notas soam um pouquinho atrasadas, estamos com uma latncia perceptvel. E alguns drivers tm menos latncia que outros.

ASIO (Mac, PC), ou Audio Stream Input and Output, provavelmente o controlador de audio multicanal mais popular hoje. Disponibiliza entradas e sadas simultneas em mltiplos canais e, tipicamente, permite trabalhar em baixa latncia. Foi desenvolvido pela Steinberg para seus programas Cubase e Nuendo, mas foi adotada por concorrentes como o Logic e o Sonar. uma tecnologia mais adequada s situaes de gravao ou reproduo multicanal do que aquelas oferecidas pelo Windows ou Mac/OS, mais voltadas para aplicaes estreo de multimdia. As placas de udio com suporte para ASIO permitem um rendimento muito melhor das aplicaes multipista, com melhor sincronismo entre as pistas de udio e melhor compatibilidade entre vrios dispositivos.

Core Audio (Mac) a conexo do Mac OS X entre os programas e os dispositivos de entrada e sada. Com a latncia em torno de 1ms e suporte a multicanais, a Apple pretende que este se torne o driver de udio padro para todos os programas de udio do Macintosh.

DAE (Mac, PC). Diferentemente de muitos outros controladores de udio, este exclusivo para as interfaces da Digidesign. Ao mesmo tempo um driver multicanal e um aplicativo de udio, o DAE roda lado a lado com um programa compatvel como ProTools, Logic ou Digital Performer. Com o DAE, podemos rodar plug-ins RTAS e/ou TDM sem precisar de outro programa.

Direct I/O (Mac,PC). De modo semelhante ao DAE, o Direct I/O usado para a comunicao com as interfaces da Digidesign. S que ele no um aplicativo, simplesmentte um driver de udio multicanal.

GSIF (PC) o tipo de driver otimizado para permitir baixa latncia quando o sampler virtual GigaStudio, da Tascam, para o qual foi desenvolvido, executa os samples direto do hard disk.

MAS (Mac). Proprietrio da Mark Of The Unicorn (MOTU), o MAS controla a gravao de udio do programa Digital Performer. Aceita resolues de at 24 bits/96 kHz. tambm uma arquitetura de plug-ins para efeitos de udio em tempo real.

MME (PC) so MultiMedia Extensions ou extenses de multimdia. o driver de multimdia bsico do Windows, encontrado em placas compatveis com SoundBlaster em geral, inclusive on board. Opera em at 44.1 kHz de amostragem e 16 bits. Mais direcionado para udio estreo, sua operao geralmente caracterizada pela grande latncia (atraso na operao) do udio.

Sound Manager (Mac) o driver padro usado nos computadores Apple Macintosh. Suporta a gravao e a reproduo de udio mono ou estreo em at 16 bits e 44.1 kHz e, assim como o driver MME nos PCs, caracteriza-se pela alta latncia.

WaveDriver (PC) o driver de dois canais multimdia que permite que alguns programas rodem atravs do sistema ProTools LE sobre o Windows XP, mesmo que o software ProTools LE no esteja instalado.

WDM (PC), iniciais de Windows Driver Model, foi desenvolvido pela Microsoft. Assim como o ASIO, um tipo de controlador de udio multicanal. Os iniciantes que usam placas de multimdia no PC (SoundBlaster) com este driver podero usar instrumentos DXi com baixa latncia e plug-ins de efeitos DirectX, inclusive em tempo real. Isto nos permite monitorar e gravar efeitos ao vivo durante a gravao de vozes e instrumentos.

Plug-ins de efeitos e instrumentos

Um plug-in um software que adiciona funcionalidade a um programa maior. Pode ser da mesma marca ou at de um concorrente. Uma vez instalado, passa a fazer parte do menu de funes do programa que o acolhe. Existem plug-ins para artes grficas, navegao na internet, udio e outros. Na rea da produo musical temos duas categorias: efeitos sonoros (eco, equalizador, compressor, redutor de rudos) e instrumentos virtuais (baterias, samplers e sintetizadores). Eles podem funcionar ao vivo ou na edio do udio.

De acordo com os programas e computadores que usamos, temos diversas tecnologias:

DirectX e DXi (PC). O formato de plug-ins DirectX de udio um subconjunto da tecnologia DirectX desenvolvida pela Microsoft para aplicaes de multimdia no Windows. Os efeitos podem ser aplicados em tempo real ou durante a edio do udio. J o DXi, que significa DirectX instrument, um plug-in que representa um instrumento musical, como um sampler ou sintetizador, que pode ser anexado a um programa seqenciador/gravador como o Cubase ou o Sonar para ser tocado e seqenciado como se fosse um teclado de verdade.

Audio Units (Mac). Formato de plug-ins de efeitos e de instrumentos do Mac OS X. Assim como no caso do Core udio, a Apple deseja tornar o formato Audio Units um padro para o Macintosh. Entretanto, alguns fabricantes relutam em adot-lo e preferem desenvolver os seus prprios formatos.

MAS (Mac). Ao mesmo tempo um formato de plug-ins e um tipo de driver, o MAS (MOTU Audio System) s trabalha com os programas Digital Performer e Audio Desk da MOTU.

RTAS (Mac, PC). Real Time Audio Sute um formato de plug-in da Digidesign usado no ProTools. Diferentemente do TDM (abaixo), o plug-in RTAS opera dependendo do poder de processamento da CPU, no de processadores extras.

TDM (Mac, PC) ou Time Division Multiplexing a tecnologia que permite que o udio do ProTools HD seja processado atravs dos processadores DSP adicionados ao computador atravs de placas de expanso PCI. Os plug-ins TDM, ao contrrio dos demais, so processados por esses chips DSP, e no pela CPU, o que alivia o processamento do udio e torna o ProTools HD mais robusto que os concorrentes.

VST e VSTi (Mac, PC). Virtual Studio Technology foi o termo cunhado pela Steinberg para descrever seu formato de plug-ins, instrumentos e seqenciador de udio. VST so os efeitos e VSTi, os instrumentos. Existe uma grande quantidade desses plug-ins e eles so aceitos, alm dos

programas da Steinberg (Cubase e Nuendo), por concorrentes como Sonar e Logic. Os VSTi 2.0 tm inovaes como sincronizao por BPM e troca de timbres (patch change).

Вам также может понравиться