sexta-feira, 21 de janeiro de 2011

mp1, mp2, mp3, mp4... mp100!

O significado da sigla
MP3 é uma abreviação de MPEG 1 Layer-3 (camada 3). Trata-se de um padrão de arquivos digitais de áudio estabelecido pelo Moving Picture Experts Group (MPEG), grupo de trabalho de especialistas de Tecnologia da Informação vinculado ao ISO e à CEI. As camadas referem-se ao esquema de compressão de áudio do MPEG-1. Foram projetadas em número de 3, cada uma com finalidades e capacidades diferentes. Enquanto a camada 1, que dá menor compressão, se destina a utilização em ambientes de áudio profissional (estúdios, emissoras de TV, etc) onde o nível de perda de qualidade deve ser mínimo devido à necessidade de reprocessamento, a camada 3 se destina ao áudio que será usado pelo cliente final. Como se espera que esse áudio não sofrerá novos ciclos de processamento, a compressão pode ser menos conservadora e aproveitar melhor as características psicoacústicas do som limitando-se apenas pela qualidade desejada para o ouvido humano.
A compressão típica da camada 1 é de 4:1 a camada 2 é de 8:1 enquanto a da camada 3 é de 11:1. É importante lembrar que essa diferença da compressão não tem a ver com uma camada ser mais avançada que o outra tecnologicamente, mas sim com o objetivo da aplicação do áudio ser processado.
Um erro comum é confundir o MP3 com MPEG-3. MPEG-3 é um formato morto, pois o formato MPEG-4 o suplantou com muitas vantagens. Enquanto o MPEG-3 deveria ter sido um formato para compressão tanto de áudio como de vídeo, o MP3 responde apenas pela terceira camada de compressão de áudio do MPEG-1.

MP3
O MP3 (MPEG-1/2 Audio Layer 3) foi um dos primeiros tipos de compressão de áudio com perdas quase imperceptíveis ao ouvido humano. A sua taxa de compressão é medida em kbps (quilobits por segundo), sendo 128 kbps a qualidade padrão, na qual a redução do tamanho do arquivo é de cerca de 90%, ou seja, o tamanho do arquivo passa a ser 1/10 do tamanho original. A qualidade pode chegar a até 320 kbps (cerca de 2,3 MB/min. de áudio), a qualidade máxima, na qual a redução do tamanho do arquivo é de cerca de 75%, ou seja, o tamanho do arquivo passa a ser cerca de 1/4 do original. Há também outros níveis de qualidade intermediários como 192 kbps, 256 kbps, cuja escolha depende da relação custo-benefício desejada, onde o tamanho do arquivo pode ser reduzido em detrimento da qualidade/fidelidade do som. Para efeitos de comparação, um CD de audio comum possui uma taxa de amostragem de dados equivalente a 1411,2 Kbps.
O método de compressão com perdas empregado na compressão do MP3 consiste em retirar do áudio tudo aquilo que o ouvido humano normalmente não conseguiria perceber, devido a fenômenos de mascaramento de sons e de limitações da audição humana (embora pessoas com ouvido absoluto possam perceber tais perdas). O tamanho dos arquivos em MP3 será maior tanto quanto for maior a sua duração. Para efeito de exemplo, consideremos uma música com 5 minutos de duração. Para armazená-la a uma taxa de 320 kbps, será necessário um espaço de 2,3 MB/min X 5 min. = 11,5 MB. A qualidade padrão, de 128 kbps, necessita de 0,92 MB/min. de áudio para ser armazenado. Um CD-R comum pode armazenar até mais de 12 horas de áudio em MP3 de 128 kbps.

História
Início de 1970: O professor Dieter Seitzer da Universidade Erlangen-Nuremberg na Alemanha depara-se com o problema de transmitir fala em alta qualidade através de linhas telefônicas. Ele inicia então um grupo de pesquisa em codificação de áudio.
Fim de 1970: Em virtude do surgimento do ISDN (Integrated Service Digital Network) e cabos de fibra óptica para telecomunicações, melhorar a codificação de voz pareceu pouco importante, então o professor Seitzer iniciou a pesquisa em codificação de sinais de música.
1979: O grupo do professor Seitzer desenvolveu o primeiro processador de sinais digitais capaz de realizar a compressão de áudio. Um dos estudantes, Karlheinz Brandenburg, começou a implementar princípios da psicoacústica na codificação de áudio.
1987: A Universidade Erlangen-Nuremberg realizou uma parceria com o Instituto Fraunhofer.
1988: Estabeleceu-se o MPEG (Moving Picture Experts Group), grupo de trabalho da ISO (International Organization for Standardization) responsável por desenvolver padrões para a compressão de áudio e vídeo digitais.
1989: Brandenbeurg finalizou sua tese de doutorado onde apresentava o algoritmo OCF (Optimum Coding in the Frequency Domain). Tal codec possuía várias características da atual tecnologia MP3 e era um sistema de tempo real.
1991: Melhoras no algoritmo OCF somadas a contribuições da Universidade de Hannover, dentre outras, produziram um novo codec de áudio chamado ASPEC (Adaptative Spectral Perceptual Entropy Coding). O ASPEC foi um dos 14 trabalhos enviados para a ISO como proposta de codificação de áudio. Após testes rigorosos, a ISO sugeriu que a codificação de áudio apresentassem 3 abordagens em escala de complexidade e eficiência:
Layer 1 e Layer 2, mais simples, baseadas em um outro codec enviado à ISO, o MUSICAN,
Layer 3 , de alta eficiência e maior complexidade, baseada no ASPEC.
O ASPEC evolui então para o codec MP3 - MPEG-1 Layer 3.
1995: Os pesquisadores de Fraunhofer votaram ' .mp3 ' como a extensão de arquivos MPEG Layer 3. Disponibilizou-se o codec do Layer 3 como shareware.
1997: Michael Robertson constrói o site 'mp3.com', onde disponibiliza informações e tudo mais relacionado à tecnologia MP3.
1998: Surgem os primeiros players portáteis de MP3, usando memória flash.
2000: Surgem no mercado dos EUA CD players com funcionalidades de mp3.
2006: Na Alemanha, MP3 gera mais de 10.000 postos de trabalho e aproximadamente 300 milhões de euros de impostos. Os alemães gastam em média 1,5 bilhões de euros em MP3 players e produtos relacionados.

Após a grandiosa fama na Internet, o MP3 causou grande revolução no mundo do entretenimento. Assim como o LP de vinil, o cassete de áudio e o CD, o MP3 se fortaleceu como um popular meio de distribuição de canções. A questão chave para entender todo o sucesso do MP3 se baseia no fato de que, antes dele ser desenvolvido, uma música no computador era armazenada no formato WAV, que é o formato padrão para arquivo de som em PCs, chegando a ocupar dezenas de megabytes em disco.
Na média, um minuto de música corresponde a 10 MB para uma gravação de som de 16 bits estéreo com 44,1 KHz, o que resulta numa grande complicação a distribuição de músicas por computadores, principalmente pela Internet. Com o surgimento do MP3 essa história mudou, pois o formato permite armazenar músicas no computador sem ocupar muito espaço e sem tirar a qualidade sonora das canções. Geralmente, um minuto de música corresponde a cerca de 1 MB em MP3. O MP3 (MPEG-1/2 Audio Layer 3) foi um dos primeiros tipos de arquivos a comprimir áudio com perda de dados, com eficiência, de forma quase imperceptível ao ouvido humano.
Ao se popularizar, o formato MP3 deixou consequentemente a indústria fonográfica preocupada com seus lucros. O MP3 alcançou um sucesso tão grande que, quando as gravadoras se deram conta, o formato já estava presente em milhões de computadores em todo o mundo.
A cantora americana Suzanne Vega é considerada a "mãe" do mp3. Um artigo[1] publicado pelo New York Times, escrito pela própria cantora, revela que sua voz, na canção a cappella Tom's Diner, de 1986, serviu de referência auditiva para Brandenbeurg realizar os ajustes finais dos parâmetros de compressão do mp3. Ou seja, os mesmos parâmetros empregados para que a voz de Suzanne Vega fosse ouvida de maneira satisfatória por Brandenbeurg na canção Tom's Diner são os parâmetros empregados para a compressão de todo o áudio no formato mp3 até hoje.

Princípios
As taxas de compressão alcançadas pelo MP3 chegam a até 12 vezes, dependendo da qualidade desejada. Para fazer isso o MP3 utiliza-se, além das técnicas habituais de compressão, de estudos de psicoacústica, sendo que estes permitem aproveitar-se das limitações e imperfeições da audição humana.
A utilização dos limites da audição humana baseia-se em três princípios básicos:
1. Faixa de frequência audível dos seres humanos;
2. Limiar de audição na faixa de frequência audível;
3. Mascaramento em frequência e mascaramento temporal.
* Faixa de frequência audível humana: O ouvido humano, devido às suas limitações físicas, é capaz de detectar sons em uma faixa de frequência que varia de 20 Hz a 20 KHz, sendo que estes valores podem variar de indivíduo para indivíduo e também com a idade (com o envelhecimento perdemos a capacidade de ouvir frequências mais altas). Desta forma, não faz sentido armazenar dados referentes a sons fora desta faixa de frequência, pois ao serem reproduzidos, os mesmos não serão percebidos por um ser humano. Esta é a primeira limitação da audição humana do qual o sistema MP3 faz uso para alcançar altas taxas de compressão. De acordo com o Teorema de Nyquist, para garantir a reprodução de um sinal, temos de amostrá-lo pelo menos a duas vezes sua frequência máxima. Ou seja, neste caso, como a frequência máxima de interesse é 20 KHz, basta amostrar a 40 KHz. Utilizam-se 44.100 Hz como taxa de amostragem, pois levam-se em consideração 10% de tolerância e busca-se um valor produto dos quatro primeiros números primos. (Obs. (2x3x5x7)^2 = 44100). Desta forma, esta taxa de amostragem funciona como um filtro passa-baixas, que remove todos os componentes de frequência fora da faixa de interesse, neste caso, acima de 20 Khz.
* Limiar de audição na faixa de frequência audível: Outro fator utilizado pela codificação MP3 é a curva de percepção da audição humana dentro da faixa de frequências audíveis, ou limiar de audição. Apesar da faixa de audição humana variar entre 20 Hz e 20 KHz, a sensibilidade para sons dentro desta faixa não é uniforme. Ou seja, a percepção da intensidade de um som varia com a frequência em que este se encontra. Desta forma, o MP3 utiliza-se desta propriedade para obter compressão em arquivos de áudios. Esta abordagem é bastante intuitiva, sendo que o que se faz é descartar amostras que se encontrem abaixo deste limiar.
* Mascaramento em frequência e mascaramento temporal: Por fim, uma última propriedade da audição humana ainda é utilizada pelo método é o chamado mascaramento auditivo, ou “audiabilidade diminuída de um som devido à presença de outro”, podendo este ser em frequência ou no tempo. O mascaramento em frequência ocorre quando um som que normalmente poderia ser ouvido é mascarado por outro, de maior intensidade, que encontra-se em uma frequência próxima. Ou seja, o limiar de audição é modificado (aumentado) na região próxima à frequência do som que causa o ocorrência do mascaramento, sendo que isto se deve à limitação da percepção de frequências do ouvido humano. O mascaramento em frequência depende da frequência em que o sinal se encontra, podendo variar de 100 Hz a 4 KHz. Em função deste comportamento, o que o método de compressão do MP3 faz é identificar casos de mascaramento em frequência e descartar sinais que não serão audíveis devido a este fenômeno. Além do mascaramento em frequência, temos ainda o mascaramento no tempo, sendo que este ocorre quando um som forte é precedido por um mais fraco que encontra-se em uma frequência próxima à do primeiro. Se o intervalo de tempo entre os dois for suficientemente pequeno, este som mais fraco não será percebido pela audição humana. Se um som é mascarado após um som mais forte, temos o chamado pós-mascaramento. No caso de um som ser mascarado antes do som mais forte, temos o que chamamos de pré-mascaramento. O pré-mascaramento existe só por um curto momento, cerca de 20ms, enquanto que o pós-mascaramento tem efeito por até 200ms. O método de compressão do MP3 utiliza-se portanto deste fenômeno, identificando casos onde o mesmo ocorre e descartando sons que seriam mascarados, o que permite reduzir a informação de áudio consideravelmente sem mudança audível.

Licenças e patentes
A Thomson Consumer Electronics controla o licenciamento da patente do MPEG-1/2 Layer 3 nos poucos países que reconhecem patentes de software, tais como Estados Unidos e Japão.
Em setembro de 1998, o Instituto Fraunhofer enviou um comunicado a diversos desenvolvedores de programas MP3, exigindo cobrança de royalties por essa patente. O comunicado informava que o licenciamento era necessário para "distribuir e/ou vender decodificadores e/ou codificadores", e que os produtos não licenciados infringiam os "direitos sobre a patente do Instituto Fraunhofer e da Thomson. Para produzir, vender e/ou distribuir produtos que se utilizem do padrão MPEG-1/2 Audio Layer 3 e, portanto, de suas respectivas patentes, é necessário obter uma licença."
Tal iniciativa revelou a necessidade de promover formatos realmente livres, como o padrão ogg vorbis.
De notar que passados 20 anos da existência do MPEG-1, e consequentemente do MP3, a licença passará a ser livre, tornando-se este codificador propriedade da humanidade.

Streaming
O sistema empregado pelo MP3 também possibilita transmissões por streaming, onde o arquivo pode ser interpretado à medida que é feito o download ou em que é baixado (não é necessário que o arquivo chegue inteiro para iniciar a reprodução).

Mp4
Mp4 refere-se especificamente a MPEG-4 Part 14. Um padrão de container de áudio e vídeo que é parte da especificação MPEG-4 desenvolvido pela ISO/IEC 14496-14. A extensão oficial do nome do arquivo é .mp4, por isso é comum vermos o formato ser chamado assim.
É similar ao popular AVI, mas traz algumas vantagens: Suporte nativo a legendas embutidas (AVI também pode ter, mas só através de hacks como o usado no DivX6); Melhor suporte ao padrão de codificação de vídeo H.264, também conhecido como MPEG4 AVC. Estando codificado, um arquivo MP4 pode ter sido criado com diversos tipos de codec diferentes, incluindo DivX e XviD. Porém como DivX e XviD são relativamente bem atendidos pelo arquivo codificado AVI (que é muito mais popular), é mais comum você encontrar um MP4 que seja constituído por streams criados por codecs incomuns.

Implementação
MP4 foi publicado em 1999 mas só começou a ser usado em meados dos anos 2000. O formato permite vídeos de alta definição, e por isso foi rapidamente adotado pela industria como container para este tipo de aplicação.
A primeira implementação foi no programa Nero Recode que permitia uma maior qualidade de compressão para videos e DVDs. MP4 foi também o codec escolhido pela Apple para ser usado na 5a geração do iPod. Também chamado de iPod Video. O formato MP4 vem se firmando como o padrão para a venda e o aluguel de filmes de alta definição na Internet através do iTunes, PlayStation Network e Netflix. Porém, tem sido preterido pelo formato Matroska (MKV) para distribuição de filmes por torrent.

Tocadores de MP4
Hoje, é comum encontrar, no comércio brasileiro, aparelhos com tela LCD chamados de "tocadores de MP4", o que sugere a compatibilidade com tal codec. Mas a maioria desses aparelhos é assim chamada simplesmente por reproduzirem vídeo, diferentes, pois, dos "tocadores de MP3", que só reproduzem áudio. Na realidade, quase todos esses aparelhos são incompatíveis com MP4, ainda que a palavra "mp4" esteja presente. O usuário é obrigado a converter seus filmes para o formato AMV ou outro formato similar de baixa resolução mediante programa específico.
MP5, MP6, MP7, MP20, etc
Como "evolução" do nome mercadológico do MP3 (áudio) para MP4 (áudio e vídeo) usado nesses players, vários aparelhos são vendidos com as siglas MP5, MP6, MP7, etc, chegando até MP20. Porém essas siglas nada significam em termos de padrões de tecnologia, não existem codificadores Mp5, Mp12 ou similares. Um dos motivos do uso das siglas é o proprio marketing barato de vender uma suposta evolução de tocador de áudio/video, mas com diversos incrementos como acesso a rede de telefonia celular, TV, câmeras digitais, Wi-Fi,2 câmaras, entre outros recursos. Muitos desses tocadores possuem qualidade de imagem pior que o proprio padrão MP4 original.

Mp4 vs. Mp3
Em decorrência da similaridade dos nomes, há quem pense ser o MP4 a evolução do já popular MP3, mas, na verdade, trata-se de tecnologias diferentes. O MP3 (MPEG-2 Audio Layer 3) é um codec de áudio, enquanto o MP4 contém áudio e vídeo. Mas ao estar codificado, o MP4 também contém compressão de áudio (assim como o MP3).

Softwares compatíveis
* Amarok
* Banshee Music Player
* foobar2000
* iTunes
* KSP Sound Player
* Media Player Classic
* MPlayer
* QuickTime Player
* RealPlayer
* The KMPlayer
* VLC media player
* Winamp
* Xine
* Nero Burning ROM (Nero ShowTime)
* PSP (Playstation Portatil)
* Microsoft Zune
* Bs Player
* Alguns modelos de celulares NOKIA, tais como: N82, N73, N95, etc...

Nenhum comentário:

Postar um comentário

Clique na pagina 5 para visualizar outras posts /\