Unicode

De Wikinet
Ir para: navegação, pesquisa
O nome da modelo húngara Enikő Mihalik só pode ser escrito de forma universalmente inteligível graças ao Unicode

Como os primeiros computadores foram construidos nos Estados Unidos, cuja lingua, o ingles, nao usa acentos, nos primordios da informatica os unicos caracteres que os computadores entendiam eram as letras do alfabeto.

Esse codigo se chamava ASCII, e tinha alguns simbolos, os numeros e as letras.

Quando houve a internacionalização da informática, cada um resolveu criar um código diferente para os caracteres acentuados. Essa zona ainda não foi resolvida até hoje, principalmente por causa da Microsoft, que nunca segue os padrões e, como tem um monopólio virtual, acaba impedindo uma padronização global.

A forma de padronizar os acentos, hoje em dia, se chama Unicode. O Unicode pretende ser backward-compatível com o padrão ASCII, assim, os caracteres ASCII são um subconjunto do Unicode. Os caracteres acentuados são gerados através de marcações em bits, mas bla bla bla (foda-se, leia o que é isso na Wikipédia).

A questão é que, como a Microsoft caga e anda para padrões, se você criar um arquivo texto em algum produto da Microsoft, ele não será escrito em Unicode. Por outro lado, se vocẽ criar um texto em Unicode, os leitores de texto da Microsoft não lerão. Isso acontece muito em páginas da internet, que, de vez em quando, aparecem com os caracteres todos cagados, com uns códigos malucos no lugar onde estariam acentos.