Internacionalização, localização, codificação, Islândia e tradução de um site de fotos de gatos japoneses

tradução de internacionalização

InternacionalizaçãoExistem muitas informações por aí quando se trata de internacionalização, localização e codificação em aplicativos da web. Também há muitos mal-entendidos sobre o que cada um fornece para um aplicativo da web. Aqui está minha opinião ...

Quando um navegador da web faz uma conexão com um servidor da web, ele passa algumas variáveis ​​e faz solicitações adicionais. Aqui está um exemplo:

GET / HTTP / 1.1
Anfitrião: www.dknewmedia.com
Agente do usuário: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Aceitar: HTTP Aceitar = texto / xml, aplicativo / xml, aplicativo / xhtml + xml, texto / html; q = 0.9, texto / simples; q = 0.8, imagem / png, * / *; q = 0.5
Idioma de aceitação: en-us, en; q = 0.5
Aceitar-Codificação: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internacionalização

A internacionalização é um composto de muitas coisas:

  1. Localização: A capacidade de identificar de qual idioma e local um visitante está visitando. Isso é feito por meio de solicitações HTTP, em que o visitante é identificado por um local. No meu caso, isso é en-US. “En” é o inglês e “US” é os Estados Unidos. Esta é uma configuração do meu sistema operacional.
  2. Fusos horários: A capacidade de ajustar os fusos horários. Isso normalmente é feito configurando seu servidor para o Horário de Greenwich (GMT) e, em seguida, permitindo que os usuários definam seu deslocamento local do GMT.
  3. Codificação de caracteres: Esta é a capacidade de exibir conjuntos de caracteres de idioma corretamente. É diferente da localização, pois a localização pode me dizer o idioma e a região do computador que está fazendo a solicitação, mas não me diz o idioma leitor está solicitando ... isso depende do leitor!

Observe em meu cabeçalho HTTP quando o navegador fez a solicitação, ele disse ao servidor que estava solicitando minha localidade (Accept-Language: en-us); no entanto, ele também precisa informar ao servidor qual conjunto de caracteres é solicitado (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 e utf -8 são conjuntos de caracteres permitidos.

Localização

Neste mundo fantástico e confuso, a localização nunca mais dita o idioma. Embora eu esteja em en-US, posso absolutamente ler em um idioma diferente usando um conjunto de caracteres diferente ... é o que acontece quando eu uso Hindi do Google (Eu realmente não uso o Google Hindi). Minha solicitação de localidade e conjunto de caracteres são idênticos a quando solicito o Google inglês página, mas na verdade sou alimentado com uma página que não consigo ler porque não tenho o conjunto de caracteres. Tudo vem à tona ??????????? ... No entanto, posso carregar esse conjunto de caracteres no Firefox (Firefox> Preferências> Avançado> Idiomas):

Idioma de carregamento do Firefox

Se eu carregar esse idioma, poderei solicitar a página em seu conjunto de caracteres nativos e exibi-la no meu computador, embora meu local padrão seja en-US!

Então ... se eu sou um estudante hindi, estudando inglês em Purdue e conectado via VPN para o servidor da escola, em férias na Austrália ... existem 3 configurações diferentes que precisam ser aplicadas ao aplicativo para ser verdadeiramente internacionalizado - e Nenhum dependem do outro.

Minha localidade viria como en-US, mas meu fuso horário é Austrália, mas o idioma que estou solicitando no site pode ser hindi. Se eu fosse programar minha inscrição para fazer suposições com base na localidade do meu computador, eu estaria totalmente errado - alimentar a pessoa em inglês no fuso horário do leste. Idealmente, eu programaria meu aplicativo para oferecer ambos configurações de idioma e fuso horário ... mas eu não as assumiria com base na localidade.

Islândia - o melhor exemplo

Não conhecemos os desafios de vários idiomas e locais nos Estados Unidos, onde todos os falar inglês [sarcasmo implícito]. Em alguns países, como a Islândia, embora a língua nativa seja o islandês, o incrível povo islandês cresce aprendendo 3 línguas! Como a Islândia é um país no meio da Europa e da América do Norte, suas empresas trabalham em vários continentes, idiomas, dialetos de idiomas e vários fusos horários em seus desktops!

Muitos sites islandeses são construídos em inglês dos Estados Unidos, inglês do Reino Unido, islandês, espanhol, espanhol, francês e alemão! Imagine como seria desafiador construir Icelandair's aplicativos de sites e sistemas de bilhetagem ... uau!

AVISO DE RESPONSABILIDADE: Tive o prazer absoluto de trabalhar com o pessoal da Icelandair e posso dizer que eles são alguns dos profissionais mais talentosos e amigáveis ​​com quem tive o prazer de trabalhar. É simplesmente um país e pessoas incríveis! Visite ... leve a Icelandair e não deixe de visitar o Blue Lagoon!

Linguagem versus codificação

Existem até codificações de caracteres diferentes em um único idioma que não funcionam bem entre si! Exemplo: Um e-mail em japonês escrito em Shift-JIS pode ficar ilegível no computador de um japonês com a localização definida como ja-JP porque o servidor de e-mail reconhece apenas EUC-JP. Idealmente, um cliente deve ser capaz de definir qual codificação deseja, bem como qual idioma - simplesmente garantindo que a codificação e o idioma sejam compatíveis com o que o cliente está solicitando.

Se eu quiser ler japonês, posso ter que selecionar japonês como meu idioma E Shift-JIS para codificação para exibir esse idioma corretamente. Aqui está mais alguma confusão para adicionar à mistura ... alguns tipos de codificação suportam vários idiomas. UNICODE / UTF8 suporta dezenas. O inverso também é verdadeiro. Alguns idiomas podem ser lidos em muitos tipos de codificação. Se isso não faz sentido ... Peço desculpas, é uma questão muito complexa.

Algum dia eu acredito (espero) que tudo isso mude. Acho que os designers originais dos códigos de localização esperavam que a combinação idioma-país fosse tudo o que fosse necessário ... mas nos tornamos muito mais sofisticados. Lembre-se, muito disso foi desenvolvido antes da existência da Internet. Com o advento de GIS, talvez uma pessoa possa selecionar sua codificação e o GIS manipularia as informações de fuso horário e local.

Internacionalização

Voltar para Suporte à internacionalização. Se você deseja fornecer um aplicativo internacionalizado, você precisa:

  1. Suporta vários tipos de codificação, idiomas e possui arquivos de tradução para exibir essas traduções.
  2. Permita que o cliente defina seu idioma e até mesmo seu tipo de codificação, se necessário.
  3. Ofereça suporte a fusos horários, permitindo que os usuários consultem seus fusos horários em comparação com o GMT.
  4. Use os códigos de localização com cuidado ... eles NÃO representam com precisão o que o usuário está realmente solicitando, nem o que ele pode ler.

Tradução

A tradução automática ainda está em sua infância. Existem vários sites por aí (e WordPress Plugins) que oferecem tradução automática do seu site. Não fique tentado a fazer isso ... há dois motivos:

  1. Se a tradução automática funcionar, o usuário que está verificando o seu site já terá um tradutor para trabalhar.
  2. A tradução automática é uma merda.

Não acredita em mim? Aqui está uma tradução em japonês para você:
Colado de Arquivo Masatsu - um cara com uma tonelada de fotos de gatos:

Artigo de blog japonês

???
- 00:29:35 por masatsu

???????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
????????????????????????????????

??????????????????????????????????????????????????? (?)

?????????????????

??????????????
???
???

???????????????????????????????????????

???????????????????????????????

??????????????????????????????????????
????????????????????????????????????
?????????? Ag ?????????????

?????????????????????????????????????

Maquina de tradução:

?? Han?????
-00: 29: 35 por masatsu

O nome do primeiro santo de um / o elefante que apareceu na frota de “a / the beast fist ?? guarda" "?? Hann ???? ” com um / o ator de rádio Yutaka Mizushima….

? (?) isso faz chocos prontamente.

Porque até o radialista do primeiro santo, mestre ????? de um / o gato são o marmelo chinês de um Nagai Ichiro = bola de dragão o cajado de um / o ?? ranger parece com as pessoas que o comentário espirituoso sabe prontamente.

?????? (O suor) que ia esquecendo completamente este ano “o segredo do nome da super frota”, de prática habitual todos os anos?,

?????? Se eu escrever atrasado este ano,

??????? santuário ??? (pode como?)? Cullion do promontório (?? não cortar) Fukami ?? (? ou observar capaz de?) e / o é que faz

?????? Com, torna-se “um can /? /?”, Ou seja, “kung fu”, quando alinhar e trocar a cabeça de a / o nome.

?????? Embora seja dito para aumentar mais dois, supostamente, pode se tornar que tipo de nome.

Diz-se que a verdade é “idade” porque o símbolo do elemento prata é Ag?, Embora o nome de “o ???? prata ”o Takaoka? técnico de ??????? estava pensando que o personagem se chamava “?” foi usado com a associação de um filme silver'screen, se o chamar com um membro adicional.

?????? No entanto, estou pensando egoisticamente, que minha teoria não está relacionada a que “?” está incluído em um / o caractere chinês.

Tenho certeza de que inverter a polaridade nesta tradução forneceria uma dicção legível em inglês. Você entendeu a entrada, certo?

2 Comentários

  1. 1

O que você acha?

Este site usa o Akismet para reduzir o spam. Saiba como seus dados de comentário são processados.