Alfabeto latino básico ISO – Wikipédia, a enciclopédia livre

O alfabeto latino básico ISO é um alfabeto latino e consiste de dois conjuntos de 26 letras (maiúsculas e minúsculas), codificado em vários padrões nacionais e internacionais e de uso amplo na comunicação international.

Os dois conjuntos contém a seguir 26 letras cada:[1][2]

Alfabeto latino maiúsculas
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Alfabeto latino – minúsculas
a b c d e f g h i j k l m n o p q r s t u v w x y z

Na década de 1960 tornou-se evidente para as indústrias da computação e telecomunicações do primeiro mundo que era necessário um método não-proprietário de caracteres de codificação. A Organização Internacional para Padronização (ISO) encapsulou o alfabeto latino no padrão (ISO 646) em codificação de caracteres de 7-bit deles. Para alcançar ampla aceitação, este encapsulamento foi baseado no uso popular. O padrão foi baseado na já publicada American Standard Code for Information Interchange, mais conhecida como ASCII, no qual inclui no conjunto de caracteres, as 26 × 2 letras do alfabeto do inglês. Normas posteriores emitidas pela ISO, por exemplo ISO/IEC 8859 (codificação de caracteres 8-bit) e ISO/IEC 10646 (Escrita latina em Unicode), continuaram a definir 26 × 2 letras do alfabeto da língua inglesa como a escrita básica latina com extensões para lidar com outras letras em outras línguas.[1]

Nome para o bloco Unicode que contém todas as letras

[editar | editar código-fonte]

O Bloco Unicode que contém o alfabeto é chamado "C0 Controls and Basic Latin".

Nomes para dois subconjuntos

[editar | editar código-fonte]

Em Unicode 7.0 dois subtítulos existem:[3]

  • "Uppercase Latin alphabet" (Alfabeto latino maiúsculo), letras individuais que contém a cadeia de caracteres LATIN CAPITAL LETTER[Nota 1] (i.e., "letra latina de caixa-baixa") nas descrições deles
  • "Lowercase Latin alphabet" (Alfabeto latino minúsculo), letras individuais que contém a cadeia de caracteres LATIN SMALL LETTER (i e., "letra latina de caixa-baixa") nas descrições correspondentes da organização.

Nomes para as letras

[editar | editar código-fonte]

As letras também estão contidas em "Halfwidth and Fullwidth Forms" (Formas Semi-larga e Larga) FF00 para FFEF[4]

FF21 A FULLWIDTH LATIN CAPITAL LETTER A FF41 a FULLWIDTH LATIN SMALL LETTER A 

Cronologia para padrões de codificação

[editar | editar código-fonte]
  • 1865: O Código Morse Internacional foi padronizado no Congresso International Telegráfico em Paris, e foi posteriormente feito o padrão pela União International de Telecomunicações (UIT)l
  • Década de 1950: Alfabeto ortográfico de Radiotelefonia pela ICAO [1]

Cronologia para códigos de computador amplamente utilizados com suporte à alfabetos

[editar | editar código-fonte]
  • 1963: ASCII (padrão codificação de caracteres de 7-bit da American Standards Association, que se tornou ANSI em 1969)
  • 1963/1964: EBCDIC (desenvolvida pela IBM e suportando o mesmo caracteres alfabéticos como ASCII, mas com diferentes valores de código)
  • 1972: ISO 646 (padrão codificação de caracteres de 7-bit ISO, usa o mesmo códigos alfabético valendo como ASCII, revisado na segunda edição ISO 646:1983 e na terceira edição ISO/IEC 646:1991 como um padrão ISO/IEC comum)
  • 1983: ITU-T Rec. T.51 | ISO/IEC 6937 (uma extensão multi-byte do ASCII)
  • 1987: ISO/IEC 8859-1:1987 (codificação de caracteres de 8-bit)
    • Subsequentemente outras versões e partes do ISO/IEC 8859 publicadas.
  • Meio-para-o-final da década de 1980: Windows-1250, Windows-1252, e outras codificações são usadas no Microsoft Windows (alguns realmente semelhantes à ISO/IEC 8859-1)
  • 1990: Unicode 1.0 (desenvelvida pela Unicode Consortium),[5][6] continha no bloco "C0 Controls and Basic Latin" utilizando os mesmos valores de código alfabéticos como ASCII e ISO/IEC 646
    • Subsequentemente outras versões de Unicode foram publicadas subsequentemente, e mais tarde vieram um padrão ISO/IEC comum assim, tal como identificado abaixo.
  • 1993: ISO/IEC 10646-1:1993, padrão ISO/IEC para caracteres em Unicode 1.1
    • Subsequentemente outras versões de ISO/IEC 10646-1 e um de ISO/IEC 10646-2 foram publicadas. Desde 2003, os padrões foram publicados sob o nome de "ISO/IEC 10646" sem a separação em duas partes.

Representação

[editar | editar código-fonte]
Algarismos indo-arábicos e letras do alfabeto básico latino ISO em um 16-segment display

Em ASCII as letras pertencem aos caracteres imprimíveis e em Unicode, desde a versão 1.0 eles pertencem ao bloco "C0 Controls and Basic Latin". Em ambos casos, assim como em ISO/IEC 646, ISO/IEC 8859 e ISO/IEC 10646 ele estão ocupando as posições em notação hexadecimal 41 à 5A para caixa-alta e 61 à 7A para caixa-baixa.

Exceto as maiúsculas e minúsculas, todas as letras tem palavras-código no alfabeto fonético da OTAN e podem ser representados com código Morse.

Todas as letras minúsculas são utilizados no Alfabeto fonético internacional (IPA). Em X-SAMPA e SAMPA aquelas letras tem o mesmo valor de som como no IPA. Em Kirshenbaum eles tem o mesmo valor exceto para a letra r.

Alfabetos que contém o mesmo conjunto de letras

[editar | editar código-fonte]

A próxima lista apenas contém alfabetos em que não há:

  • letras com sinais diacríticos que constituem letras distintas.
  • multígrafos que constituem letras distintas.
alfabeto diacrítico multígrafos (não constituindo distintas letras) ligaturas
Alfabeto africâner á, é, è, ê, ë, í, î, ï, ó, ô, ú, û, ý
Alfabeto catalão à, é, è, í, ï, ó, ò, ú, ü, ç
Alfabeto neerlandês ä, é, è, ë, ï, ö, ü dígrafo ⟨ij⟩ é às vezes considerado sendo uma letra separada. Quando é este o caso, é geralmente retirado ou é mesclardo com "y".
Alfabeto inglês sh, ch, ea, ou, th, ph, ng, zh æ, œ
Alfabeto francês à, â, ç, é, è, ê, ë, î, ï, ô, ù, û, ü, ÿ ⟨ai⟩, ⟨au⟩, ⟨ei⟩, ⟨eu⟩, ⟨oi⟩, ⟨ou⟩, ⟨eau⟩, ⟨ch⟩, ⟨ph⟩, ⟨gn⟩, ⟨an⟩, ⟨am⟩, ⟨en⟩, ⟨em⟩, ⟨in⟩, ⟨im⟩, ⟨on⟩, ⟨om⟩, ⟨un⟩, ⟨um⟩, ⟨yn⟩, ⟨ym⟩, ⟨ain⟩, ⟨aim⟩, ⟨ein⟩, ⟨oin⟩, ⟨aî⟩, ⟨eî⟩ æ, œ
Alfabeto alemão ä, ö, ü ⟨sch⟩, ⟨qu⟩, ⟨ch⟩, ⟨ph⟩, ⟨ng⟩, ⟨ie⟩, ⟨ck⟩, ⟨ei⟩, ⟨eu⟩, ⟨äu⟩ ß
Alfabeto ido ⟨qu⟩, ⟨ch⟩, ⟨sh⟩
Alfabeto indonésio ⟨kh⟩, ⟨ng⟩, ⟨ny⟩, ⟨sy⟩
Interglossa
Interlíngua ⟨qu⟩
Alfabeto luxemburguês ä, é, ë
Alfabeto malaio ⟨kh⟩, ⟨ng⟩, ⟨ny⟩, ⟨sy⟩
Alfabeto ocidental
Alfabeto português ã, õ, á, é, í, ó, ú, â, ê, ô, à, ç ch⟩, ⟨lh⟩, ⟨nh⟩, ⟨rr⟩, ⟨ss⟩, ⟨am⟩, ⟨em⟩, ⟨im⟩, ⟨om⟩, ⟨um⟩, ⟨ãe⟩, ⟨ão⟩, ⟨õe⟩

O inglês é a única língua europeia moderna principal que não requer diacríticos para palavras nativas (embora um trema é usado por algumas editoras em palavras como em "coöperation").[7][8]

Nota para Português:

k, w e y foram parte do alfabeto até várias reformas ortográficas durante o século XX, cujo objetivo era mudar a ortografia etimológica do português numa ortografia fonética mais fácil. Estas letras foram substituídas por outras letras que contenham o mesmo som: assim psychologia torna-se psicologia, kioske torna-se quiosque, martyr torna-se mártir, etc. Hoje em dia k, w, e y são apenas encontradas em palavras estrangeiras e seus termos derivados e em abreviaturas científicas (p. ex. km, byronismo). Estas letras foram consideradas novamente como parte do alfabeto a partir do Acordo Ortográfico de 1990, que entrou em vigor em 1 de janeiro de 2009 no Brasil.
  1. Em Unicode, os nomes ou nomenclaturas dados aos caracteres seguem este padrão (caixa-alta).
  1. a b "Internationalisation standardization of 7-bit codes, ISO 646".
  2. "RFC1815 – Character Sets ISO-10646 and ISO-10646-J-1".
  3. http://www.unicode.org/charts/PDF/U0000.pdf
  4. http://www.unicode.org/charts/PDF/UFF00.pdf
  5. "Unicode character database".
  6. The Unicode Standard Version 1.0, Volume 1.
  7. As an example, an article containing both a diaeresis "coöperate" and a cedilla in "façades" (Grafton, Anthony (2006-10-23).
  8. «Cópia arquivada». Consultado em 12 de dezembro de 2015. Arquivado do original em 16 de dezembro de 2010