ASCII
Contexte des ??coles Wikip??dia
Arrangeant une s??lection Wikipedia pour les ??coles dans le monde en d??veloppement sans internet ??tait une initiative de SOS Enfants. SOS Children travaille dans 45 pays africains; pouvez-vous aider un enfant en Afrique ?
Le code standard am??ricain pour l'??change d'information (ASCII, prononciation: / ?? s k Je / ASS -kee;) est une syst??me de codage de caract??res ?? l'origine bas?? sur la Alphabet anglais. codes ASCII repr??sentent texte dans les ordinateurs , les communications ??quipement, et d'autres dispositifs qui utilisent texte. La plupart des syst??mes de codage de caract??res modernes sont bas??s sur ASCII, bien qu'ils soutiennent de nombreux caract??res suppl??mentaires.
ASCII d??velopp?? ?? partir de codes t??l??graphiques. Sa premi??re utilisation commerciale ??tait aussi un cycle de sept bit code de t??l??imprimeur promu par les services de donn??es de Bell. Les travaux sur la norme ASCII a commenc?? le 6 Octobre 1960, avec la premi??re r??union de la (ASA) le sous-comit?? de X3.2 American Standards Association. La premi??re ??dition de la norme a ??t?? publi??e en 1963, une r??vision majeure en 1967, et la mise ?? jour la plus r??cente en 1986. Par rapport aux codes t??l??graphiques ant??rieures, le code de Bell propos?? et ASCII ont tous deux ??t?? ordonn?? pour le tri plus pratique (ce est ?? dire, l'alphab??tisation) de des listes et des fonctionnalit??s suppl??mentaires pour des appareils autres que les t??l??scripteurs.
ASCII comprend des d??finitions pour 128 caract??res: 33 sont non-impression caract??res de contr??le (nombre d??sormais obsol??te) qui affectent comment le texte et l'espace sont trait??es et 95 caract??res imprimables, y compris le espace (qui est consid??r?? comme un graphique invisible).
Le IANA pr??f??re le nom US-ASCII pour ??viter toute ambigu??t??. ASCII ??tait encodage la plus couramment utilis??e de caract??res sur le World Wide Web jusqu'en D??cembre 2007, quand il a ??t?? d??pass?? par UTF-8.
Histoire
Le code standard am??ricain pour l'??change d'information (ASCII) a ??t?? ??labor?? sous les auspices d'un comit?? de l'American Standards Association, appel?? le comit?? de X3, par son X3.2 (plus tard X3L2) sous-comit??, et plus tard par le groupe de travail X3.2.4 de ce sous-comit?? . L'ASA est devenu aux Etats-Unis d'Am??rique Standards Institute ou USASI et finalement le American National Standards Institute.
L'ASCII con??u du sous-comit?? de X3.2 selon la plus rapproch??e syst??mes de codage de t??l??imprimeur. Comme les autres codages de caract??res, ASCII sp??cifie une correspondance entre les mod??les et de bits num??riques symboles de caract??res (c.-??- graph??mes et des caract??res de contr??le). Ceci permet appareils num??riques de communiquer les uns avec les autres et pour traiter, stocker et communiquer des informations orient??es caract??re tels que la langue ??crite. Avant ASCII a ??t?? d??velopp??, les codages utilis??s inclus 26 caract??res alphab??tiques, 10 caract??res num??riques , et de 11 ?? 25 symboles graphiques sp??ciaux. Pour inclure tous ces personnages, et de contr??le compatibles avec le Comit?? Consultatif International T??l??graphique et T??l??phonique (CCITT) Alphabet t??l??graphique international n ?? 2 (ITA2) standard, Fieldata, et au d??but EBCDIC, plus de 64 codes ont ??t?? n??cessaire pour ASCII.
Le comit?? a discut?? de la possibilit?? d'une d??caler touche de fonction (comme le Code Baudot), ce qui permettrait plus de 64 codes d'??tre repr??sent??s par six bits. Dans un code d??cal??, certains codes de caract??res d??terminent choix entre les options pour les codes de caract??res suivants. Il permet l'encodage compact, mais est moins fiable pour transmission de donn??es; une erreur dans la transmission du code de changement de vitesse fait en g??n??ral une longue partie de la transmission illisible. Le comit?? des normes a d??cid?? contre d??placement, et ainsi ASCII requis au moins un code ?? sept bits.
Le comit?? examine un code ?? huit bits, depuis huit bits ( octets) permettraient deux mod??les ?? quatre bits pour coder efficacement deux chiffres avec d??cimal cod?? binaire. Cependant, il faudrait toutes les transmissions de donn??es ?? envoyer huit bits lorsque sept pourrait suffire. Le comit?? a vot?? ?? utiliser un code ?? sept bits pour minimiser les co??ts associ??s ?? la transmission de donn??es. Depuis ruban perfor?? au moment pourrait enregistrer huit bits dans une position, il a ??galement permis une bit de parit?? pour V??rification des erreurs, si d??sir??. Machines ?? huit bits (avec octets que le type de donn??es natif) qui ne utilisaient pas contr??le de parit?? g??n??ralement mis le huiti??me bit ?? 0.
Le code lui-m??me a ??t?? configur??e de mani??re que la plupart des codes de contr??le ??taient ensemble, et tous les codes graphiques ??taient ensemble, pour faciliter l'identification. Les deux premi??res colonnes (32 postes) ont ??t?? r??serv??s pour les caract??res de contr??le.} Le Caract??re "espace" devait venir avant graphiques pour faire le tri plus facile, il est donc devenu la position 20 hex ; pour la m??me raison, de nombreux signes sp??ciaux couramment utilis??s comme s??parateurs ont ??t?? plac??s devant les chiffres. Le comit?? a d??cid?? qu'il ??tait important de soutenir haut de casse Alphabets 64 caract??res, et a choisi le mod??le ASCII de sorte qu'il pourrait ??tre r??duit facilement ?? un ensemble de 64 caract??res utilisable de codes graphiques. Les lettres minuscules ne ont donc pas entrelac??es avec majuscules. Pour garder des options disponibles pour les lettres minuscules et autres graphiques, les codes sp??ciaux et num??riques ont ??t?? organis??es avant les lettres, et de la lettre ??A?? a ??t?? plac?? en position 41 hex pour correspondre ?? la version de la norme britannique correspondante. Les chiffres 0-9 ont ??t?? organis??es afin qu'ils correspondent ?? des valeurs en binaire avec le pr??fixe 011, ce qui rend la conversion avec cod?? en binaire simple virgule.
La plupart des caract??res non alphanum??riques ont ??t?? positionn??s pour correspondre ?? leur position d??cal??e sur des machines ?? ??crire. Ainsi, #, $% et ont ??t?? plac??es pour correspondre ?? 3, 4, et 5 dans la colonne adjacente. Les parenth??ses pourraient ne pas correspondre ?? 9 et 0, cependant, parce que l'endroit correspondant ?? 0 a ??t?? prise par le caract??re espace. Depuis de nombreuses machines ?? ??crire europ??ens plac??s les parenth??ses avec 8 et 9, ces positions correspondant ont ??t?? choisis pour les parenth??ses. Le symbole @ n'a pas ??t?? utilis?? en Europe continentale et le comit?? devrait il serait remplac?? par un A accentu?? dans la variation fran??aise, de sorte que le @ a ??t?? plac??e en position 40 hex c??t?? de la lettre A.
Les codes de contr??le ont estim?? essentiel pour la transmission de donn??es ??taient le d??but de message (SOM), fin de l'adresse (EOA), fin de message (EOM), fin de transmission (EOT), "qui ??tes-vous?" (WRU), "??tes-vous?" (RU), un contr??le de l'appareil r??serv??e (DC0), ralenti synchrone (SYNC), et reconna??tre (ACK). Ceux-ci ont ??t?? plac??s pour maximiser la Hamming distance entre leurs habitudes de bits.
Avec l'autre des caract??res sp??ciaux et des codes de commande remplis, ASCII a ??t?? publi?? comme ASA X3.4-1963, laissant 28 positions de code sans aucun sens, r??serv??s pour la normalisation future, et un code de contr??le non affect??. Il y avait un d??bat au moment savoir se il faut plus de caract??res de contr??le plut??t que l'alphabet minuscule. L'ind??cision ne dura pas longtemps: en mai 1963, le Groupe de travail CCITT sur le New Alphabet t??l??graphique propos?? d'affecter minuscules personnages aux colonnes 6 et 7, et Organisation internationale de normalisation TC 97 SC 2 vot?? en Octobre ?? int??grer le changement dans son projet de norme. Le groupe de travail de X3.2.4 vot?? son approbation pour que le changement ASCII lors de sa r??union mai 1963. Emplacement des lettres minuscules dans les colonnes 6 et 7 caus?? les personnages diff??rent en configuration binaire de la majuscule par un seul bit, qui a simplifi?? caract??re correspondance insensible ?? la casse et la construction de claviers et imprimantes.
Le comit?? de X3 a fait d'autres changements, y compris d'autres nouveaux personnages (la accolade et les personnages de ligne verticale), en renommant certains caract??res de contr??le (SOM devenus d??but de t??te (SOH)) et d??placer ou enlever d'autres (RU a ??t?? retir??). ASCII a ensuite ??t?? mis ?? jour comme USASI X3.4-1967, puis USASI X3.4-1968, ANSI X3.4-1977, et enfin, ANSI X3.4-1986 (les deux premiers sont parfois retronamed ANSI X3.4-1967, et X3.4-1968 ANSI).
Le comit?? de X3 a ??galement abord?? la fa??on ASCII doit ??tre transmise ( bit le moins significatif en premier), et comment il devrait ??tre enregistr?? sur bande perfor??e. Ils ont propos?? un Norme 9-piste pour bande magn??tique, et a tent?? de faire face ?? certaines formes de formats de cartes perfor??es.
ASCII lui-m??me ??tait d'abord utilis?? dans le commerce en 1963 en tant que code de t??l??imprimeur sept bits pour American Telephone & TWX (t??l??scripteur eXchange) le r??seau de Telegraph. TWX utilis?? ?? l'origine les cinq bits code pr??c??dent Baudot, qui a ??galement ??t?? utilis?? par la concurrence T??lex syst??me de t??l??imprimeur. Bob Bemer introduit des fonctionnalit??s telles que la s??quence d'??chappement. Son coll??gue britannique Hugh McGregor Ross a contribu?? ?? populariser ce travail-selon Bemer, "si bien que le code qui allait devenir ASCII fut d'abord appel?? le Code Bemer-Ross en Europe". En raison de son important travail sur l'ASCII, Bemer a ??t?? appel?? ??le p??re de l'ASCII."
Le 11 Mars 1968, le pr??sident am??ricain Lyndon B. Johnson a exig?? que tous les ordinateurs achet??s par les Etats-Unis l'appui du gouvernement f??d??ral, ASCII indiquant:
Je ai ??galement approuv?? les recommandations du Secr??taire du Commerce concernant les normes pour l'enregistrement de la Standard Code for Information Interchange sur des bandes magn??tiques et des bandes de papier quand ils sont utilis??s dans les op??rations informatiques. Tous les ordinateurs et configurations d'??quipement connexes intent??es dans l'inventaire du gouvernement f??d??ral ?? compter du 1er Juillet 1969, doivent avoir la capacit?? d'utiliser le Standard Code for Information Interchange et les formats prescrits par les normes du ruban et du papier ?? bande magn??tique lorsque ces m??dias sont utilis??s.
Autres organismes de normalisation internationaux ont ratifi?? codages de caract??res tels que ISO / CEI 646 qui sont identiques ou presque identiques ?? ASCII, avec des extensions pour les personnages en dehors de l'alphabet anglais et les symboles utilis??s en dehors des ??tats-Unis, comme le symbole pour le Royaume-Uni livres sterling la (??). Presque chaque pays a besoin d'une version adapt??e de ASCII, depuis ASCII adapt?? aux besoins de seulement aux Etats-Unis et quelques autres pays. Par exemple, le Canada a sa propre version qui a soutenu les caract??res fran??ais. Autres codages adapt??s comprennent ISCII (Inde), VISCII (Vietnam), et YUSCII (Yougoslavie). Bien que ces encodages sont parfois appel??s ASCII, vrai ASCII est d??fini strictement que par la norme ANSI.
ASCII a ??t?? incorpor?? dans le caract??re Unicode que les 128 premiers symboles, de sorte que les caract??res ASCII avoir les m??mes codes num??riques dans les deux ensembles. Ceci permet UTF-8 pour ??tre r??trocompatible avec ASCII, un avantage significatif.
des caract??res de contr??le ASCII
r??serves ASCII les 32 premiers codes (nombres d??cimaux) pour 0-31 caract??res de contr??le: codes ?? l'origine destin??s ?? ne pas repr??senter informations imprimables, mais plut??t de contr??ler des p??riph??riques (tels que imprimantes) qui utilisent ASCII, ou de fournir m??ta-informations sur les flux de donn??es telles que celles stock??es sur bande magn??tique. Par exemple, le caract??re 10 repr??sente la fonction "saut de ligne" (qui provoque une imprimante pour faire avancer son papier), et le caract??re 8 repr??sente "backspace". RFC 2822 se r??f??re ?? contr??ler caract??res qui ne comprennent pas de retour chariot, saut de ligne ou espace blanc comme caract??res de contr??le non-blancs. Sauf pour les caract??res de contr??le qui prescrivent formatage orient?? ligne ??l??mentaire, ASCII ne d??finit pas de m??canisme pour d??crire la structure ou l'apparence du texte dans un document. Autres r??gimes, tels que les langages de balisage , d'adresse de page et la pr??sentation du document et le formatage.
La norme ASCII originale utilis??e que de courtes phrases descriptives pour chaque caract??re de contr??le. L'ambigu??t?? cela a caus?? ??tait parfois intentionnelle (o?? un personnage serait utilis?? de fa??on l??g??rement diff??rente sur une liaison terminal que sur un flux de donn??es) et parfois accidentelle (comme ce "supprimer" signifie).
Probablement le seul appareil le plus influent sur l'interpr??tation de ces personnages ??tait le Teletype Mod??le 33 ASR, qui ??tait un terminal d'impression avec un disponible ruban de papier de l'option lecteur / punch. bande de papier ??tait un milieu tr??s populaire pour le stockage de programme ?? long terme jusqu'?? ce que les ann??es 1980, moins co??teuses et ?? certains ??gards moins fragile que la bande magn??tique. En particulier, les Teletype Mod??le 33 machines affectations pour les codes 17 (Control-Q, DC1, aussi connu comme XON), 19 (contr??le-S, DC3, aussi connu comme XOFF), et 127 ( Supprimer) est devenu normes de facto. Parce que le dessus de touche pour la touche O a ??galement montr?? un symbole fl??che gauche (de ASCII-1963, qui avait ce caract??re au lieu de soulignent), ?? une utilisation non conforme d'un code 15 (Ctrl-O, changement dans) interpr??t?? comme "supprimer le caract??re pr??c??dent" a ??galement ??t?? adopt?? par de nombreux syst??mes en temps partag?? au d??but mais finalement est devenu n??glig??.
L'utilisation du contr??le-S (XOFF, une abr??viation pour la transmission hors) comme un signal "de prise de contact" avertir un exp??diteur ?? arr??ter la transmission en raison de l'imminence de d??bordement, et Control-Q (XON, "transmettre sur") pour reprendre l'envoi, persiste ?? ce jour dans de nombreux syst??mes comme une technique manuelle de commande de sortie. Sur certains syst??mes de contr??le-S conserve sa signification mais Control-Q est remplac?? par un deuxi??me contr??le-S de reprendre la production.
Code 127 est officiellement nomm?? "Supprimer", mais l'??tiquette de t??l??scripteur ??tait "rubout". Depuis la norme d'origine n'a pas donn?? une interpr??tation d??taill??e pour la plupart des codes de contr??le, les interpr??tations de ce code vari??. Le sens de Teletype d'origine, et l'intention de la norme, ??tait d'en faire un personnage ignor??, le m??me que NUL (z??ros). Ce ??tait utile sp??cifiquement pour une bande de papier, parce poin??onner le tout-un motif sur le dessus d'une marque existante de bits serait oblit??rer. Tapes con??us pour ??tre ??main modifi??s" pourrait m??me ??tre produite avec des espaces de NULs suppl??mentaires (cassette vierge) de sorte qu'un bloc de caract??res pourrait ??tre "effac??" puis remplacements mis dans l'espace vide.
Comme terminaux vid??o ont commenc?? ?? remplacer les imprimer, la valeur du caract??re "rubout" a ??t?? perdu. Syst??mes d??cembre, par exemple, interpr??t??s "Supprimer" pour dire "supprimer le caract??re avant le curseur?? et cette interpr??tation est ??galement devenu courant dans les syst??mes Unix. La plupart des autres syst??mes utilis??s "Backspace" pour que le sens et utilis??s "Supprimer" pour dire "supprimer le caract??re au niveau du curseur". Cette derni??re interpr??tation est la plus courante aujourd'hui.
Beaucoup plus des codes de contr??le ont pu donner un sens tr??s diff??rent de leurs originaux. La ??fuite?? de caract??re (ESC, le code 27), par exemple, a ??t?? con??u ?? l'origine pour permettre l'envoi d'autres caract??res de contr??le comme des litt??raux au lieu d'invoquer leur signification. Ce est le m??me sens de ????vasion?? rencontr?? dans encodages d'URL, langage C , les cha??nes et d'autres syst??mes o?? certains caract??res ont une signification r??serv??. Au fil du temps ce sens a ??t?? coopt?? et a finalement ??t?? chang??. Dans l'usage moderne, un CES envoy?? ?? la borne indique g??n??ralement le d??but d'une s??quence de commandes, g??n??ralement sous la forme d'un soi-disant " ANSI code d'??chappement "(ou, plus correctement, un" contr??le de s??quence d'introduction ") en commen??ant par ESC suivie par un" (crochet gauche) caract??re [". Une ESC envoy?? ?? partir du terminal est le plus souvent utilis?? comme un out-of-band caract??re utilis?? pour terminer une op??ration, comme dans le TECO et vi ??diteurs de texte. En l'interface utilisateur graphique (GUI) et syst??mes de fen??trage, ESC provoque g??n??ralement une application interrompre son op??ration en cours ou ?? sortie (fin) tout ?? fait.
L'ambigu??t?? inh??rente de nombreux caract??res de contr??le, combin??e ?? leur usage historique, a cr???? des probl??mes lors du transfert de "texte brut" des fichiers entre syst??mes. Le meilleur exemple de ceci est le probl??me de saut de ligne sur les diff??rents syst??mes d'exploitation. t??l??scripteurs exigeaient que une ligne de texte se terminer par deux "Carriage Return" (qui se d??place la t??te d'impression au d??but de la ligne) et "Alimentation Line" (qui fait avancer le papier d'une ligne sans d??placer la t??te d'impression). Le nom ??retour chariot?? vient du fait que sur un manuel machine ?? ??crire le transport tenant le papier d??plac?? alors que la position o?? les touches frapp??es le ruban rest?? stationnaire. La totalit?? du transport a d?? ??tre pouss?? (retourn??) vers la droite afin de positionner la marge gauche du papier pour la ligne suivante.
Syst??mes d'exploitation (d??cembre OS / 8, RT-11, RSX-11, RSTS, TOPS-10, etc.) utilis??s deux caract??res pour marquer la fin d'une ligne pour que le dispositif de la console (?? l'origine Machines t??l??type) travailleraient. Par le temps que l'on appelle ??verre ATS" (plus tard appel??s tubes cathodiques ou bornes) sont arriv??s, la convention a ??t?? si bien ??tabli que la compatibilit?? ascendante a n??cessit?? la poursuite de la convention. Lorsque Gary Kildall clon?? RT-11 pour cr??er CP / M, il suivit ??tabli Convention d??cembre. Jusqu'?? l'introduction de PC-DOS en 1981, IBM ne avait pas la main dans ce parce que leurs syst??mes utilis??s 1970 EBCDIC au lieu d'ASCII exploitation et ils ont ??t?? orient??s vers l'entr??e ?? cartes perfor??es et de sortie de l'imprimante de la ligne sur laquelle la notion de ??retour chariot?? n'a pas de sens. IBM PC-DOS (??galement commercialis?? sous le MS-DOS par Microsoft) a h??rit?? de la convention en vertu d'??tre un clone de CP / M, et Windows h??rit?? de MS-DOS.
Malheureusement, n??cessitant deux caract??res pour marquer la fin d'une ligne introduit une complexit?? et des questions quant ?? la fa??on d'interpr??ter chaque caract??re quand rencontr?? seul inutile. Pour simplifier les choses flux de donn??es en texte clair, y compris les fichiers, sur Multics utilis?? saut de ligne (LF) seul comme un terminateur de ligne. Unix et Syst??mes de type Unix, et Syst??mes Amiga, a adopt?? cette convention de Multics. L'original Macintosh OS, Apple DOS, et ProDOS, d'autre part, utilis??e retour chariot (CR) seul comme un terminateur de ligne; cependant, puisque Apple l'a remplac??e par la base Unix- X syst??me d'exploitation OS, ils utilisent maintenant un saut de ligne (LF) ainsi.
Ordinateurs attach?? ?? la ARPANET inclus machines ex??cutant des syst??mes d'exploitation tels que TOPS-10 et TENEX utilisant les fins de ligne CR-LF, machines ex??cutant des syst??mes d'exploitation tels que Multics utilisant les fins de ligne LF, et les machines ex??cutant des syst??mes d'exploitation tels que OS / 360 qui repr??sentait lignes comme le nombre de caract??res suivie par les caract??res de la ligne et que utilis??s EBCDIC plut??t que ASCII. Le protocole Telnet d??fini un caract??re ASCII "Network Virtual Terminal" (NVT), de sorte que les connexions entre les h??tes avec diff??rentes conventions de ligne fin et jeux de caract??res pourraient ??tre soutenus par la transmission d'un format standard de texte sur le r??seau; il a utilis?? ASCII, avec des fins de ligne CR-LF, et le logiciel en utilisant d'autres conventions se traduirait entre les conventions locales et le NVT. Le File Transfer Protocol adopt?? le protocole Telnet, y compris l'utilisation du terminal de r??seau virtuel, pour une utilisation lors de la transmission des commandes et le transfert de donn??es en mode ASCII par d??faut. Cela ajoute de la complexit?? ?? des impl??mentations de ces protocoles, et ?? d'autres protocoles de r??seau, tels que ceux utilis??s pour E-mail et le World Wide Web, sur les syst??mes qui ne utilisent pas CR-LF la convention de fin de ligne de la NVT.
Anciens syst??mes d'exploitation tels que TOPS-10, avec CP / M, suivis longueur du fichier que dans des unit??s de blocs de disque et utilis??s Control-Z (SUB) pour marquer la fin du texte actuel dans le fichier. Pour cette raison, EOF, ou de fin de fichier, et a ??t?? utilis?? famili??rement classiquement comme acronyme de trois lettres (TLA) pour le contr??le-Z au lieu de substitut. Pour diverses raisons, le code de fin de texte, ETX aka Control-C, ??tait inappropri?? et Z en utilisant le code de commande ?? la fin d'un fichier, il est analogue ?? la fin de l'alphabet, un tr??s pratique mn??motechnique. Un historique commun, et encore r??pandue, utilise la convention ETX aka Control-C convention de code pour interrompre et arr??ter un programme via un flux de donn??es d'entr??e, g??n??ralement ?? partir d'un clavier.
En biblioth??que et Unix conventions C, le caract??re nul est utilis?? pour terminer le texte cordes; tel cha??nes ?? z??ro terminal peuvent ??tre connus ?? l'abr??viation que ASCIZ ou ASCIIZ, o?? ici Z signifie "z??ro".
ASCII code de contr??le tableau
Binaire | Octobre | D??cembre | Hex | Abr | Nom | |||
---|---|---|---|---|---|---|---|---|
000 0000 | 000 | 0 | 00 | NUL | ␀ | ^ @ | \ 0 | Caract??re nul |
000 0001 | 001 | 1 | 01 | SOH | ␁ | ^ A | D??but de la t??te | |
000 0010 | 002 | 2 | 02 | STX | ␂ | ^ B | D??but du texte | |
000 0011 | 003 | 3 | 03 | ETX | ␃ | ^ C | Fin de texte | |
000 0100 | 004 | 4 | 04 | EOT | ␄ | ^ D | Fin de la transmission | |
000 0101 | 005 | 5 | 05 | ENQ | ␅ | ^ E | Demande de renseignements | |
000 0110 | 006 | 6 | 06 | ACK | ␆ | ^ F | Reconnaissance | |
000 0111 | 007 | 7 | 07 | BEL | ␇ | ^ G | \ A | Cloche |
000 1000 | 010 | 8 | 08 | BS | ␈ | ^ H | \ B | Retour arri??re |
000 1001 | 011 | 9 | 09 | HT | ␉ | ^ I | \ T | Tab horizontale |
000 1010 | 012 | 10 | 0A | LF | ␊ | ^ J | \ N | Saut de ligne |
000 1011 | 013 | 11 | 0B | Vermont | ␋ | ^ K | \ V | Tabulation verticale |
000 1100 | 014 | 12 | 0C | FF | ␌ | L ^ | \ F | Saut |
000 1101 | 015 | 13 | 0D | CR | ␍ | ^ M | \ R | Retour chariot |
000 1110 | 016 | 14 | 0E | SO | ␎ | ^ N | Maj Out | |
000 1111 | 017 | 15 | 0F | SI | ␏ | ^ O | Maj En | |
001 0000 | 020 | 16 | 10 | DLE | ␐ | ^ P | Data Link ??vasion | |
001 0001 | 021 | 17 | 11 | DC1 | ␑ | Q ^ | Device Control 1 (OFT. XON) | |
001 0010 | 022 | 18 | 12 | DC2 | ␒ | R ^ | Device Control 2 | |
001 0011 | 023 | 19 | 13 | DC3 | ␓ | ^ S | Device Control 3 (souvent. XOFF) | |
001 0100 | 024 | 20 | 14 | DC4 | ␔ | ^ T | Device Control 4 | |
001 0101 | 025 | 21 | 15 | NAK | ␕ | ^ U | Accus?? n??gative | |
001 0110 | 026 | 22 | 16 | SYN | ␖ | ^ V | Inactif synchrone | |
001 0111 | 027 | 23 | 17 | ETB | ␗ | ^ W | Fin du bloc Transmission | |
001 1000 | 030 | 24 | 18 | POUVOIR | ␘ | ^ X | Annuler | |
001 1001 | 031 | 25 | 19 | EM | ␙ | Y ^ | Fin de la moyenne | |
001 1010 | 032 | 26 | 1A | SUB | ␚ | ^ Z | Rempla??ant | |
001 1011 | 033 | 27 | 1B | ESC | ␛ | ^ [ | \ E | ??vasion |
001 1100 | 034 | 28 | 1C | FS | ␜ | ^ \ | D??poser Separator | |
001 1101 | 035 | 29 | 1D | GS | ␝ | ^] | Groupe S??parateur | |
001 1110 | 036 | 30 | 1E | RS | ␞ | ^^ | Enregistrez Separator | |
001 1111 | 037 | 31 | 1F | ??tats-Unis | ␟ | ^ _ | Unit?? s??parateur | |
111 1111 | 177 | 127 | 7F | DEL | ␡ | ^? | Effacer |
- ^ Le Caract??res Unicode de la r??gion de U + 2400 ?? U + 2421 r??serv??e pour repr??senter les caract??res de contr??le quand il est n??cessaire d'imprimer ou de les afficher plut??t que d'avoir ?? se acquitter de leur fonction. Certains navigateurs ne peuvent pas les afficher correctement.
- ^ Notation caret souvent utilis?? pour repr??senter les caract??res de contr??le sur un terminal. Sur la plupart des terminaux texte, en maintenant enfonc??e la Ctrl tout en tapant le deuxi??me caract??re tapera le caract??re de contr??le. Parfois, la touche shift ne est pas n??cessaire, par exemple ^ @ peut ??tre typable avec juste Ctrl et 2.
- ^ Codes d'??chappement de caract??re en langage de programmation C et de nombreuses autres langues influenc??s par elle, comme Java et Perl (mais pas toutes les impl??mentations supportent n??cessairement tous les codes d'??chappement).
- ^ Le caract??re Backspace peut ??galement ??tre entr?? en appuyant sur la touche ← Backspace sur certains syst??mes.
- ^ Un b L'ambigu??t?? de Backspace est due ?? d??but des terminaux con??us en supposant que la principale utilisation du clavier serait ?? entrer manuellement une bande de papier sans ??tre connect?? ?? un ordinateur. Pour supprimer le caract??re pr??c??dent, il fallait sauvegarder le perforateur de bande de papier, qui pour des raisons m??caniques et la simplicit?? ??tait un bouton sur le poin??on lui-m??me et pas le clavier, puis tapez le caract??re rubout. Ils ont donc plac?? un rubout production touche ?? l'emplacement utilis?? sur les machines ?? ??crire pour revenir en arri??re. Lorsque les syst??mes utilis??s ces terminaux et ?? condition ??dition de ligne de commande, ils ont d?? utiliser le code "rubout" pour effectuer un retour en arri??re, et ne ont souvent pas interpr??t?? le caract??re de retour arri??re (ils pourraient echo "^ H" pour revenir en arri??re). D'autres terminaux ne sont pas con??us pour la bande de papier fait la cl?? ?? cet endroit produire Backspace, et les syst??mes con??us pour ces utilis??s ce personnage ?? sauvegarder. Puisque le code de suppression produit souvent un effet de retour en arri??re, cela a aussi forc?? les fabricants de terminaux pour faire toute supprimer la cl?? produit autre chose que le caract??re Suppr.
- ^ Le caract??re de tabulation peut ??galement ??tre entr?? en appuyant sur la touche de l'onglet sur la plupart des syst??mes.
- ^ Le caract??re retour chariot peut ??galement ??tre entr?? en appuyant sur la touche ↵ touche Entr??e ou Return sur la plupart des syst??mes.
- ^ La s??quence \ 'e' d'??chappement ne est pas partie de l'ISO C et bien d'autres sp??cifications de langue. Toutefois, il est entendu par plusieurs compilateurs.
- ^ Le caract??re d'??chappement peut ??galement ??tre entr?? en appuyant sur la touche Echap sur certains syst??mes.
- ^ ^^ Signifie Ctrl + ^ (caret appuyant sur les touches "Ctrl" et).
- ^ Le caract??re Supprimer peut parfois ??tre entr?? en appuyant sur la touche ← Backspace sur certains syst??mes.
Caract??res ASCII imprimables
Codes 20 hex ?? 7F hex , connu comme les caract??res imprimables, repr??sentent les lettres, les chiffres, signes de ponctuation et quelques symboles divers. Il ya 95 caract??res imprimables au total.
Code 20 hex , le caract??re espace, d??signe l'espace entre les mots, tel que produit par la barre d'espace du clavier. Depuis le caract??re espace est consid??r?? comme un graphique invisible (plut??t que d'un caract??re de contr??le) et donc ne seraient normalement pas visible, il est repr??sent?? ici par caract??re Unicode U + 2420 "␠"; Les caract??res Unicode U + 2422 "␢" et U + 2423 "␣" sont ??galement disponibles pour une utilisation quand une repr??sentation visible de l'espace est n??cessaire.
Code 7F hex correspond ?? la (DEL) caract??re non imprimable "Supprimer" de contr??le et ne est donc omis de ce tableau; il est couvert dans le tableau de la section pr??c??dente.
Les versions ant??rieures de ASCII utilis?? la fl??che vers le haut au lieu de la caret (5E hex ) et la fl??che gauche ?? la place de la soulignement (5F hex ).
|
|
|
Alias
A Juin 1992 et RFC le Internet Assigned Numbers Authority registre des jeux de caract??res reconna??t les alias insensibles ?? la casse suivants pour ASCII adapt??s pour une utilisation sur Internet:
- ANSI_X3.4-1968 (nom canonique)
- iso-ir-6
- ANSI_X3.4-1986
- ISO_646.irv: 1991
- ASCII (avec ASCII-7 et ASCII-8 variantes)
- ISO646-US
- US-ASCII (pr??f??r?? Nom MIME)
- nous
- IBM367
- cp367
- csASCII
Parmi ceux-ci, l'IANA encourage l'utilisation du nom "US-ASCII" pour des usages Internet de ASCII. On trouve souvent ce dans le param??tre "charset" option dans l'ent??te Content-Type de certains messages MIME, dans l'??l??ment ??quivalent "meta" de certains documents HTML, et dans la partie de d??claration de codage du prologue de certains documents XML.
Variantes
Comme la technologie informatique la propagation ?? travers le monde, diff??rente les organismes de normalisation et les soci??t??s d??velopp??es de nombreuses variantes de ASCII pour faciliter l'expression des langues autres que l'anglais qui utilisaient alphabets base-romaine. On pourrait classe certaines de ces variations que " extensions ASCII ", bien que certains mauvais usage de ce terme pour repr??senter toutes les variantes, y compris ceux qui ne pr??serve pas la carte de caract??res ASCII dans la plage de 7 bits.
Le Code PETSCII Commodore International utilis??s pour leurs syst??mes 8-bits est probablement unique parmi les codes post-1970 en se basant sur l'ASCII-1963, au lieu de l'ASCII-1967 plus fr??quente, comme on en trouve sur le Ordinateur ZX Spectrum. Atari et ordinateurs Galaksija ??galement utilis??s variantes ASCII.
7 bits
Depuis le d??but de son d??veloppement, ASCII a ??t?? destin?? ?? ??tre juste un de plusieurs variantes nationales d'une norme de code de caract??re international, finalement publi?? en tant que ISO / CEI 646 (1972), qui part la plupart des caract??res en commun, mais assigner d'autres localement les caract??res utiles ?? plusieurs points de code r??serv??s pour "usage national." Cependant, les quatre ann??es qui se sont ??coul??es entre la publication de l'ASCII-1963 et la premi??re acceptation de l'ISO d'une recommandation internationale en 1967 ont caus?? les choix des ASCII pour les caract??res d'utilisation nationaux semblent ??tre les normes de facto pour le monde, provoquant la confusion et d'incompatibilit?? une fois les autres pays ne commencer ?? faire leurs propres affectations ?? ces points de code.
ISO / CEI 646, comme ASCII, ??tait un jeu de caract??res 7 bits. Il n'a pas fait de codes suppl??mentaires disponibles, de sorte que les m??mes points de code cod?? caract??res diff??rents dans des pays diff??rents. ??chapper codes ont ??t?? d??finis pour indiquer la variante nationale appliqu??e ?? un morceau de texte, mais ils sont rarement utilis??s, de sorte qu'il ??tait souvent impossible de savoir ce que la variante de travailler avec et donc quel personnage repr??sent?? un code, et dans les syst??mes g??n??raux de traitement de texte pourrait face avec une seule variante de toute fa??on.
Parce que les supports et bretelles caract??res ASCII ont ??t?? affect??es ?? des points "d'utilisation nationale" de code qui ont ??t?? utilis??s pour les caract??res accentu??s dans d'autres variantes nationales de l'ISO / CEI 646, un programmeur allemand, fran??ais ou su??dois, etc. utilisant leur variante nationale de l'ISO / CEI 646, plut??t que ASCII, d?? ??crire, et donc lire, quelque chose comme
-
ä aÄiÜ = 'ON'; ü
au lieu de
-
{ a[i]='\n'; }
C trigraphes ont ??t?? cr????s pour r??soudre ce probl??me pour ANSI C, bien que leur introduction tardive et mise en ??uvre incoh??rente dans les compilateurs limitent leur utilisation.
8 bits
Finalement, comme 8, 16, et Ordinateurs 32 bits ont commenc?? ?? remplacer 18 et 36 bits des ordinateurs comme la norme, il est devenu courant d'utiliser un octet de 8 bits pour stocker chaque caract??re dans la m??moire, donnant l'occasion aux ??tendues, 8 bits, parents de ASCII. Dans la plupart des cas, ces d??velopp??s comme de v??ritables extensions de ASCII, laissant le caract??re de cartographie d'origine, intact, mais l'ajout de d??finitions de caract??res suppl??mentaires apr??s les premiers 128 (c.-?? 7 bits) caract??res.
La plupart des syst??mes informatiques de la maison t??t d??velopp?? leurs propres jeux de caract??res 8 bits contenant de trac?? et de jeux glyphes, et souvent remplis dans certains ou tous les caract??res de contr??le 0-31 avec plus de graphiques. L'IBM PC d??fini page de code 437, qui a remplac?? les caract??res de contr??le avec des symboles graphiques tels que smiley face, et cartographi?? caract??res graphiques suppl??mentaires pour les 128 postes sup??rieurs. Les syst??mes d'exploitation tels que DOS ces pages de code, et les fabricants de prise en charge PC IBM les ont soutenus dans le mat??riel. Digital Equipment Corporation a d??velopp?? le Multinational Character Set (DEC-MCS) pour une utilisation dans le populaire VT220 terminal, ce ??tait l'une des premi??res extensions con??us plus pour les langues internationales que pour les blocs graphiques. Le Macintosh d??fini MacRoman et Postscript ??galement d??fini un ensemble, ?? la fois de ces deux lettres internationales contenues et des signes de ponctuation typographiques ?? la place des graphiques, plus comme les jeux de caract??res modernes. Le ISO / CEI 8859 standard (d??riv?? du DEC-MCS) a finalement fourni une norme que la plupart des syst??mes copi??s (au moins aussi pr??cis??ment que ils ont copi?? ASCII, mais avec de nombreuses substitutions). Une extension populaire con??u par Microsoft, Windows 1252 (souvent mal ??tiquet??s comme ISO-8859-1), ajout?? les signes de ponctuation typographiques n??cessaires pour l'impression de texte attrayant.
ISO-8859-1, Windows-1252, et l'origine ASCII 7 bits ??taient codages de caract??res les plus courantes jusqu'?? la fin des ann??es 2000, de nos jours UTF-8 est de plus en plus commun.
Unicode
Unicode et l'ISO / CEI 10646 Universal Character Set (UCS) ont un ??ventail beaucoup plus large de caract??res, et leurs diverses formes de codage ont commenc?? ?? supplanter ISO / CEI 8859 et ASCII rapidement dans de nombreux environnements. Alors que ASCII est limit??e ?? 128 caract??res, Unicode et les UCS soutiennent plusieurs caract??res en s??parant les concepts de l'identification unique (en utilisant des nombres naturels appel??s points de code) et l'encodage (?? 8, 16 ou 32 formats bits binaires, appel?? UTF-8, UTF-16 et UTF-32).
Pour permettre la compatibilit?? ascendante, l'ASCII 128 et 256 ISO-8859-1 (Latin 1) caract??res sont attribu??s des points de code Unicode / UCS qui sont les m??mes que leurs codes dans les normes ant??rieures. Par cons??quent, ASCII peut ??tre consid??r?? comme un syst??me de codage sur 7 bits pour un tr??s petit sous-ensemble de Unicode / UCS, et ASCII (lorsque le pr??fixe 0 que le huiti??me bit) est valide UTF-8.
Ordre
Afin code ASCII est aussi appel?? afin de ASCIIbetical. Collation des donn??es est parfois fait dans cet ordre plut??t que par ordre alphab??tique "standard" ( s??quence de classement). Les principaux ??carts dans l'ordre ASCII sont:
- Tous les majuscules avant les minuscules, par exemple, "Z" avant "a"
- Chiffres et de nombreux signes de ponctuation sont avant les lettres, par exemple, "4" pr??c??de "une"
- Les nombres sont tri??s na??vement comme des cha??nes, par exemple, "10" pr??c??de "2"
Un ordre interm??diaire - facilement mis en ??uvre - convertit lettres majuscules en minuscules avant de comparer des valeurs ASCII. Num??ro Na??f tri peut ??tre ??vit??e par z??ro remplir tous les num??ros (par exemple "02" pour trier avant "10" comme pr??vu), bien que ce est une solution externe et n'a rien ?? voir avec la commande elle-m??me.