V??rifi?? contenu

ASCII

Contexte des ??coles Wikip??dia

Arrangeant une s??lection Wikipedia pour les ??coles dans le monde en d??veloppement sans internet ??tait une initiative de SOS Enfants. SOS Children travaille dans 45 pays africains; pouvez-vous aider un enfant en Afrique ?

Un tableau de l'ASCII d'un manuel de l'imprimante 1972

Le code standard am??ricain pour l'??change d'information (ASCII, prononciation: / ?? s k Je / ASS -kee;) est une syst??me de codage de caract??res ?? l'origine bas?? sur la Alphabet anglais. codes ASCII repr??sentent texte dans les ordinateurs , les communications ??quipement, et d'autres dispositifs qui utilisent texte. La plupart des syst??mes de codage de caract??res modernes sont bas??s sur ASCII, bien qu'ils soutiennent de nombreux caract??res suppl??mentaires.

ASCII d??velopp?? ?? partir de codes t??l??graphiques. Sa premi??re utilisation commerciale ??tait aussi un cycle de sept bit code de t??l??imprimeur promu par les services de donn??es de Bell. Les travaux sur la norme ASCII a commenc?? le 6 Octobre 1960, avec la premi??re r??union de la (ASA) le sous-comit?? de X3.2 American Standards Association. La premi??re ??dition de la norme a ??t?? publi??e en 1963, une r??vision majeure en 1967, et la mise ?? jour la plus r??cente en 1986. Par rapport aux codes t??l??graphiques ant??rieures, le code de Bell propos?? et ASCII ont tous deux ??t?? ordonn?? pour le tri plus pratique (ce est ?? dire, l'alphab??tisation) de des listes et des fonctionnalit??s suppl??mentaires pour des appareils autres que les t??l??scripteurs.

ASCII comprend des d??finitions pour 128 caract??res: 33 sont non-impression caract??res de contr??le (nombre d??sormais obsol??te) qui affectent comment le texte et l'espace sont trait??es et 95 caract??res imprimables, y compris le espace (qui est consid??r?? comme un graphique invisible).

Le IANA pr??f??re le nom US-ASCII pour ??viter toute ambigu??t??. ASCII ??tait encodage la plus couramment utilis??e de caract??res sur le World Wide Web jusqu'en D??cembre 2007, quand il a ??t?? d??pass?? par UTF-8.

Histoire

Le code standard am??ricain pour l'??change d'information (ASCII) a ??t?? ??labor?? sous les auspices d'un comit?? de l'American Standards Association, appel?? le comit?? de X3, par son X3.2 (plus tard X3L2) sous-comit??, et plus tard par le groupe de travail X3.2.4 de ce sous-comit?? . L'ASA est devenu aux Etats-Unis d'Am??rique Standards Institute ou USASI et finalement le American National Standards Institute.

L'ASCII con??u du sous-comit?? de X3.2 selon la plus rapproch??e syst??mes de codage de t??l??imprimeur. Comme les autres codages de caract??res, ASCII sp??cifie une correspondance entre les mod??les et de bits num??riques symboles de caract??res (c.-??- graph??mes et des caract??res de contr??le). Ceci permet appareils num??riques de communiquer les uns avec les autres et pour traiter, stocker et communiquer des informations orient??es caract??re tels que la langue ??crite. Avant ASCII a ??t?? d??velopp??, les codages utilis??s inclus 26 caract??res alphab??tiques, 10 caract??res num??riques , et de 11 ?? 25 symboles graphiques sp??ciaux. Pour inclure tous ces personnages, et de contr??le compatibles avec le Comit?? Consultatif International T??l??graphique et T??l??phonique (CCITT) Alphabet t??l??graphique international n ?? 2 (ITA2) standard, Fieldata, et au d??but EBCDIC, plus de 64 codes ont ??t?? n??cessaire pour ASCII.

Le comit?? a discut?? de la possibilit?? d'une d??caler touche de fonction (comme le Code Baudot), ce qui permettrait plus de 64 codes d'??tre repr??sent??s par six bits. Dans un code d??cal??, certains codes de caract??res d??terminent choix entre les options pour les codes de caract??res suivants. Il permet l'encodage compact, mais est moins fiable pour transmission de donn??es; une erreur dans la transmission du code de changement de vitesse fait en g??n??ral une longue partie de la transmission illisible. Le comit?? des normes a d??cid?? contre d??placement, et ainsi ASCII requis au moins un code ?? sept bits.

Le comit?? examine un code ?? huit bits, depuis huit bits ( octets) permettraient deux mod??les ?? quatre bits pour coder efficacement deux chiffres avec d??cimal cod?? binaire. Cependant, il faudrait toutes les transmissions de donn??es ?? envoyer huit bits lorsque sept pourrait suffire. Le comit?? a vot?? ?? utiliser un code ?? sept bits pour minimiser les co??ts associ??s ?? la transmission de donn??es. Depuis ruban perfor?? au moment pourrait enregistrer huit bits dans une position, il a ??galement permis une bit de parit?? pour V??rification des erreurs, si d??sir??. Machines ?? huit bits (avec octets que le type de donn??es natif) qui ne utilisaient pas contr??le de parit?? g??n??ralement mis le huiti??me bit ?? 0.

Le code lui-m??me a ??t?? configur??e de mani??re que la plupart des codes de contr??le ??taient ensemble, et tous les codes graphiques ??taient ensemble, pour faciliter l'identification. Les deux premi??res colonnes (32 postes) ont ??t?? r??serv??s pour les caract??res de contr??le.} Le Caract??re "espace" devait venir avant graphiques pour faire le tri plus facile, il est donc devenu la position 20 hex ; pour la m??me raison, de nombreux signes sp??ciaux couramment utilis??s comme s??parateurs ont ??t?? plac??s devant les chiffres. Le comit?? a d??cid?? qu'il ??tait important de soutenir haut de casse Alphabets 64 caract??res, et a choisi le mod??le ASCII de sorte qu'il pourrait ??tre r??duit facilement ?? un ensemble de 64 caract??res utilisable de codes graphiques. Les lettres minuscules ne ont donc pas entrelac??es avec majuscules. Pour garder des options disponibles pour les lettres minuscules et autres graphiques, les codes sp??ciaux et num??riques ont ??t?? organis??es avant les lettres, et de la lettre ??A?? a ??t?? plac?? en position 41 hex pour correspondre ?? la version de la norme britannique correspondante. Les chiffres 0-9 ont ??t?? organis??es afin qu'ils correspondent ?? des valeurs en binaire avec le pr??fixe 011, ce qui rend la conversion avec cod?? en binaire simple virgule.

La plupart des caract??res non alphanum??riques ont ??t?? positionn??s pour correspondre ?? leur position d??cal??e sur des machines ?? ??crire. Ainsi, #, $% et ont ??t?? plac??es pour correspondre ?? 3, 4, et 5 dans la colonne adjacente. Les parenth??ses pourraient ne pas correspondre ?? 9 et 0, cependant, parce que l'endroit correspondant ?? 0 a ??t?? prise par le caract??re espace. Depuis de nombreuses machines ?? ??crire europ??ens plac??s les parenth??ses avec 8 et 9, ces positions correspondant ont ??t?? choisis pour les parenth??ses. Le symbole @ n'a pas ??t?? utilis?? en Europe continentale et le comit?? devrait il serait remplac?? par un A accentu?? dans la variation fran??aise, de sorte que le @ a ??t?? plac??e en position 40 hex c??t?? de la lettre A.

Les codes de contr??le ont estim?? essentiel pour la transmission de donn??es ??taient le d??but de message (SOM), fin de l'adresse (EOA), fin de message (EOM), fin de transmission (EOT), "qui ??tes-vous?" (WRU), "??tes-vous?" (RU), un contr??le de l'appareil r??serv??e (DC0), ralenti synchrone (SYNC), et reconna??tre (ACK). Ceux-ci ont ??t?? plac??s pour maximiser la Hamming distance entre leurs habitudes de bits.

Avec l'autre des caract??res sp??ciaux et des codes de commande remplis, ASCII a ??t?? publi?? comme ASA X3.4-1963, laissant 28 positions de code sans aucun sens, r??serv??s pour la normalisation future, et un code de contr??le non affect??. Il y avait un d??bat au moment savoir se il faut plus de caract??res de contr??le plut??t que l'alphabet minuscule. L'ind??cision ne dura pas longtemps: en mai 1963, le Groupe de travail CCITT sur le New Alphabet t??l??graphique propos?? d'affecter minuscules personnages aux colonnes 6 et 7, et Organisation internationale de normalisation TC 97 SC 2 vot?? en Octobre ?? int??grer le changement dans son projet de norme. Le groupe de travail de X3.2.4 vot?? son approbation pour que le changement ASCII lors de sa r??union mai 1963. Emplacement des lettres minuscules dans les colonnes 6 et 7 caus?? les personnages diff??rent en configuration binaire de la majuscule par un seul bit, qui a simplifi?? caract??re correspondance insensible ?? la casse et la construction de claviers et imprimantes.

Le comit?? de X3 a fait d'autres changements, y compris d'autres nouveaux personnages (la accolade et les personnages de ligne verticale), en renommant certains caract??res de contr??le (SOM devenus d??but de t??te (SOH)) et d??placer ou enlever d'autres (RU a ??t?? retir??). ASCII a ensuite ??t?? mis ?? jour comme USASI X3.4-1967, puis USASI X3.4-1968, ANSI X3.4-1977, et enfin, ANSI X3.4-1986 (les deux premiers sont parfois retronamed ANSI X3.4-1967, et X3.4-1968 ANSI).

Le comit?? de X3 a ??galement abord?? la fa??on ASCII doit ??tre transmise ( bit le moins significatif en premier), et comment il devrait ??tre enregistr?? sur bande perfor??e. Ils ont propos?? un Norme 9-piste pour bande magn??tique, et a tent?? de faire face ?? certaines formes de formats de cartes perfor??es.

ASCII lui-m??me ??tait d'abord utilis?? dans le commerce en 1963 en tant que code de t??l??imprimeur sept bits pour American Telephone & TWX (t??l??scripteur eXchange) le r??seau de Telegraph. TWX utilis?? ?? l'origine les cinq bits code pr??c??dent Baudot, qui a ??galement ??t?? utilis?? par la concurrence T??lex syst??me de t??l??imprimeur. Bob Bemer introduit des fonctionnalit??s telles que la s??quence d'??chappement. Son coll??gue britannique Hugh McGregor Ross a contribu?? ?? populariser ce travail-selon Bemer, "si bien que le code qui allait devenir ASCII fut d'abord appel?? le Code Bemer-Ross en Europe". En raison de son important travail sur l'ASCII, Bemer a ??t?? appel?? ??le p??re de l'ASCII."

Le 11 Mars 1968, le pr??sident am??ricain Lyndon B. Johnson a exig?? que tous les ordinateurs achet??s par les Etats-Unis l'appui du gouvernement f??d??ral, ASCII indiquant:

Je ai ??galement approuv?? les recommandations du Secr??taire du Commerce concernant les normes pour l'enregistrement de la Standard Code for Information Interchange sur des bandes magn??tiques et des bandes de papier quand ils sont utilis??s dans les op??rations informatiques. Tous les ordinateurs et configurations d'??quipement connexes intent??es dans l'inventaire du gouvernement f??d??ral ?? compter du 1er Juillet 1969, doivent avoir la capacit?? d'utiliser le Standard Code for Information Interchange et les formats prescrits par les normes du ruban et du papier ?? bande magn??tique lorsque ces m??dias sont utilis??s.

Autres organismes de normalisation internationaux ont ratifi?? codages de caract??res tels que ISO / CEI 646 qui sont identiques ou presque identiques ?? ASCII, avec des extensions pour les personnages en dehors de l'alphabet anglais et les symboles utilis??s en dehors des ??tats-Unis, comme le symbole pour le Royaume-Uni livres sterling la (??). Presque chaque pays a besoin d'une version adapt??e de ASCII, depuis ASCII adapt?? aux besoins de seulement aux Etats-Unis et quelques autres pays. Par exemple, le Canada a sa propre version qui a soutenu les caract??res fran??ais. Autres codages adapt??s comprennent ISCII (Inde), VISCII (Vietnam), et YUSCII (Yougoslavie). Bien que ces encodages sont parfois appel??s ASCII, vrai ASCII est d??fini strictement que par la norme ANSI.

ASCII a ??t?? incorpor?? dans le caract??re Unicode que les 128 premiers symboles, de sorte que les caract??res ASCII avoir les m??mes codes num??riques dans les deux ensembles. Ceci permet UTF-8 pour ??tre r??trocompatible avec ASCII, un avantage significatif.

des caract??res de contr??le ASCII

r??serves ASCII les 32 premiers codes (nombres d??cimaux) pour 0-31 caract??res de contr??le: codes ?? l'origine destin??s ?? ne pas repr??senter informations imprimables, mais plut??t de contr??ler des p??riph??riques (tels que imprimantes) qui utilisent ASCII, ou de fournir m??ta-informations sur les flux de donn??es telles que celles stock??es sur bande magn??tique. Par exemple, le caract??re 10 repr??sente la fonction "saut de ligne" (qui provoque une imprimante pour faire avancer son papier), et le caract??re 8 repr??sente "backspace". RFC 2822 se r??f??re ?? contr??ler caract??res qui ne comprennent pas de retour chariot, saut de ligne ou espace blanc comme caract??res de contr??le non-blancs. Sauf pour les caract??res de contr??le qui prescrivent formatage orient?? ligne ??l??mentaire, ASCII ne d??finit pas de m??canisme pour d??crire la structure ou l'apparence du texte dans un document. Autres r??gimes, tels que les langages de balisage , d'adresse de page et la pr??sentation du document et le formatage.

La norme ASCII originale utilis??e que de courtes phrases descriptives pour chaque caract??re de contr??le. L'ambigu??t?? cela a caus?? ??tait parfois intentionnelle (o?? un personnage serait utilis?? de fa??on l??g??rement diff??rente sur une liaison terminal que sur un flux de donn??es) et parfois accidentelle (comme ce "supprimer" signifie).

Probablement le seul appareil le plus influent sur l'interpr??tation de ces personnages ??tait le Teletype Mod??le 33 ASR, qui ??tait un terminal d'impression avec un disponible ruban de papier de l'option lecteur / punch. bande de papier ??tait un milieu tr??s populaire pour le stockage de programme ?? long terme jusqu'?? ce que les ann??es 1980, moins co??teuses et ?? certains ??gards moins fragile que la bande magn??tique. En particulier, les Teletype Mod??le 33 machines affectations pour les codes 17 (Control-Q, DC1, aussi connu comme XON), 19 (contr??le-S, DC3, aussi connu comme XOFF), et 127 ( Supprimer) est devenu normes de facto. Parce que le dessus de touche pour la touche O a ??galement montr?? un symbole fl??che gauche (de ASCII-1963, qui avait ce caract??re au lieu de soulignent), ?? une utilisation non conforme d'un code 15 (Ctrl-O, changement dans) interpr??t?? comme "supprimer le caract??re pr??c??dent" a ??galement ??t?? adopt?? par de nombreux syst??mes en temps partag?? au d??but mais finalement est devenu n??glig??.

L'utilisation du contr??le-S (XOFF, une abr??viation pour la transmission hors) comme un signal "de prise de contact" avertir un exp??diteur ?? arr??ter la transmission en raison de l'imminence de d??bordement, et Control-Q (XON, "transmettre sur") pour reprendre l'envoi, persiste ?? ce jour dans de nombreux syst??mes comme une technique manuelle de commande de sortie. Sur certains syst??mes de contr??le-S conserve sa signification mais Control-Q est remplac?? par un deuxi??me contr??le-S de reprendre la production.

Code 127 est officiellement nomm?? "Supprimer", mais l'??tiquette de t??l??scripteur ??tait "rubout". Depuis la norme d'origine n'a pas donn?? une interpr??tation d??taill??e pour la plupart des codes de contr??le, les interpr??tations de ce code vari??. Le sens de Teletype d'origine, et l'intention de la norme, ??tait d'en faire un personnage ignor??, le m??me que NUL (z??ros). Ce ??tait utile sp??cifiquement pour une bande de papier, parce poin??onner le tout-un motif sur le dessus d'une marque existante de bits serait oblit??rer. Tapes con??us pour ??tre ??main modifi??s" pourrait m??me ??tre produite avec des espaces de NULs suppl??mentaires (cassette vierge) de sorte qu'un bloc de caract??res pourrait ??tre "effac??" puis remplacements mis dans l'espace vide.

Comme terminaux vid??o ont commenc?? ?? remplacer les imprimer, la valeur du caract??re "rubout" a ??t?? perdu. Syst??mes d??cembre, par exemple, interpr??t??s "Supprimer" pour dire "supprimer le caract??re avant le curseur?? et cette interpr??tation est ??galement devenu courant dans les syst??mes Unix. La plupart des autres syst??mes utilis??s "Backspace" pour que le sens et utilis??s "Supprimer" pour dire "supprimer le caract??re au niveau du curseur". Cette derni??re interpr??tation est la plus courante aujourd'hui.

Beaucoup plus des codes de contr??le ont pu donner un sens tr??s diff??rent de leurs originaux. La ??fuite?? de caract??re (ESC, le code 27), par exemple, a ??t?? con??u ?? l'origine pour permettre l'envoi d'autres caract??res de contr??le comme des litt??raux au lieu d'invoquer leur signification. Ce est le m??me sens de ????vasion?? rencontr?? dans encodages d'URL, langage C , les cha??nes et d'autres syst??mes o?? certains caract??res ont une signification r??serv??. Au fil du temps ce sens a ??t?? coopt?? et a finalement ??t?? chang??. Dans l'usage moderne, un CES envoy?? ?? la borne indique g??n??ralement le d??but d'une s??quence de commandes, g??n??ralement sous la forme d'un soi-disant " ANSI code d'??chappement "(ou, plus correctement, un" contr??le de s??quence d'introduction ") en commen??ant par ESC suivie par un" (crochet gauche) caract??re [". Une ESC envoy?? ?? partir du terminal est le plus souvent utilis?? comme un out-of-band caract??re utilis?? pour terminer une op??ration, comme dans le TECO et vi ??diteurs de texte. En l'interface utilisateur graphique (GUI) et syst??mes de fen??trage, ESC provoque g??n??ralement une application interrompre son op??ration en cours ou ?? sortie (fin) tout ?? fait.

L'ambigu??t?? inh??rente de nombreux caract??res de contr??le, combin??e ?? leur usage historique, a cr???? des probl??mes lors du transfert de "texte brut" des fichiers entre syst??mes. Le meilleur exemple de ceci est le probl??me de saut de ligne sur les diff??rents syst??mes d'exploitation. t??l??scripteurs exigeaient que une ligne de texte se terminer par deux "Carriage Return" (qui se d??place la t??te d'impression au d??but de la ligne) et "Alimentation Line" (qui fait avancer le papier d'une ligne sans d??placer la t??te d'impression). Le nom ??retour chariot?? vient du fait que sur un manuel machine ?? ??crire le transport tenant le papier d??plac?? alors que la position o?? les touches frapp??es le ruban rest?? stationnaire. La totalit?? du transport a d?? ??tre pouss?? (retourn??) vers la droite afin de positionner la marge gauche du papier pour la ligne suivante.

Syst??mes d'exploitation (d??cembre OS / 8, RT-11, RSX-11, RSTS, TOPS-10, etc.) utilis??s deux caract??res pour marquer la fin d'une ligne pour que le dispositif de la console (?? l'origine Machines t??l??type) travailleraient. Par le temps que l'on appelle ??verre ATS" (plus tard appel??s tubes cathodiques ou bornes) sont arriv??s, la convention a ??t?? si bien ??tabli que la compatibilit?? ascendante a n??cessit?? la poursuite de la convention. Lorsque Gary Kildall clon?? RT-11 pour cr??er CP / M, il suivit ??tabli Convention d??cembre. Jusqu'?? l'introduction de PC-DOS en 1981, IBM ne avait pas la main dans ce parce que leurs syst??mes utilis??s 1970 EBCDIC au lieu d'ASCII exploitation et ils ont ??t?? orient??s vers l'entr??e ?? cartes perfor??es et de sortie de l'imprimante de la ligne sur laquelle la notion de ??retour chariot?? n'a pas de sens. IBM PC-DOS (??galement commercialis?? sous le MS-DOS par Microsoft) a h??rit?? de la convention en vertu d'??tre un clone de CP / M, et Windows h??rit?? de MS-DOS.

Malheureusement, n??cessitant deux caract??res pour marquer la fin d'une ligne introduit une complexit?? et des questions quant ?? la fa??on d'interpr??ter chaque caract??re quand rencontr?? seul inutile. Pour simplifier les choses flux de donn??es en texte clair, y compris les fichiers, sur Multics utilis?? saut de ligne (LF) seul comme un terminateur de ligne. Unix et Syst??mes de type Unix, et Syst??mes Amiga, a adopt?? cette convention de Multics. L'original Macintosh OS, Apple DOS, et ProDOS, d'autre part, utilis??e retour chariot (CR) seul comme un terminateur de ligne; cependant, puisque Apple l'a remplac??e par la base Unix- X syst??me d'exploitation OS, ils utilisent maintenant un saut de ligne (LF) ainsi.

Ordinateurs attach?? ?? la ARPANET inclus machines ex??cutant des syst??mes d'exploitation tels que TOPS-10 et TENEX utilisant les fins de ligne CR-LF, machines ex??cutant des syst??mes d'exploitation tels que Multics utilisant les fins de ligne LF, et les machines ex??cutant des syst??mes d'exploitation tels que OS / 360 qui repr??sentait lignes comme le nombre de caract??res suivie par les caract??res de la ligne et que utilis??s EBCDIC plut??t que ASCII. Le protocole Telnet d??fini un caract??re ASCII "Network Virtual Terminal" (NVT), de sorte que les connexions entre les h??tes avec diff??rentes conventions de ligne fin et jeux de caract??res pourraient ??tre soutenus par la transmission d'un format standard de texte sur le r??seau; il a utilis?? ASCII, avec des fins de ligne CR-LF, et le logiciel en utilisant d'autres conventions se traduirait entre les conventions locales et le NVT. Le File Transfer Protocol adopt?? le protocole Telnet, y compris l'utilisation du terminal de r??seau virtuel, pour une utilisation lors de la transmission des commandes et le transfert de donn??es en mode ASCII par d??faut. Cela ajoute de la complexit?? ?? des impl??mentations de ces protocoles, et ?? d'autres protocoles de r??seau, tels que ceux utilis??s pour E-mail et le World Wide Web, sur les syst??mes qui ne utilisent pas CR-LF la convention de fin de ligne de la NVT.

Anciens syst??mes d'exploitation tels que TOPS-10, avec CP / M, suivis longueur du fichier que dans des unit??s de blocs de disque et utilis??s Control-Z (SUB) pour marquer la fin du texte actuel dans le fichier. Pour cette raison, EOF, ou de fin de fichier, et a ??t?? utilis?? famili??rement classiquement comme acronyme de trois lettres (TLA) pour le contr??le-Z au lieu de substitut. Pour diverses raisons, le code de fin de texte, ETX aka Control-C, ??tait inappropri?? et Z en utilisant le code de commande ?? la fin d'un fichier, il est analogue ?? la fin de l'alphabet, un tr??s pratique mn??motechnique. Un historique commun, et encore r??pandue, utilise la convention ETX aka Control-C convention de code pour interrompre et arr??ter un programme via un flux de donn??es d'entr??e, g??n??ralement ?? partir d'un clavier.

En biblioth??que et Unix conventions C, le caract??re nul est utilis?? pour terminer le texte cordes; tel cha??nes ?? z??ro terminal peuvent ??tre connus ?? l'abr??viation que ASCIZ ou ASCIIZ, o?? ici Z signifie "z??ro".

ASCII code de contr??le tableau

Binaire Octobre D??cembre Hex Abr Nom
000 0000 000 0 00 NUL ^ @ \ 0 Caract??re nul
000 0001 001 1 01 SOH ^ A D??but de la t??te
000 0010 002 2 02 STX ^ B D??but du texte
000 0011 003 3 03 ETX ^ C Fin de texte
000 0100 004 4 04 EOT ^ D Fin de la transmission
000 0101 005 5 05 ENQ ^ E Demande de renseignements
000 0110 006 6 06 ACK ^ F Reconnaissance
000 0111 007 7 07 BEL ^ G \ A Cloche
000 1000 010 8 08 BS ^ H \ B Retour arri??re
000 1001 011 9 09 HT ^ I \ T Tab horizontale
000 1010 012 10 0A LF ^ J \ N Saut de ligne
000 1011 013 11 0B Vermont ^ K \ V Tabulation verticale
000 1100 014 12 0C FF L ^ \ F Saut
000 1101 015 13 0D CR ^ M \ R Retour chariot
000 1110 016 14 0E SO ^ N Maj Out
000 1111 017 15 0F SI ^ O Maj En
001 0000 020 16 10 DLE ^ P Data Link ??vasion
001 0001 021 17 11 DC1 Q ^ Device Control 1 (OFT. XON)
001 0010 022 18 12 DC2 R ^ Device Control 2
001 0011 023 19 13 DC3 ^ S Device Control 3 (souvent. XOFF)
001 0100 024 20 14 DC4 ^ T Device Control 4
001 0101 025 21 15 NAK ^ U Accus?? n??gative
001 0110 026 22 16 SYN ^ V Inactif synchrone
001 0111 027 23 17 ETB ^ W Fin du bloc Transmission
001 1000 030 24 18 POUVOIR ^ X Annuler
001 1001 031 25 19 EM Y ^ Fin de la moyenne
001 1010 032 26 1A SUB ^ Z Rempla??ant
001 1011 033 27 1B ESC ^ [ \ E ??vasion
001 1100 034 28 1C FS ^ \ D??poser Separator
001 1101 035 29 1D GS ^] Groupe S??parateur
001 1110 036 30 1E RS ^^ Enregistrez Separator
001 1111 037 31 1F ??tats-Unis ^ _ Unit?? s??parateur
111 1111 177 127 7F DEL ^? Effacer
  1. ^ Le Caract??res Unicode de la r??gion de U + 2400 ?? U + 2421 r??serv??e pour repr??senter les caract??res de contr??le quand il est n??cessaire d'imprimer ou de les afficher plut??t que d'avoir ?? se acquitter de leur fonction. Certains navigateurs ne peuvent pas les afficher correctement.
  2. ^ Notation caret souvent utilis?? pour repr??senter les caract??res de contr??le sur un terminal. Sur la plupart des terminaux texte, en maintenant enfonc??e la Ctrl tout en tapant le deuxi??me caract??re tapera le caract??re de contr??le. Parfois, la touche shift ne est pas n??cessaire, par exemple ^ @ peut ??tre typable avec juste Ctrl et 2.
  3. ^ Codes d'??chappement de caract??re en langage de programmation C et de nombreuses autres langues influenc??s par elle, comme Java et Perl (mais pas toutes les impl??mentations supportent n??cessairement tous les codes d'??chappement).
  4. ^ Le caract??re Backspace peut ??galement ??tre entr?? en appuyant sur la touche ← Backspace sur certains syst??mes.
  5. ^ Un b L'ambigu??t?? de Backspace est due ?? d??but des terminaux con??us en supposant que la principale utilisation du clavier serait ?? entrer manuellement une bande de papier sans ??tre connect?? ?? un ordinateur. Pour supprimer le caract??re pr??c??dent, il fallait sauvegarder le perforateur de bande de papier, qui pour des raisons m??caniques et la simplicit?? ??tait un bouton sur le poin??on lui-m??me et pas le clavier, puis tapez le caract??re rubout. Ils ont donc plac?? un rubout production touche ?? l'emplacement utilis?? sur les machines ?? ??crire pour revenir en arri??re. Lorsque les syst??mes utilis??s ces terminaux et ?? condition ??dition de ligne de commande, ils ont d?? utiliser le code "rubout" pour effectuer un retour en arri??re, et ne ont souvent pas interpr??t?? le caract??re de retour arri??re (ils pourraient echo "^ H" pour revenir en arri??re). D'autres terminaux ne sont pas con??us pour la bande de papier fait la cl?? ?? cet endroit produire Backspace, et les syst??mes con??us pour ces utilis??s ce personnage ?? sauvegarder. Puisque le code de suppression produit souvent un effet de retour en arri??re, cela a aussi forc?? les fabricants de terminaux pour faire toute supprimer la cl?? produit autre chose que le caract??re Suppr.
  6. ^ Le caract??re de tabulation peut ??galement ??tre entr?? en appuyant sur la touche de l'onglet sur la plupart des syst??mes.
  7. ^ Le caract??re retour chariot peut ??galement ??tre entr?? en appuyant sur la touche ↵ touche Entr??e ou Return sur la plupart des syst??mes.
  8. ^ La s??quence \ 'e' d'??chappement ne est pas partie de l'ISO C et bien d'autres sp??cifications de langue. Toutefois, il est entendu par plusieurs compilateurs.
  9. ^ Le caract??re d'??chappement peut ??galement ??tre entr?? en appuyant sur la touche Echap sur certains syst??mes.
  10. ^ ^^ Signifie Ctrl + ^ (caret appuyant sur les touches "Ctrl" et).
  11. ^ Le caract??re Supprimer peut parfois ??tre entr?? en appuyant sur la touche ← Backspace sur certains syst??mes.

Caract??res ASCII imprimables

Codes 20 hex ?? 7F hex , connu comme les caract??res imprimables, repr??sentent les lettres, les chiffres, signes de ponctuation et quelques symboles divers. Il ya 95 caract??res imprimables au total.

Code 20 hex , le caract??re espace, d??signe l'espace entre les mots, tel que produit par la barre d'espace du clavier. Depuis le caract??re espace est consid??r?? comme un graphique invisible (plut??t que d'un caract??re de contr??le) et donc ne seraient normalement pas visible, il est repr??sent?? ici par caract??re Unicode U + 2420 "␠"; Les caract??res Unicode U + 2422 "␢" et U + 2423 "␣" sont ??galement disponibles pour une utilisation quand une repr??sentation visible de l'espace est n??cessaire.

Code 7F hex correspond ?? la (DEL) caract??re non imprimable "Supprimer" de contr??le et ne est donc omis de ce tableau; il est couvert dans le tableau de la section pr??c??dente.

Les versions ant??rieures de ASCII utilis?? la fl??che vers le haut au lieu de la caret (5E hex ) et la fl??che gauche ?? la place de la soulignement (5F hex ).

Binaire Octobre D??cembre Hex Glyphe
010 0000 040 32 20
010 0001 041 33 21 !
010 0010 042 34 22 "
010 0011 043 35 23 #
010 0100 044 36 24 $
010 0101 045 37 25 %
010 0110 046 38 26 &
010 0111 047 39 27 '
010 1000 050 40 28 (
010 1001 051 41 29 )
010 1010 052 42 2A *
010 1011 053 43 2B +
010 1100 054 44 2C ,
010 1101 055 45 2D -
010 1110 056 46 2E .
010 1111 057 47 2F /
011 0000 060 48 30 0
011 0001 061 49 31 1
011 0010 062 50 32 2
011 0011 063 51 33 3
011 0100 064 52 34 4
011 0101 065 53 35 5
011 0110 066 54 36 6
011 0111 067 55 37 7
011 1000 070 56 38 8
011 1001 071 57 39 9
011 1010 072 58 3A :
011 1011 073 59 3B ;
011 1100 074 60 3C <
011 1101 075 61 3D =
011 1110 076 62 3E >
011 1111 077 63 3F ?
Binaire Octobre D??cembre Hex Glyphe
100 0000 100 64 40 @
100 0001 101 65 41 Un
100 0010 102 66 42 B
100 0011 103 67 43 C
100 0100 104 68 44 R??
100 0101 105 69 45 E
100 0110 106 70 46 Fa
100 0111 107 71 47 Sol
100 1000 110 72 48 H
100 1001 111 73 49 Je
100 1010 112 74 4A J
100 1011 113 75 4B K
100 1100 114 76 4C L
100 1101 115 77 4D M
100 1110 116 78 4E N
100 1111 117 79 4F O
101 0000 120 80 50 P
101 0001 121 81 51 Q
101 0010 122 82 52 R
101 0011 123 83 53 S
101 0100 124 84 54 T
101 0101 125 85 55 U
101 0110 126 86 56 V
101 0111 127 87 57 W
101 1000 130 88 58 X
101 1001 131 89 59 Y
101 1010 132 90 5A Z
101 1011 133 91 5B [
101 1100 134 92 5C \
101 1101 135 93 5D ]
101 1110 136 94 5E ^
101 1111 137 95 5F _
Binaire Octobre D??cembre Hex Glyphe
110 0000 140 96 60 `
110 0001 141 97 61 une
110 0010 142 98 62 b
110 0011 143 99 63 c
110 0100 144 100 64 r??
110 0101 145 101 65 e
110 0110 146 102 66 fa
110 0111 147 103 67 g
110 1000 150 104 68 h
110 1001 151 105 69 Je
110 1010 152 106 6A j
110 1011 153 107 6B k
110 1100 154 108 6C l
110 1101 155 109 6D m
110 1110 156 110 6E n
110 1111 157 111 6F o
111 0000 160 112 70 p
111 0001 161 113 71 q
111 0010 162 114 72 r
111 0011 163 115 73 s
111 0100 164 116 74 t
111 0101 165 117 75 u
111 0110 166 118 76 v
111 0111 167 119 77 w
111 1000 170 120 78 x
111 1001 171 121 79 y
111 1010 172 122 7A z
111 1011 173 123 7B {
111 1100 174 124 7C |
111 1101 175 125 7D }
111 1110 176 126 7E ~

Alias

A Juin 1992 et RFC le Internet Assigned Numbers Authority registre des jeux de caract??res reconna??t les alias insensibles ?? la casse suivants pour ASCII adapt??s pour une utilisation sur Internet:

  • ANSI_X3.4-1968 (nom canonique)
  • iso-ir-6
  • ANSI_X3.4-1986
  • ISO_646.irv: 1991
  • ASCII (avec ASCII-7 et ASCII-8 variantes)
  • ISO646-US
  • US-ASCII (pr??f??r?? Nom MIME)
  • nous
  • IBM367
  • cp367
  • csASCII

Parmi ceux-ci, l'IANA encourage l'utilisation du nom "US-ASCII" pour des usages Internet de ASCII. On trouve souvent ce dans le param??tre "charset" option dans l'ent??te Content-Type de certains messages MIME, dans l'??l??ment ??quivalent "meta" de certains documents HTML, et dans la partie de d??claration de codage du prologue de certains documents XML.

Variantes

Comme la technologie informatique la propagation ?? travers le monde, diff??rente les organismes de normalisation et les soci??t??s d??velopp??es de nombreuses variantes de ASCII pour faciliter l'expression des langues autres que l'anglais qui utilisaient alphabets base-romaine. On pourrait classe certaines de ces variations que " extensions ASCII ", bien que certains mauvais usage de ce terme pour repr??senter toutes les variantes, y compris ceux qui ne pr??serve pas la carte de caract??res ASCII dans la plage de 7 bits.

Le Code PETSCII Commodore International utilis??s pour leurs syst??mes 8-bits est probablement unique parmi les codes post-1970 en se basant sur l'ASCII-1963, au lieu de l'ASCII-1967 plus fr??quente, comme on en trouve sur le Ordinateur ZX Spectrum. Atari et ordinateurs Galaksija ??galement utilis??s variantes ASCII.

7 bits

Depuis le d??but de son d??veloppement, ASCII a ??t?? destin?? ?? ??tre juste un de plusieurs variantes nationales d'une norme de code de caract??re international, finalement publi?? en tant que ISO / CEI 646 (1972), qui part la plupart des caract??res en commun, mais assigner d'autres localement les caract??res utiles ?? plusieurs points de code r??serv??s pour "usage national." Cependant, les quatre ann??es qui se sont ??coul??es entre la publication de l'ASCII-1963 et la premi??re acceptation de l'ISO d'une recommandation internationale en 1967 ont caus?? les choix des ASCII pour les caract??res d'utilisation nationaux semblent ??tre les normes de facto pour le monde, provoquant la confusion et d'incompatibilit?? une fois les autres pays ne commencer ?? faire leurs propres affectations ?? ces points de code.

ISO / CEI 646, comme ASCII, ??tait un jeu de caract??res 7 bits. Il n'a pas fait de codes suppl??mentaires disponibles, de sorte que les m??mes points de code cod?? caract??res diff??rents dans des pays diff??rents. ??chapper codes ont ??t?? d??finis pour indiquer la variante nationale appliqu??e ?? un morceau de texte, mais ils sont rarement utilis??s, de sorte qu'il ??tait souvent impossible de savoir ce que la variante de travailler avec et donc quel personnage repr??sent?? un code, et dans les syst??mes g??n??raux de traitement de texte pourrait face avec une seule variante de toute fa??on.

Parce que les supports et bretelles caract??res ASCII ont ??t?? affect??es ?? des points "d'utilisation nationale" de code qui ont ??t?? utilis??s pour les caract??res accentu??s dans d'autres variantes nationales de l'ISO / CEI 646, un programmeur allemand, fran??ais ou su??dois, etc. utilisant leur variante nationale de l'ISO / CEI 646, plut??t que ASCII, d?? ??crire, et donc lire, quelque chose comme

ä aÄiÜ = 'ON'; ü

au lieu de

{ a[i]='\n'; }

C trigraphes ont ??t?? cr????s pour r??soudre ce probl??me pour ANSI C, bien que leur introduction tardive et mise en ??uvre incoh??rente dans les compilateurs limitent leur utilisation.

8 bits

Finalement, comme 8, 16, et Ordinateurs 32 bits ont commenc?? ?? remplacer 18 et 36 bits des ordinateurs comme la norme, il est devenu courant d'utiliser un octet de 8 bits pour stocker chaque caract??re dans la m??moire, donnant l'occasion aux ??tendues, 8 bits, parents de ASCII. Dans la plupart des cas, ces d??velopp??s comme de v??ritables extensions de ASCII, laissant le caract??re de cartographie d'origine, intact, mais l'ajout de d??finitions de caract??res suppl??mentaires apr??s les premiers 128 (c.-?? 7 bits) caract??res.

La plupart des syst??mes informatiques de la maison t??t d??velopp?? leurs propres jeux de caract??res 8 bits contenant de trac?? et de jeux glyphes, et souvent remplis dans certains ou tous les caract??res de contr??le 0-31 avec plus de graphiques. L'IBM PC d??fini page de code 437, qui a remplac?? les caract??res de contr??le avec des symboles graphiques tels que smiley face, et cartographi?? caract??res graphiques suppl??mentaires pour les 128 postes sup??rieurs. Les syst??mes d'exploitation tels que DOS ces pages de code, et les fabricants de prise en charge PC IBM les ont soutenus dans le mat??riel. Digital Equipment Corporation a d??velopp?? le Multinational Character Set (DEC-MCS) pour une utilisation dans le populaire VT220 terminal, ce ??tait l'une des premi??res extensions con??us plus pour les langues internationales que pour les blocs graphiques. Le Macintosh d??fini MacRoman et Postscript ??galement d??fini un ensemble, ?? la fois de ces deux lettres internationales contenues et des signes de ponctuation typographiques ?? la place des graphiques, plus comme les jeux de caract??res modernes. Le ISO / CEI 8859 standard (d??riv?? du DEC-MCS) a finalement fourni une norme que la plupart des syst??mes copi??s (au moins aussi pr??cis??ment que ils ont copi?? ASCII, mais avec de nombreuses substitutions). Une extension populaire con??u par Microsoft, Windows 1252 (souvent mal ??tiquet??s comme ISO-8859-1), ajout?? les signes de ponctuation typographiques n??cessaires pour l'impression de texte attrayant.

ISO-8859-1, Windows-1252, et l'origine ASCII 7 bits ??taient codages de caract??res les plus courantes jusqu'?? la fin des ann??es 2000, de nos jours UTF-8 est de plus en plus commun.

Unicode

Unicode et l'ISO / CEI 10646 Universal Character Set (UCS) ont un ??ventail beaucoup plus large de caract??res, et leurs diverses formes de codage ont commenc?? ?? supplanter ISO / CEI 8859 et ASCII rapidement dans de nombreux environnements. Alors que ASCII est limit??e ?? 128 caract??res, Unicode et les UCS soutiennent plusieurs caract??res en s??parant les concepts de l'identification unique (en utilisant des nombres naturels appel??s points de code) et l'encodage (?? 8, 16 ou 32 formats bits binaires, appel?? UTF-8, UTF-16 et UTF-32).

Pour permettre la compatibilit?? ascendante, l'ASCII 128 et 256 ISO-8859-1 (Latin 1) caract??res sont attribu??s des points de code Unicode / UCS qui sont les m??mes que leurs codes dans les normes ant??rieures. Par cons??quent, ASCII peut ??tre consid??r?? comme un syst??me de codage sur 7 bits pour un tr??s petit sous-ensemble de Unicode / UCS, et ASCII (lorsque le pr??fixe 0 que le huiti??me bit) est valide UTF-8.

Ordre

Afin code ASCII est aussi appel?? afin de ASCIIbetical. Collation des donn??es est parfois fait dans cet ordre plut??t que par ordre alphab??tique "standard" ( s??quence de classement). Les principaux ??carts dans l'ordre ASCII sont:

  • Tous les majuscules avant les minuscules, par exemple, "Z" avant "a"
  • Chiffres et de nombreux signes de ponctuation sont avant les lettres, par exemple, "4" pr??c??de "une"
  • Les nombres sont tri??s na??vement comme des cha??nes, par exemple, "10" pr??c??de "2"

Un ordre interm??diaire - facilement mis en ??uvre - convertit lettres majuscules en minuscules avant de comparer des valeurs ASCII. Num??ro Na??f tri peut ??tre ??vit??e par z??ro remplir tous les num??ros (par exemple "02" pour trier avant "10" comme pr??vu), bien que ce est une solution externe et n'a rien ?? voir avec la commande elle-m??me.

R??cup??r?? ?? partir de " http://en.wikipedia.org/w/index.php?title=ASCII&oldid=542989240 "