ASCII | это… Что такое ASCII?

У этого термина существуют и другие значения, см. ASCII (значения).

ASCII

ASCII (англ. American Standard Code for Information Interchange) — американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов. В американском варианте английского языка произносится [э́ски], тогда как в Великобритании чаще произносится [а́ски]; по-русски произносится также [а́ски] или [аски́].

ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов. Изначально разработанная как 7-битная, с широким распространением 8-битного байта ASCII стала восприниматься как половина 8-битной. В компьютерах обычно используют расширения ASCII с задействованным 8-м битом и второй половиной кодовой таблицы (например КОИ-8).

Содержание

  • 1 Наложение символов
  • 2 Национальные варианты ASCII
  • 3 Кодировка
  • 4 Управляющие символы
  • 5 Структурные свойства таблицы
  • 6 Представление ASCII в ЭВМ
  • 7 Примечание
  • 8 См. ` { | } ~. В дополнение к этому, на месте # может быть размещён £, а на месте $ — ¤. Такая система хорошо подходит для европейских языков, где нужны лишь несколько дополнительных символов. Вариант ASCII без национальных символов называется US-ASCII, или «International Reference Version».

    Для некоторых языков с нелатинской письменностью (русского, греческого, арабского, иврита) существовали более радикальные модификации ASCII. Одним из вариантов был отказ от строчных латинских букв — на их месте размещались национальные символы (для русского и греческого — только заглавные буквы). Другой вариант — переключение между US-ASCII и национальным вариантом «на лету» с помощью символов SO (Shift Out) и SI (Shift In) — в этом случае в национальном варианте можно полностью устранить латинские буквы и занять всё пространство под свои символы. См. также КОИ-7.

    Впоследствии оказалось удобнее использовать 8-битные кодировки (кодовые страницы), где нижнюю половину кодовой таблицы (0—127) занимают символы US-ASCII, а верхнюю (128—255) — дополнительные символы, включая набор национальных символов. Таким образом, верхняя половина таблицы ASCII до повсеместного внедрения Юникода активно использовалась для представления локализированных символов, букв местного языка. Отсутствие единого стандарта размещения кириллических символов в таблице ASCII доставляло множество проблем с кодировками (КОИ-8, Windows-1251 и другие). Другие языки с нелатинской письменностью тоже страдали из-за наличия нескольких разных кодировок.

    В Юникоде первые 128 символов тоже совпадают с соответствующими символами US-ASCII.

    Кодировка

     .0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
    0.NULSOHSTXETXEOTENQACKBELBSTABLFVTFFCRSOSI
    1._
    6.`abcdefghijklmno
    7.pqrstuvwxyz{|}~DEL

    Символ 0x5e в первой версии стандарта ASCII (1963) соответствовал стрелке вверх, а символ 0x5f — стрелке влево. Стандарт ECMA-6 (1965) заменил их на знак вставки (используемый также в роли циркумфлекса) и нижнюю черту (подчёркивание) соответственно.

    Управляющие символы

    Основная статья: Управляющие символы

    Поскольку ASCII изначально предназначался для обмена информацией (по телетайпу), в нём, кроме информационных символов, используются символы-команды для управления связью. Это обычный набор спецсигналов, применявшийся и в других докомпьютерных средствах обмена сообщениями (азбука Морзе, семафорная азбука), дополненный с учётом специфики устройства.

    (После названия каждого символа указан его 16-ричный код)

    • NUL, 00 — Null, пустой. Всегда игнорировался. На перфолентах 1 представлялась отверстием, 0 — отсутствием отверстия. Поэтому пустые части перфоленты до начала и после конца сообщения состояли из таких символов. Сейчас используется во многих языках программирования как конец строки. (Строка понимается как последовательность символов.) В некоторых операционных системах NUL — последний символ любого текстового файла.
    • SOH, 01 — Start Of Heading, начало заголовка.
    • STX, 02 — Start of Text, начало текста. Текстом называлась часть сообщения, предназначенная для печати. Адрес, контрольная сумма и т. д. входили или в заголовок, или в часть сообщения после текста.
    • ETX, 03 — End of Text, конец текста. Здесь телетайп прекращал печатать. Использование символа Ctrl-C, имеющего код 03, для прекращения работы чего-то (обычно программы), восходит ещё к тем временам.
    • EOT, 04 — End of Transmission, конец передачи. В системе UNIX Ctrl-D, имеющий тот же код, означает конец файла при вводе с клавиатуры.
    • ENQ
      , 05 — Enquire. Прошу подтверждения.
    • ACK, 06 — Acknowledgement. Подтверждаю.
    • BEL, 07 — Bell, звонок, звуковой сигнал. Сейчас тоже используется. В языках программирования C и C++ обозначается \a.
    • BS, 08 — Backspace, возврат на один символ. Сейчас стирает предыдущий символ.
    • TAB, 09 — Tabulation. Обозначался также HT — Horizontal Tabulation, горизонтальная табуляция. Во многих языках программирования обозначается \t .
    • LF, 0A — Line Feed, перевод строки. Сейчас в конце каждой строчки текстового файла ставится либо этот символ, либо CR, либо и тот и другой (CR, затем LF), в зависимости от операционной системы. Во многих языках программирования обозначается \n и при выводе текста приводит к переводу строки.
    • VT, 0B — Vertical Tab, вертикальная табуляция.
    • FF, 0C — Form Feed, прогон страницы, новая страница.
    • CR, 0D — Carriage Return, возврат каретки. Во многих языках программирования этот символ, обозначаемый \r, можно использовать для возврата в начало строчки без перевода строки. В некоторых операционных системах этот же символ, обозначаемый Ctrl-M, ставится в конце каждой строчки текстового файла перед LF.
    • SO, 0E — Shift Out, измени цвет ленты (использовался для двуцветных лент; цвет менялся обычно на красный). В дальнейшем обозначал начало использования национальной кодировки.
    • SI, 0F — Shift In, обратно к Shift Out.
    • DLE, 10 — Data Link Escape, освобождение канала данных — следующие символы представляют собой данные, а не управляющие символы.
    • DC1, 11 — Device Control 1, 1-й символ управления устройством — включить устройство чтения перфоленты.
    • DC2, 12 — Device Control 2, 2-й символ управления устройством — включить перфоратор.
    • DC3, 13 — Device Control 3, 3-й символ управления устройством — выключить устройство чтения перфоленты.
    • DC4, 14 — Device Control 4, 4-й символ управления устройством — выключить перфоратор.
    • NAK, 15 — Negative Acknowledgment, не подтверждаю. Обратно Acknowledgment.
    • SYN, 16 — Synchronization. Этот символ передавался, когда для синхронизации было необходимо что-нибудь передать.
    • ETB, 17 — End of Text Block, конец текстового блока. Иногда текст по техническим причинам разбивался на блоки.
    • CAN, 18 — Cancel, отмена (того, что было передано ранее).
    • EM, 19 — End of Medium, конец носителя (кончилась перфолента и т. д.)
    • SUB, 1A — Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче. Сейчас Ctrl-Z используется как конец файла при вводе с клавиатуры в системах DOS и Windows. У этой функции нет никакой очевидной связи с символом SUB.
    • ESC, 1B — Escape. Следующие за ним символы имеют какое-то другое значение, отличное от того, которое определено в ASCII. Обычно начинал управляющие последовательности.
    • FS, 1C — File Separator, разделитель файлов.
    • GS
      , 1D — Group Separator, разделитель групп.
    • RS, 1E — Record Separator, разделитель записей.
    • US, 1F — Unit Separator, разделитель юнитов. То есть поддерживалось 4 уровня структуризации данных: сообщение могло состоять из файлов, файлы из групп, группы из записей, записи из юнитов.
    • DEL, 7F — Delete, стереть последний символ. Символом DEL, состоящим в двоичном коде из всех единиц, можно было забить любой символ. Устройства и программы игнорировали DEL так же, как NUL. Код этого символа происходит из первых текстовых процессоров с памятью на перфоленте: в них удаление символа происходило забиванием его кода дырочками (обозначавшими логические единицы).

    Структурные свойства таблицы

    • Цифры 0—9 представляются своими двоичными значениями (например, 5=01012), перед которыми стоит 00112. Таким образом, двоично-десятичные числа (BCD) превращаются в ASCII-строку с помощью простого добавления слева 00112 к каждому двоично-десятичному полубайту.
    • Буквы A-Z верхнего и нижнего регистров различаются в своём представлении только одним битом, что упрощает преобразование регистра и проверку на диапазон. Буквы представляются своими порядковыми номерами в алфавите, записанными в двоичной системе счисления, перед которыми стоит 1002 (для букв верхнего регистра) или 1102 (для букв нижнего регистра).

    Представление ASCII в ЭВМ

    На подавляющем большинстве современных компьютеров минимально адресуемая единица памяти — 8-битный байт, поэтому там используются 8-битные, а не 7-битные символы. Обычно символ ASCII расширяют до 8 бит, просто добавляя один нулевой бит в качестве старшего.

    На компьютерах системы IBM/360, однако, в случае использования ASCII применялся другой метод: 6-й бит (если считать самый младший бит первым) перемещается в 7-й, а бывший 7-й «раздваивается» и копируется и в 8-й бит, и в 6-й. Получается такая таблица [1]:

     .0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
    0.NULSOMEOAEOMEQTWRURUBELLBKSPHTLFVTFFCRSOSI
    1.DC0DC1DC2DC3DC4ERRSYNCLEMS0S1S2S3S4S5S6S7
    2.                
    3.                
    4.BLANK !«#$ %&()*+,./
    5.0123456789 : ;<=> ?
    6.                
    7.                
    8.                
    9.                
    A.@ABCDEFGHIJKLMNO
    B.PQRSTUVWXYZ[\]
    C.                
    D.                
    E. abcdefghijklmno
    F.pqrstuvwxyz   ESCDEL

    На тех компьютерах, где минимально адресуемой единицей памяти было 36-битное слово, поначалу использовали 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах в одном слове стали размещать либо 5 семибитных символов (1 бит оставался лишним), либо 4 девятибитных символа.

    ASCII-коды используются также для определения нажатой клавиши при программировании. Для стандартной QWERTY-клавиатуры таблица кодов выглядит следующим образом:

    Escape

    27

    F1

    112

    F2

    113

    F3

    114

    F4

    115

    F5

    116

    F6

    117

    F7

    118

    F8

    119

    F9

    120

    F10

    121

    F11

    122

    F12

    123

    Print Screen

    Scroll Lock

    145

    Pause

    19

    192

    1

    49

    2

    50

    3

    51

    4

    52

    5

    53

    6

    54

    7

    55

    8

    56

    9

    57

    0

    48

    189

    =+

    187

    Back Space

    8

    Insert

    45

    Home

    36

    Page Up

    33

    Num Lock

    144

    / доп.

    111

    * доп.

    106

    + доп.

    107

    Tab

    9

    Q

    81

    W

    87

    E

    69

    R

    82

    T

    84

    Y

    89

    U

    85

    I

    73

    O

    79

    P

    80

    [

    219

    ]

    221

    Delete

    46

    End

    35

    Page Down

    34

    7 доп.

    109

    8 доп.

    108

    9 доп.

    105

    Caps Lock

    20

    A

    65

    S

    83

    D

    68

    F

    70

    G

    71

    H

    72

    J

    74

    K

    75

    L

    76

    186

    ‘э

    222

    Enter

    13

    4 доп.

    100

    5 доп.

    101

    6 доп.

    102

    Enter доп.

    13

    Shift

    16

    Z

    90

    X

    88

    C

    67

    V

    86

    B

    66

    N

    78

    M

    77

    ,<

    188

    .>

    190

    /

    191

    Shift

    16

    \|

    220

    Up

    38

    1 доп.

    97

    2 доп.

    98

    3 доп.

    99

    Ctrl

    17

    win

    Alt

    18

    Space Bar

    32

    Alt

    18

    win

    list

    Ctrl

    17

    Left

    37

    Down

    40

    Right

    39

    Ins/0

    45/96

    Del/.

    46/110

    Примечание

    1. G. M. Amdahl, G. A. Blaauw, F. P. Brooks, Jr. Architecture of the IBM System/360, 1964

    См. также

    • Переносимый набор символов
    • Управляющие символы
    • EBCDIC
    • ISCII
    • VISCII
    • YUSCII
    • Юникод
    • ASCII art
    • КОИ-8

    Ссылки

    • Цветная таблица ASCII
    • Standard ECMA-6: 7-bit Coded Character Set, 6th edition  (англ.). Ecma International (December 1991). Архивировано из первоисточника 23 августа 2011.
    • Tom Jennings An annotated history of some character codes or ASCII: American Standard Code for Information Infiltration  (англ.) (1999-09-16 — 2004-10-29). Архивировано из первоисточника 23 августа 2011.
    • ASCII Chart and Other Resources  (англ.). JimPrice.Com.
    Кодировки символов
    Основы →алфавит • текст ( файл • данные ) • набор символов • конверсия
    Исторические кодировки →Докомп. : семафорная (Макарова) • Морзе • Бодо • МТК-2Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646
    совре-
    менное
    8-битное
    представ-
    ление
    символы →ASCII ( управляющие • печатные )не-ASCII ( псевдографика )
    8бит. код.стр.Разные →   Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic
    ISO 8859 →1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
    Windows →1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4
    IBM&DOS →437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
    Много-
    байтные
    Традиционные →DBCS ( GB2312 ) • HTML
    Unicode →UTF-16 • UTF-8 • список символов ( кириллица )
    Связанные
    темы →
    интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображениеУтилиты: iconv • recode

    Что такое ASCII

    Американский стандартный код для обмена информацией (ASCII) — это стандарт, который принимает английские символы, числа, символы пунктуации и другие специальные символы и назначает их где-нибудь в 255 слотах, доступных в 8-битном коде, который был доступен для старых компьютеров.

    В этой статье кратко рассматривается история ASCII и описывается его важность.

    Содержание

    1. Почему был создан ASCII?
    2. Коды ASCII
    3. Управляющие персонажи
    4. Персонажи для печати
    5. Расширенный ASCII
    6. Заключение

    Почему был создан ASCII?

    Создание ASCII произошло из-за использования телеграфных машин. До 1960-х годов у компьютеров было несколько различных способов создания персонажей в своих системах. По мере роста компьютерных сетей стало ясно, что необходим последовательный способ представления различных персонажей, чтобы связь могла происходить между машинами.

    Американский национальный институт стандартов, некоммерческая группа, получила запрос от инженера IBM Боба Бемера о создании организации, способной генерировать стандарт, чтобы можно было использовать единый код для компьютерной связи. Этому новому комитету под руководством инженера из TeleType Corporation потребовалось два года, чтобы найти приемлемое решение проблемы.

    Это решение стало известно как ASCII.

    Коды ASCII

    Исходный набор символов ASCII состоял из 128 символов и назначался слотам от 0 до 127. Первоначальное разграничение между типами символов и местом их назначения заключалось в том, создал ли символ команду или нет.

    Управляющие персонажи

    Управляющие символы в формате ASCII были непечатаемыми символами. Вместо этого они указали какую-то команду или указатель. Примеры включают \ e («escape»), \? («Удалить») и \ 0 («нулевой символ»).

    Это символы, считываемые операционной системой. Символы, приведённые здесь в качестве примеров, перечислены только для чтения людьми — это не то, что читает компьютер.

    Эти управляющие символы занимают первые 32 слота (от 0 до 31) 8-битного кода.

    Персонажи для печати

    Остальные слоты от 32 до 127 — это печатные символы, которые мы можем прочитать. К ним относятся знаки препинания, пробел, заглавные и строчные буквы, цифры и специальные символы.

    SP! «# $% & ’() * +, -. _` abcdefghijklmnopqrstuvwxyz {|} ~

    Печатные символы ASCII от 32 до 127. Самый первый символ, пробел, обозначается SP.

    Расширенный ASCII

    Расширенный ASCII — это новейшая часть стандарта ASCII. Сам по себе расширенный стандарт не такой чёткий, как оригинал. Существуют вариации стандарта, но общий смысл остаётся прежним: его цель заключалась в том, чтобы охватить неанглоязычные страны.

    В расширенной таблице ASCII перечислены символы валют, буквы на других языках и символы ударения.

    Заключение

    ASCII был создан для создания единого источника истины для коммуникации между компьютерами в 20 веке. С момента создания таблица расширилась и теперь включает расширенные символы ASCII, в которых используются неамериканские символы, диакритические знаки, буквы и символы.

    Новый стандарт также вырос из ASCII, чтобы включить ещё больше символов, называемых Unicode.

    Всегда хорошо знать, откуда мы пришли — ASCII был замечательным для своего времени, потому что он позволял компьютерам общаться друг с другом. ASCII продолжает использоваться по сей день вместе с новыми стандартами.

    404: Страница не найдена

    Страница, которую вы пытались открыть по этому адресу, похоже, не существует. Обычно это результат плохой или устаревшей ссылки. Мы извиняемся за любые неудобства.

    Что я могу сделать сейчас?

    Если вы впервые посещаете TechTarget, добро пожаловать! Извините за обстоятельства, при которых мы встречаемся. Вот куда вы можете пойти отсюда:

    Поиск
    • Пожалуйста, свяжитесь с нами, чтобы сообщить, что эта страница отсутствует, или используйте поле выше, чтобы продолжить поиск
    • Наша страница «О нас» содержит дополнительную информацию о сайте, на котором вы находитесь, WhatIs.com.
    • Посетите нашу домашнюю страницу и просмотрите наши технические темы

    Просмотр по категории

    Сеть

    • CAPWAP (Контроль и настройка точек беспроводного доступа)

      CAPWAP (управление и обеспечение точек беспроводного доступа) — это протокол, который позволяет контроллеру доступа управлять . ..

    • мониторинг производительности сети (NPM)

      Мониторинг производительности сети (NPM) — это процесс измерения и мониторинга качества обслуживания сети.

    • инфракрасное излучение (ИК)

      Инфракрасное излучение (ИК), иногда называемое просто инфракрасным, представляет собой область спектра электромагнитного излучения, в которой …

    Безопасность

    • аналитика безопасности

      Аналитика безопасности — это подход к кибербезопасности, который использует инструменты сбора, агрегирования данных и анализа угроз …

    • NICE Framework (Национальная инициатива по обучению в области кибербезопасности Cybersecurity Workforce Framework)

      The NICE Framework (National Initiative for Cybersecurity Education Cybersecurity Workforce Framework) является справочным ресурсом …

    • черный список приложений (занесение приложений в черный список)

      Занесение приложений в черный список — все чаще называемое занесением в черный список приложений — представляет собой практику сетевого или компьютерного администрирования, используемую . ..

    ИТ-директор

    • цифровая экосистема

      Цифровая экосистема — это группа взаимосвязанных ресурсов информационных технологий, которые могут функционировать как единое целое.

    • план закупок

      План закупок, также называемый планом управления закупками, представляет собой документ, который используется для управления процессом поиска …

    • Общепринятые принципы ведения учета (Принципы)

      Общепринятые принципы ведения документации — это основа для управления записями таким образом, чтобы поддерживать …

    HRSoftware

    • конвейер талантов

      Воронка талантов — это группа кандидатов, готовых занять вакансию.

    • аутсорсинг процесса подбора персонала (RPO)

      Аутсорсинг процесса найма (RPO) — это когда работодатель передает ответственность за поиск потенциальных кандидатов на работу . ..

    • специалист по кадрам (HR)

      Специалист по персоналу — это специалист по кадрам, который выполняет повседневные обязанности по управлению талантами, сотрудникам …

    Обслуживание клиентов

    • исходящий маркетинг

      Исходящий маркетинг — это традиционная форма маркетинга, при которой организация инициирует контакт с потенциальными клиентами или …

    • скорость оттока

      Коэффициент оттока — это показатель количества клиентов или сотрудников, покидающих компанию в течение определенного периода времени.

    • управление маркетинговой кампанией

      Управление маркетинговыми кампаниями — это планирование, выполнение, отслеживание и анализ кампаний прямого маркетинга.

    ASCII | Определение, история, мелочи и факты

    Похожие темы:
    ASCII-арт расширенный ASCII система кодирования

    См. весь соответствующий контент →

    ASCII , полностью Американский стандартный код для обмена информацией , стандартный формат кодирования данных для электронной связи между компьютерами. ASCII присваивает стандартные числовые значения буквам, цифрам, знакам препинания и другим символам, используемым в компьютерах.

    До того, как был разработан ASCII, компьютеры разных марок и моделей не могли взаимодействовать друг с другом. Каждый производитель компьютеров представлял алфавиты, цифры и другие символы по-своему. Только IBM (International Business Machines Corporation) использовала девять различных наборов символов. В 1961 Боб Бемер из IBM представил в Американский национальный институт стандартов (ANSI) предложение по созданию общего компьютерного кода. Для работы над новым кодом был сформирован комитет X3.4, в который вошли представители ведущих производителей компьютеров того времени. 17 июня 1963 года ASCII был утвержден в качестве американского стандарта. Однако он не получил широкого признания, главным образом потому, что IBM решила использовать EBCDIC (расширенный двоично-десятичный код обмена) в своих компьютерах серии OS/360, выпущенных в 1964 году.65 и 1967. 11 марта 1968 г. Президиум США. Линдон Б. Джонсон распорядился назвать ASCII федеральным стандартом, чтобы свести к минимуму несовместимость между федеральными компьютерными и телекоммуникационными системами. Кроме того, он потребовал, чтобы все новые компьютеры и сопутствующее оборудование, закупаемое правительством США с 1 июля 1969 года, были совместимы с ASCII. Код снова пересматривался в 1968, 1977 и 1986 годах.

    ASCII изначально был разработан для телетайпов или телетайпов, но со временем он нашел широкое применение в персональных компьютерах (ПК), начиная с первого ПК IBM в 1919 году.81. В ASCII используются семизначные двоичные числа, т. е. числа, состоящие из различных последовательностей нулей и единиц. Поскольку существует 128 различных возможных комбинаций семи нулей и единиц, код может представлять 128 различных символов. Двоичная последовательность 1010000, например, представляет прописные буквы P , а последовательность 1110000 представляет строчные буквы p .

    Цифровые компьютеры используют двоичный код, организованный группами по восемь, а не по семь цифр или битов; каждая такая восьмибитная группа называется байтом. Следовательно, ASCII обычно встраивается в восьмибитное поле, состоящее из семи информационных битов и бита четности, который используется для проверки ошибок или для представления специальных символов. Эта восьмибитная система увеличивает количество символов, которые может представлять ASCII, до 256, и гарантирует возможность представления всех специальных символов, а также символов других языков. Расширенный ASCII, как известен восьмибитный код, был представлен IBM в 1981 для использования в своем первом ПК, и вскоре он стал отраслевым стандартом для персональных компьютеров. В расширенном ASCII для машинных и управляющих команд используются 32 кодовые комбинации, такие как «начало текста», «возврат каретки» и «подача страницы».

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *