У этого термина существуют и другие значения, см. ASCII (значения).
ASCII
ASCII (англ. American Standard Code for Information Interchange) — американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов. В американском варианте английского языка произносится [э́ски], тогда как в Великобритании чаще произносится [а́ски]; по-русски произносится также [а́ски] или [аски́].
ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов. Изначально разработанная как 7-битная, с широким распространением 8-битного байта ASCII стала восприниматься как половина 8-битной. В компьютерах обычно используют расширения ASCII с задействованным 8-м битом и второй половиной кодовой таблицы (например КОИ-8).
Содержание
1 Наложение символов
2 Национальные варианты ASCII
3 Кодировка
4 Управляющие символы
5 Структурные свойства таблицы
6 Представление ASCII в ЭВМ
7 Примечание
8 См. ` { | } ~. В дополнение к этому, на месте # может быть размещён £, а на месте $ — ¤. Такая система хорошо подходит для европейских языков, где нужны лишь несколько дополнительных символов. Вариант ASCII без национальных символов называется US-ASCII, или «International Reference Version».
Для некоторых языков с нелатинской письменностью (русского, греческого, арабского, иврита) существовали более радикальные модификации ASCII. Одним из вариантов был отказ от строчных латинских букв — на их месте размещались национальные символы (для русского и греческого — только заглавные буквы). Другой вариант — переключение между US-ASCII и национальным вариантом «на лету» с помощью символов SO (Shift Out) и SI (Shift In) — в этом случае в национальном варианте можно полностью устранить латинские буквы и занять всё пространство под свои символы. См. также КОИ-7.
Впоследствии оказалось удобнее использовать 8-битные кодировки (кодовые страницы), где нижнюю половину кодовой таблицы (0—127) занимают символы US-ASCII, а верхнюю (128—255) — дополнительные символы, включая набор национальных символов. Таким образом, верхняя половина таблицы ASCII до повсеместного внедрения Юникода активно использовалась для представления локализированных символов, букв местного языка. Отсутствие единого стандарта размещения кириллических символов в таблице ASCII доставляло множество проблем с кодировками (КОИ-8, Windows-1251 и другие). Другие языки с нелатинской письменностью тоже страдали из-за наличия нескольких разных кодировок.
В Юникоде первые 128 символов тоже совпадают с соответствующими символами US-ASCII.
Кодировка
.0
.1
.2
.3
.4
.5
.6
.7
.8
.9
.A
.B
.C
.D
.E
.F
0.
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
TAB
LF
VT
FF
CR
SO
SI
1.
_
6.
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
7.
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
DEL
Символ 0x5e в первой версии стандарта ASCII (1963) соответствовал стрелке вверх, а символ 0x5f — стрелке влево. Стандарт ECMA-6 (1965) заменил их на знак вставки (используемый также в роли циркумфлекса) и нижнюю черту (подчёркивание) соответственно.
Управляющие символы
Основная статья: Управляющие символы
Поскольку ASCII изначально предназначался для обмена информацией (по телетайпу), в нём, кроме информационных символов, используются символы-команды для управления связью. Это обычный набор спецсигналов, применявшийся и в других докомпьютерных средствах обмена сообщениями (азбука Морзе, семафорная азбука), дополненный с учётом специфики устройства.
(После названия каждого символа указан его 16-ричный код)
NUL, 00 — Null, пустой. Всегда игнорировался. На перфолентах 1 представлялась отверстием, 0 — отсутствием отверстия. Поэтому пустые части перфоленты до начала и после конца сообщения состояли из таких символов. Сейчас используется во многих языках программирования как конец строки. (Строка понимается как последовательность символов.) В некоторых операционных системах NUL — последний символ любого текстового файла.
SOH, 01 — Start Of Heading, начало заголовка.
STX, 02 — Start of Text, начало текста. Текстом называлась часть сообщения, предназначенная для печати. Адрес, контрольная сумма и т. д. входили или в заголовок, или в часть сообщения после текста.
ETX, 03 — End of Text, конец текста. Здесь телетайп прекращал печатать. Использование символа Ctrl-C, имеющего код 03, для прекращения работы чего-то (обычно программы), восходит ещё к тем временам.
EOT, 04 — End of Transmission, конец передачи. В системе UNIX Ctrl-D, имеющий тот же код, означает конец файла при вводе с клавиатуры.
ENQ
, 05 — Enquire. Прошу подтверждения.
ACK, 06 — Acknowledgement. Подтверждаю.
BEL, 07 — Bell, звонок, звуковой сигнал. Сейчас тоже используется. В языках программирования C и C++ обозначается \a.
BS, 08 — Backspace, возврат на один символ. Сейчас стирает предыдущий символ.
TAB, 09 — Tabulation. Обозначался также HT — Horizontal Tabulation, горизонтальная табуляция. Во многих языках программирования обозначается \t .
LF, 0A — Line Feed, перевод строки. Сейчас в конце каждой строчки текстового файла ставится либо этот символ, либо CR, либо и тот и другой (CR, затем LF), в зависимости от операционной системы. Во многих языках программирования обозначается \n и при выводе текста приводит к переводу строки.
VT, 0B — Vertical Tab, вертикальная табуляция.
FF, 0C — Form Feed, прогон страницы, новая страница.
CR, 0D — Carriage Return, возврат каретки. Во многих языках программирования этот символ, обозначаемый \r, можно использовать для возврата в начало строчки без перевода строки. В некоторых операционных системах этот же символ, обозначаемый Ctrl-M, ставится в конце каждой строчки текстового файла перед LF.
SO, 0E — Shift Out, измени цвет ленты (использовался для двуцветных лент; цвет менялся обычно на красный). В дальнейшем обозначал начало использования национальной кодировки.
SI, 0F — Shift In, обратно к Shift Out.
DLE, 10 — Data Link Escape, освобождение канала данных — следующие символы представляют собой данные, а не управляющие символы.
DC1, 11 — Device Control 1, 1-й символ управления устройством — включить устройство чтения перфоленты.
DC2, 12 — Device Control 2, 2-й символ управления устройством — включить перфоратор.
DC3, 13 — Device Control 3, 3-й символ управления устройством — выключить устройство чтения перфоленты.
DC4, 14 — Device Control 4, 4-й символ управления устройством — выключить перфоратор.
NAK, 15 — Negative Acknowledgment, не подтверждаю. Обратно Acknowledgment.
SYN, 16 — Synchronization. Этот символ передавался, когда для синхронизации было необходимо что-нибудь передать.
ETB, 17 — End of Text Block, конец текстового блока. Иногда текст по техническим причинам разбивался на блоки.
CAN, 18 — Cancel, отмена (того, что было передано ранее).
EM, 19 — End of Medium, конец носителя (кончилась перфолента и т. д.)
SUB, 1A — Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче. Сейчас Ctrl-Z используется как конец файла при вводе с клавиатуры в системах DOS и Windows. У этой функции нет никакой очевидной связи с символом SUB.
ESC, 1B — Escape. Следующие за ним символы имеют какое-то другое значение, отличное от того, которое определено в ASCII. Обычно начинал управляющие последовательности.
FS, 1C — File Separator, разделитель файлов.
GS
, 1D — Group Separator, разделитель групп.
RS, 1E — Record Separator, разделитель записей.
US, 1F — Unit Separator, разделитель юнитов. То есть поддерживалось 4 уровня структуризации данных: сообщение могло состоять из файлов, файлы из групп, группы из записей, записи из юнитов.
DEL, 7F — Delete, стереть последний символ. Символом DEL, состоящим в двоичном коде из всех единиц, можно было забить любой символ. Устройства и программы игнорировали DEL так же, как NUL. Код этого символа происходит из первых текстовых процессоров с памятью на перфоленте: в них удаление символа происходило забиванием его кода дырочками (обозначавшими логические единицы).
Структурные свойства таблицы
Цифры 0—9 представляются своими двоичными значениями (например, 5=01012), перед которыми стоит 00112. Таким образом, двоично-десятичные числа (BCD) превращаются в ASCII-строку с помощью простого добавления слева 00112 к каждому двоично-десятичному полубайту.
Буквы A-Z верхнего и нижнего регистров различаются в своём представлении только одним битом, что упрощает преобразование регистра и проверку на диапазон. Буквы представляются своими порядковыми номерами в алфавите, записанными в двоичной системе счисления, перед которыми стоит 1002 (для букв верхнего регистра) или 1102 (для букв нижнего регистра).
Представление ASCII в ЭВМ
На подавляющем большинстве современных компьютеров минимально адресуемая единица памяти — 8-битный байт, поэтому там используются 8-битные, а не 7-битные символы. Обычно символ ASCII расширяют до 8 бит, просто добавляя один нулевой бит в качестве старшего.
На компьютерах системы IBM/360, однако, в случае использования ASCII применялся другой метод: 6-й бит (если считать самый младший бит первым) перемещается в 7-й, а бывший 7-й «раздваивается» и копируется и в 8-й бит, и в 6-й. Получается такая таблица [1]:
.0
.1
.2
.3
.4
.5
.6
.7
.8
.9
.A
.B
.C
.D
.E
.F
0.
NUL
SOM
EOA
EOM
EQT
WRU
RU
BELL
BKSP
HT
LF
VT
FF
CR
SO
SI
1.
DC0
DC1
DC2
DC3
DC4
ERR
SYNC
LEM
S0
S1
S2
S3
S4
S5
S6
S7
2.
3.
4.
BLANK
!
«
#
$
%
&
‘
(
)
*
+
,
—
.
/
5.
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
6.
7.
8.
9.
A.
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
B.
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
↑
←
C.
D.
E.
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
F.
p
q
r
s
t
u
v
w
x
y
z
ESC
DEL
На тех компьютерах, где минимально адресуемой единицей памяти было 36-битное слово, поначалу использовали 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах в одном слове стали размещать либо 5 семибитных символов (1 бит оставался лишним), либо 4 девятибитных символа.
ASCII-коды используются также для определения нажатой клавиши при программировании. Для стандартной QWERTY-клавиатуры таблица кодов выглядит следующим образом:
Escape
27
F1
112
F2
113
F3
114
F4
115
F5
116
F6
117
F7
118
F8
119
F9
120
F10
121
F11
122
F12
123
Print Screen
Scroll Lock
145
Pause
19
`ё
192
1
49
2
50
3
51
4
52
5
53
6
54
7
55
8
56
9
57
0
48
—
189
=+
187
Back Space
8
Insert
45
Home
36
Page Up
33
Num Lock
144
/ доп.
111
* доп.
106
+ доп.
107
Tab
9
Q
81
W
87
E
69
R
82
T
84
Y
89
U
85
I
73
O
79
P
80
[
219
]
221
Delete
46
End
35
Page Down
34
7 доп.
109
8 доп.
108
9 доп.
105
Caps Lock
20
A
65
S
83
D
68
F
70
G
71
H
72
J
74
K
75
L
76
;ж
186
‘э
222
Enter
13
4 доп.
100
5 доп.
101
6 доп.
102
Enter доп.
13
Shift
16
Z
90
X
88
C
67
V
86
B
66
N
78
M
77
,<
188
.>
190
/
191
Shift
16
\|
220
Up
38
1 доп.
97
2 доп.
98
3 доп.
99
Ctrl
17
win
Alt
18
Space Bar
32
Alt
18
win
list
Ctrl
17
Left
37
Down
40
Right
39
Ins/0
45/96
Del/.
46/110
Примечание
↑ G. M. Amdahl, G. A. Blaauw, F. P. Brooks, Jr. Architecture of the IBM System/360, 1964
См. также
Переносимый набор символов
Управляющие символы
EBCDIC
ISCII
VISCII
YUSCII
Юникод
ASCII art
КОИ-8
Ссылки
Цветная таблица ASCII
Standard ECMA-6: 7-bit Coded Character Set, 6th edition (англ.). Ecma International (December 1991). Архивировано из первоисточника 23 августа 2011.
Tom Jennings An annotated history of some character codes or ASCII: American Standard Code for Information Infiltration (англ.) (1999-09-16 — 2004-10-29). Архивировано из первоисточника 23 августа 2011.
ASCII Chart and Other Resources (англ.). JimPrice.Com.
Кодировки символов
Основы →
алфавит • текст ( файл • данные ) • набор символов • конверсия
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение
Утилиты: iconv • recode
Что такое ASCII
Американский стандартный код для обмена информацией (ASCII) — это стандарт, который принимает английские символы, числа, символы пунктуации и другие специальные символы и назначает их где-нибудь в 255 слотах, доступных в 8-битном коде, который был доступен для старых компьютеров.
В этой статье кратко рассматривается история ASCII и описывается его важность.
Содержание
Почему был создан ASCII?
Коды ASCII
Управляющие персонажи
Персонажи для печати
Расширенный ASCII
Заключение
Почему был создан ASCII?
Создание ASCII произошло из-за использования телеграфных машин. До 1960-х годов у компьютеров было несколько различных способов создания персонажей в своих системах. По мере роста компьютерных сетей стало ясно, что необходим последовательный способ представления различных персонажей, чтобы связь могла происходить между машинами.
Американский национальный институт стандартов, некоммерческая группа, получила запрос от инженера IBM Боба Бемера о создании организации, способной генерировать стандарт, чтобы можно было использовать единый код для компьютерной связи. Этому новому комитету под руководством инженера из TeleType Corporation потребовалось два года, чтобы найти приемлемое решение проблемы.
Это решение стало известно как ASCII.
Коды ASCII
Исходный набор символов ASCII состоял из 128 символов и назначался слотам от 0 до 127. Первоначальное разграничение между типами символов и местом их назначения заключалось в том, создал ли символ команду или нет.
Управляющие персонажи
Управляющие символы в формате ASCII были непечатаемыми символами. Вместо этого они указали какую-то команду или указатель. Примеры включают \ e («escape»), \? («Удалить») и \ 0 («нулевой символ»).
Это символы, считываемые операционной системой. Символы, приведённые здесь в качестве примеров, перечислены только для чтения людьми — это не то, что читает компьютер.
Эти управляющие символы занимают первые 32 слота (от 0 до 31) 8-битного кода.
Персонажи для печати
Остальные слоты от 32 до 127 — это печатные символы, которые мы можем прочитать. К ним относятся знаки препинания, пробел, заглавные и строчные буквы, цифры и специальные символы.
Печатные символы ASCII от 32 до 127. Самый первый символ, пробел, обозначается SP.
Расширенный ASCII
Расширенный ASCII — это новейшая часть стандарта ASCII. Сам по себе расширенный стандарт не такой чёткий, как оригинал. Существуют вариации стандарта, но общий смысл остаётся прежним: его цель заключалась в том, чтобы охватить неанглоязычные страны.
В расширенной таблице ASCII перечислены символы валют, буквы на других языках и символы ударения.
Заключение
ASCII был создан для создания единого источника истины для коммуникации между компьютерами в 20 веке. С момента создания таблица расширилась и теперь включает расширенные символы ASCII, в которых используются неамериканские символы, диакритические знаки, буквы и символы.
Новый стандарт также вырос из ASCII, чтобы включить ещё больше символов, называемых Unicode.
Всегда хорошо знать, откуда мы пришли — ASCII был замечательным для своего времени, потому что он позволял компьютерам общаться друг с другом. ASCII продолжает использоваться по сей день вместе с новыми стандартами.
404: Страница не найдена
Страница, которую вы пытались открыть по этому адресу, похоже, не существует. Обычно это результат плохой или устаревшей ссылки. Мы извиняемся за любые неудобства.
Что я могу сделать сейчас?
Если вы впервые посещаете TechTarget, добро пожаловать! Извините за обстоятельства, при которых мы встречаемся. Вот куда вы можете пойти отсюда:
Поиск
Пожалуйста, свяжитесь с нами, чтобы сообщить, что эта страница отсутствует, или используйте поле выше, чтобы продолжить поиск
Наша страница «О нас» содержит дополнительную информацию о сайте, на котором вы находитесь, WhatIs.com.
Посетите нашу домашнюю страницу и просмотрите наши технические темы
Просмотр по категории
Сеть
CAPWAP (Контроль и настройка точек беспроводного доступа)
CAPWAP (управление и обеспечение точек беспроводного доступа) — это протокол, который позволяет контроллеру доступа управлять . ..
мониторинг производительности сети (NPM)
Мониторинг производительности сети (NPM) — это процесс измерения и мониторинга качества обслуживания сети.
инфракрасное излучение (ИК)
Инфракрасное излучение (ИК), иногда называемое просто инфракрасным, представляет собой область спектра электромагнитного излучения, в которой …
Безопасность
аналитика безопасности
Аналитика безопасности — это подход к кибербезопасности, который использует инструменты сбора, агрегирования данных и анализа угроз …
NICE Framework (Национальная инициатива по обучению в области кибербезопасности Cybersecurity Workforce Framework)
The NICE Framework (National Initiative for Cybersecurity Education Cybersecurity Workforce Framework) является справочным ресурсом …
черный список приложений (занесение приложений в черный список)
Занесение приложений в черный список — все чаще называемое занесением в черный список приложений — представляет собой практику сетевого или компьютерного администрирования, используемую . ..
ИТ-директор
цифровая экосистема
Цифровая экосистема — это группа взаимосвязанных ресурсов информационных технологий, которые могут функционировать как единое целое.
план закупок
План закупок, также называемый планом управления закупками, представляет собой документ, который используется для управления процессом поиска …
Общепринятые принципы ведения учета (Принципы)
Общепринятые принципы ведения документации — это основа для управления записями таким образом, чтобы поддерживать …
HRSoftware
конвейер талантов
Воронка талантов — это группа кандидатов, готовых занять вакансию.
аутсорсинг процесса подбора персонала (RPO)
Аутсорсинг процесса найма (RPO) — это когда работодатель передает ответственность за поиск потенциальных кандидатов на работу . ..
специалист по кадрам (HR)
Специалист по персоналу — это специалист по кадрам, который выполняет повседневные обязанности по управлению талантами, сотрудникам …
Обслуживание клиентов
исходящий маркетинг
Исходящий маркетинг — это традиционная форма маркетинга, при которой организация инициирует контакт с потенциальными клиентами или …
скорость оттока
Коэффициент оттока — это показатель количества клиентов или сотрудников, покидающих компанию в течение определенного периода времени.
управление маркетинговой кампанией
Управление маркетинговыми кампаниями — это планирование, выполнение, отслеживание и анализ кампаний прямого маркетинга.
ASCII | Определение, история, мелочи и факты
Похожие темы:
ASCII-арт
расширенный ASCII
система кодирования
См. весь соответствующий контент →
ASCII , полностью Американский стандартный код для обмена информацией , стандартный формат кодирования данных для электронной связи между компьютерами. ASCII присваивает стандартные числовые значения буквам, цифрам, знакам препинания и другим символам, используемым в компьютерах.
До того, как был разработан ASCII, компьютеры разных марок и моделей не могли взаимодействовать друг с другом. Каждый производитель компьютеров представлял алфавиты, цифры и другие символы по-своему. Только IBM (International Business Machines Corporation) использовала девять различных наборов символов. В 1961 Боб Бемер из IBM представил в Американский национальный институт стандартов (ANSI) предложение по созданию общего компьютерного кода. Для работы над новым кодом был сформирован комитет X3.4, в который вошли представители ведущих производителей компьютеров того времени. 17 июня 1963 года ASCII был утвержден в качестве американского стандарта. Однако он не получил широкого признания, главным образом потому, что IBM решила использовать EBCDIC (расширенный двоично-десятичный код обмена) в своих компьютерах серии OS/360, выпущенных в 1964 году.65 и 1967. 11 марта 1968 г. Президиум США. Линдон Б. Джонсон распорядился назвать ASCII федеральным стандартом, чтобы свести к минимуму несовместимость между федеральными компьютерными и телекоммуникационными системами. Кроме того, он потребовал, чтобы все новые компьютеры и сопутствующее оборудование, закупаемое правительством США с 1 июля 1969 года, были совместимы с ASCII. Код снова пересматривался в 1968, 1977 и 1986 годах.
ASCII изначально был разработан для телетайпов или телетайпов, но со временем он нашел широкое применение в персональных компьютерах (ПК), начиная с первого ПК IBM в 1919 году.81. В ASCII используются семизначные двоичные числа, т. е. числа, состоящие из различных последовательностей нулей и единиц. Поскольку существует 128 различных возможных комбинаций семи нулей и единиц, код может представлять 128 различных символов. Двоичная последовательность 1010000, например, представляет прописные буквы P , а последовательность 1110000 представляет строчные буквы p .
Цифровые компьютеры используют двоичный код, организованный группами по восемь, а не по семь цифр или битов; каждая такая восьмибитная группа называется байтом. Следовательно, ASCII обычно встраивается в восьмибитное поле, состоящее из семи информационных битов и бита четности, который используется для проверки ошибок или для представления специальных символов. Эта восьмибитная система увеличивает количество символов, которые может представлять ASCII, до 256, и гарантирует возможность представления всех специальных символов, а также символов других языков. Расширенный ASCII, как известен восьмибитный код, был представлен IBM в 1981 для использования в своем первом ПК, и вскоре он стал отраслевым стандартом для персональных компьютеров. В расширенном ASCII для машинных и управляющих команд используются 32 кодовые комбинации, такие как «начало текста», «возврат каретки» и «подача страницы».