Содержание

Практическая работа №4 Представление и сжатие текстов

Работа 1.4. Представление текстов. Сжатие текстов

Цель работы: практическое закрепление знаний о представлении в компьютере текстовых данных.

Задание 1

Определить, какие символы кодировочной таблицы ASCII (DOS) соответствуют всем прописным буквам русского алфавита в кодировочной таблице ANSI (Windows). Для выполнения задания создать текст с русским алфавитом в Блокноте, а затем открыть его в режиме просмотра (клавиша F3) в любом файловом менеджере (Windows Commander, Far, Total Commander, Norton Commander) и преобразовать в другую кодировку. После выполнения задания заполнить таблицу.

Буква

в ANSI

Буква

в ASCII

Буква

в ANSI

Буква

в ASCII

Буква

в ANSI

Буква

в ASCII

А

К

Х

Б

Л

Ц

В

М

Ч

Г

Н

Ш

Д

О

Щ

Е

П

Ъ

Ё

Р

Ы

Ж

С

Ь

З

Т

Э

И

У

Ю

Й

Ф

Я

1. Используем готовый текстовый файл ANSI.txt..

2. Далее открывает Unreal Commander (Free Commander) и ищем в нём наш файл.

4. Затем нажимаем на режим просмотра F3. Там отобразится содержимое файла в изначальной кодировке (ANSI) и там же есть возможность, просмотреть это же содержимое в разных кодировках.

В нашем случае нужно найти значение кодировки ASCII (DOS).

5. Получаем результат:

Ответ: Таких символов нет. Вместо них на экране в режиме просмотра появляются символы псевдографики.

Задание 2

Закодировать текст с помощью кодировочной таблицы ASCII.
Happy Birthday to you!

Записать двоичное и шестиадцатеричное представления кода (для записи шестнадцатеричного кода использовать средство для просмотра файлов любого файлового менеджера).

в 16-ричной СС (используем кодовую таблицу в текстовом файле ASCII. docx)

48 61 70 70 79 20 42 69
72 74 68 64 61 79 20 74
6F 20 79 6F 75 21 21

в двоичной СС (4816=100 10002 где1000 — код цифру 8, а 100 — код цифры 4)
1001000 1100001 1110000 1110000 1111001 0100000 1000010 1101001
1110010 1110100 1101000 1100100 1100001 1111001 0100000 1110100
1101111 0100000 1111001 1101111 1110101 0100001 0100001

Задание 3

Декодировать текст, записанный в международной кодировочной таблице ASCII (дано десятичное представление).

72 101 108 108 111 44 32 109 121 32 102 114 105 101 110 100 33

Для раскодирования используем таблицу в файле «Коды символов ASCII.mht»
где Dec —
десятизначный код

Ответ: Hello, my friend!

Задание 4

Пользуясь таблицей кодировки ASCII, расшифровать текст, представленный в виде двоичных кодов символов.

01010000 01100101 01110010 01101110 00100000 01010101 01101110 01101001 01110110 01100101 01110010 01110011 01101001 01110100 01111001

Переведем в 16-ричный код отделяя группу двоичных разрядов, справа налево, по 4 бита:

01010000=0101 0000=5016

Используя кодовую таблицу из файла Коды символов ASCII.mht по найденному Hex коду (50) определим первый символ латинского текста «P»

50 65 72 6E 20 55 6D 69 76

65 72 73 69 74 79

Ответ: Perm University

Задание 5

Пользуясь кодовой страницей Windows-1251 таблицы кодировки ASCII, получить шестнадцатеричный код слова ИНФОРМАТИЗАЦИЯ.

Используем кодовую таблицу в файле «Таблица Windows-1251.mht»

Согласно этой таблицы русская заглавная буква «И» (в колонке Hex)
имеет 16-ричный код
C8

Ответ: C8 CD D4 CE D0 CC C0 D2 C8 C7 C0 D6 C8 DF

Задание 6

Во сколько раз увеличится объем памяти, необходимый для хранения текста, если его преобразовать из кодировки KOI8-R в кодировку Unicode?

Для кодирования одного символа в кодировке KOI-8 используется 1 байт, а в кодировке UNICODE — 2 байта, следовательно, информационный объем страницы текста увеличится в 2 раза

Ответ: в 2 раза

Задание 7

С помощью табличного процессора Excel построить кодировочную таблицу ASCII, в которой символы будут автоматически отображаться на экране в соответствии с их заданным десятичным номером (использовать соответствующую текстовую функцию).

Введите ускоренным методом числа от 33 до 254 (по 25 в каждой строке через столбец:
А, С, E, … ,
Q)


В ячейку B1 введите формулу =СИМВОЛ(A1) и далее используя ускоренный метод, скопируйте ее в остальные ячейки столбцов: B, D, F,…, R.

Справка:
Алгоритм Хаффмана. Сжатием информации в памяти компьютера называют такое ее преобразование, которое ведет к сокращению объема занимаемой памяти при сохранении закодированного содержания. Рассмотрим один из способов сжатия текстовой информации — алгоритм Хаффмана. С помощью этого алгоритма строится двоичное дерево, которое позволяет однозначно декодировать двоичный код, состоящий из символьных кодов различной длины. Двоичным называется дерево, из каждой вершины которого выходят две ветви. На рисунке приведен пример такого дерева, построенного для алфавита английского языка с учетом частоты встречаемости его букв.

Закодируем с помощью данного дерева слово «hello»: 0101 100 01111 01111 1110

При размещении этого кода в памяти побитно он примет вид: 01011000 11110111 11110
Таким образом, текст, занимающий в кодировке ASCII 5 байтов, в кодировке Хаффмана займет только 3 байта.

Задание 8

Используя метод сжатия Хаффмана, закодируйте следующие слова:

а) administrator 1111 11011 00011 1010 1100 1010 0110 001 1011 1111 001 1110 1011

(11111101 10001110 10110010 10011000 11011111 10011110 1011)

б) revolution 1011 100 1101001 1110 01111 00010 001 1010 1110 1100

(10111001 10100111 10011110 00100011 01011101 100)

в) economy 100 01000 1110 1100 1110 00011 00000 (10001000 11101100 11100001 100000)

г) department 11011 100 110101 1111 1011 001 00011 100 1100 001

(11011100 11010111 11101100 10001110 01100001)

Задание 9

Используя дерево Хаффмана, декодируйте следующие слова:

а) 01110011 11001001 10010110 10010111 100000

(011100 1111 001 001 100 1011 01001 01111 00000) BATTERFLY

б) 00010110 01010110 10011001 01101101 01000100 000

(00010 1100 1010 1101001 100 1011 0110 1010 001 00000) UNIVERSITY

Представление текста, изображения и звука в компьютере (§ 6)

Планирование уроков на учебный год

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 10 классы | Планирование уроков на учебный год | Представление текста, изображения и звука в компьютере (§ 6)




В этом параграфе обсудим способы компьютерного кодирования текстовой, графической и звуковой информации. С текстовой и графической информацией конструкторы «научили» работать ЭВМ, начиная с третьего поколения (1970-е годы). А работу со звуком «освоили» лишь машины четвертого поколения, современные персональные компьютеры. С этого момента началось распространение технологии мультимедиа.

Что принципиально нового появлялось в устройстве компьютеров с освоением ими новых видов информации? Главным образом, это периферийные устройства для ввода и вывода текстов, графики, видео, звука. Процессор же и оперативная память по своим функциям изменились мало. Существенно возросло их быстродействие, объем памяти. Но как это было на первых поколениях ЭВМ, так и осталось на современных ПК — основным навыком процессора в обработке данных является умение выполнять вычисления с двоичными числами. Обработка текста, графики и звука представляет собой тоже обработку числовых данных. Если сказать еще точнее, то это

обработка целых чисел. По этой причине компьютерные технологии называют цифровыми технологиями.

О том, как текст, графика и звук сводятся к целым числам, будет рассказано дальше. Предварительно отметим, что здесь мы снова встретимся с главной формулой информатики:

2i = N.

Смысл входящих в нее величин здесь следующий: i — разрядность ячейки памяти (в битах), N — количество различных целых положительных чисел, которые можно записать в эту ячейку.

Текстовая информация

Принципиально важно, что текстовая информация уже дискретна — состоит из отдельных знаков. Поэтому возникает лишь технический вопрос — как разместить ее в памяти компьютера.

Напомним о байтовом принципе организации памяти компьютеров, обсуждавшемся в курсе информатики основной школы. Вернемся к рис. 1.5. Каждая клеточка на нем обозначает бит памяти. Восемь подряд расположенных битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера.

Именно по адресам процессор обращается к данным, читая или записывая их в память (рис. 1.10).

Модель представления текста в памяти весьма проста. За каждой буквой алфавита, цифрой, знаком препинания и иным общепринятым при записи текста символом закрепляется определенный двоичный код, длина которого фиксирована. В популярных системах кодировки (Windows-1251, KOI8 и др.) каждый символ заменяется на 8-разрядное целое положительное двоичное число; оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице. Согласно главной формуле информатики, определяем, что размер алфавита, который можно закодировать, равен: 2

8 = 256. Этого количества вполне достаточно для размещения двух алфавитов естественных языков (английского и русского) и всех необходимых дополнительных символов.

Поскольку в мире много языков и много алфавитов, постепенно совершается переход на международную систему кодировки Unicode, в которой используются многобайтовые коды.

Например, если код символа занимает 2 байта, то с его помощью можно закодировать 216 = 65 536 различных символов.

При работе с электронной почтой почтовая программа иногда нас спрашивает, не хотим ли мы прибегнуть к кодировке Unicode для пересылаемых сообщений. Таким способом можно избежать проблемы несоответствия кодировок, из-за которой иногда не удается прочитать русский текст.

Текстовый документ, хранящийся в памяти компьютера, состоит не только из кодов символьного алфавита. В нем также содержатся коды, управляющие форматами текста при его отображении на мониторе или на печати: тип и размер шрифта, положение строк, поля и отступы и пр. Кроме того, текстовые процессоры (например, Microsoft Word) позволяют включать в документ и редактировать такие «нелинейные» объекты, как таблицы, оглавления, ссылки и гиперссылки, историю вносимых изменений и т. д. Всё это также представляется в виде последовательности байтовых кодов.

Графическая информация

Из курса информатики 7 — 9 классов вы знакомы с общими принципами компьютерной графики, с графическими технологиями. Здесь мы немного подробнее, чем это делалось раньше, рассмотрим способы представления графических изображений в памяти компьютера.

Принцип дискретности компьютерных данных справедлив и для графики. Здесь можно говорить о дискретном представлении изображения (рисунка, фотографии, видеокадров) и дискретности цвета.

Дискретное представление изображения

Изображение на экране монитора дискретно. Оно составляется из отдельных точек, которые называются пикселями (picture elements — элементы рисунка). Это связано с техническими особенностями устройства экрана, независимо от его физической реализации, будь то монитор на электронно-лучевой трубке, жидкокристаллический или плазменный. Эти «точки» столь близки друг другу, что глаз не различает промежутков между ними, поэтому изображение воспринимается как непрерывное, сплошное. Если выводимое из компьютера изображение формируется на бумаге (принтером или плоттером), то линии на нем также выглядят непрерывными. Однако в основе все равно лежит печать близких друг к другу точек.

В зависимости от того, на какое графическое разрешение экрана настроена операционная система компьютера, на экране могут размещаться изображения, имеющие размер 800 х 600, 1024 х 768 и более пикселей. Такая прямоугольная матрица пикселей на экране компьютера называется растром.

Качество изображения зависит не только от размера растра, но и от размера экрана монитора, который обычно характеризуется длиной диагонали. Существует параметр разрешения экрана. Этот параметр измеряется в точках на дюйм (по-английски dots per inch — dpi). У монитора с диагональю 15 дюймов размер изображения на экране составляет примерно 28 х 21 см. Зная, что в одном дюйме 25,4 мм, можно рассчитать, что при работе монитора в режиме 800 х 600 пикселей разрешение экранного изображения равно 72 dpi.

При печати на бумаге разрешение должно быть намного выше. Полиграфическая печать полноцветного изображения требует разрешения 200-300 dpi. Стандартный фотоснимок размером 10 х 15 см должен содержать примерно 1000 х 1500 пикселей.


Дискретное представление цвета

Восстановим ваши знания о кодировании цвета, полученные из курса информатики основной школы. Основное правило звучит так: любой цвет точки на экране компьютера получается путем смешивания трех базовых цветов: красного, зеленого, синего. Этот принцип называется цветовой моделью RGB (Red, Green, Blue).

Двоичный код цвета определяет, в каком соотношении находятся интенсивности трех базовых цветов. Если все они смешиваются в одинаковых долях, то в итоге получается белый цвет. Если все три компоненты «выключены», то цвет пикселя — черный. Все остальные цвета лежат между белым и черным.

Дискретность цвета состоит в том, что интенсивности базовых цветов могут принимать конечное число дискретных значений.

Пусть, например, размер кода цвета пикселя равен 8 битам — 1 байту. Между базовыми цветами они могут быть распределены так:

2 бита — под красный цвет, 3 бита — под зеленый и 3 бита — под синий.

Интенсивность красного цвета может принимать 22 = 4 значения, интенсивности зеленого и синего цветов — по 23 = 8 значений. Полное число цветов, которые кодируются 8-разрядными кодами, равно: 4 — 8 — 8 = 256 = 28. Снова работает главная формула информатики.

Из описанного правила, в частности, следует:

Обобщение этих частных примеров приводит к следующему правилу. Если размер кода цвета равен b битов, то количество цветов (размер палитры) вычисляется по формуле:

К = 2b.

Величину b в компьютерной графике называют битовой глубиной цвета.

Еще один пример. Битовая глубина цвета равна 24. Размер палитры будет равен:

К = 224 = 16 777 216.

В компьютерной графике используются разные цветовые модели для изображения на экране, получаемого путем излучения света, и изображения на бумаге, формируемого с помощью отражения света.

Первую модель мы уже рассмотрели — это модель RGB. Вторая модель носит название CMYK.

Цвет, который мы видим на листе бумаги, — это отражение белого (солнечного) света. Нанесенная на бумагу краска поглощает часть палитры, составляющей белый цвет, а другую часть отражает. Таким образом, нужный цвет на бумаге получают путем «вычитания» из белого света «ненужных красок». Поэтому в цветной полиграфии действует не правило сложения цветов (как на экране компьютера), а правило вычитания. Мы не будем углубляться в механизм такого способа цветообразования.

Расшифруем лишь аббревиатуру CMYK: Cyan — голубой, Magenta — пурпурный, Yellow — желтый, blасk — черный.

Растровая и векторная графика

О двух технологиях компьютерной графики — растровой и векторной — вы знаете из курса информатики основной школы.

В растровой графике графическая информация — это совокупность данных о цвете каждого пикселя на экране. Это то, о чем говорилось выше. В векторной графике графическая информация — это данные, математически описывающие графические примитивы, составляющие рисунок: прямые, дуги, прямоугольники, овалы и пр. Положение и форма графических примитивов представляются в системе экранных координат.

Растровую графику (редакторы растрового типа) применяют при разработке электронных (мультимедийных) и полиграфических изданий. Растровые иллюстрации редко создают вручную с помощью компьютерных программ. Чаще для этой цели используют сканированные иллюстрации, подготовленные художником на бумаге, или фотографии. Для ввода растровых изображений в компьютер применяются цифровые фото- и видеокамеры. Большинство графических редакторов растрового типа в большей мере ориентированы не на создание изображений, а на их обработку.

Достоинство растровой графики — эффективное представление изображений фотографического качества. Основной недостаток растрового способа представления изображения — большой объем занимаемой памяти. Для его сокращения приходится применять различные способы сжатия данных. Другой недостаток растровых изображений связан с искажением изображения при его масштабировании. Поскольку изображение состоит из фиксированного числа точек, увеличение изображения приводит к тому, что эти точки становятся крупнее. Увеличение размера точек растра визуально искажает иллюстрацию и делает ее грубой.

Векторные графические редакторы предназначены в первую очередь для создания иллюстраций и в меньшей степени для их обработки.

Достоинства векторной графики — сравнительно небольшой объем памяти, занимаемой векторными файлами, масштабирование изображения без потери качества. Однако средствами векторной графики проблематично получить высококачественное художественное изображение. Обычно средства векторной графики используют не для создания художественных композиций, а для оформительских, чертежных и проектно-конструкторских работ.

Графическая информация сохраняется в файлах на диске. Существуют разнообразные форматы графических файлов. Они делятся на растровые и векторные. Растровые графические файлы (форматы JPEG, BMP, TIFF и другие) хранят информацию о цвете каждого пикселя изображения на экране. В графических файлах векторного формата (например, WMF, CGM) содержатся описания графических примитивов, составляющих рисунок.

Следует понимать, что графические данные, помещаемые в видеопамять и выводимые на экран, имеют растровый формат вне зависимости от того, с помощью каких программных средств (растровых или векторных) они получены.

Звуковая информация

Принципы дискретизации звука («оцифровки» звука) отражены на рис. 1.11.

Ввод звука в компьютер производится с помощью звукового устройства (микрофона, радио и др.), выход которого подключается к порту звуковой карты. Задача звуковой карты — с определенной частотой производить измерения уровня звукового сигнала (преобразованного в электрические колебания) и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Промежуток времени между двумя измерениями называется периодом измерений — τ с. Обратная величина называется частотой дискретизации — 1/τ (герц). Чем выше частота измерений, тем выше качество цифрового звука.

Результаты таких измерений представляются целыми положительными числами с конечным количеством разрядов. Вы уже знаете, что в таком случае получается дискретное конечное множество значений в ограниченном диапазоне. Размер этого диапазона зависит от разрядности ячейки — регистра памяти звуковой карты. Снова работает формула 2i, где i — разрядность регистра. Число i называют также разрядностью дискретизации. Записанные данные сохраняются в файлах специальных звуковых форматов.

Существуют программы обработки звука — редакторы звука, позволяющие создавать различные музыкальные эффекты, очищать звук от шумов, согласовывать с изображениями для создания мультимедийных продуктов и т. д. С помощью специальных устройств, генерирующих звук, звуковые файлы могут преобразовываться в звуковые волны, воспринимаемые слухом человека.

При хранении оцифрованного звука приходится решать проблему уменьшения объема звуковых файлов. Для этого кроме кодирования данных без потерь, позволяющего осуществлять стопроцентное восстановление данных из сжатого потока, используется кодирование данных с потерями. Цель такого кодирования — добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных. Это достигается путем использования различных алгоритмов, сжимающих оригинальный сигнал путем выкидывания из него слабослышимых элементов. Методов сжатия, а также программ, реализующих эти методы, существует много.

Для сохранения звука без потерь используется универсальный звуковой формат файлов WAV. Наиболее известный формат «сжатого» звука (с потерями) — MP3. Он обеспечивает сжатие данных в 10 раз и более.


Вопросы и задания

1. Когда компьютеры начали работать с текстом, с графикой, со звуком?
2. Что такое таблица кодировки? Какие существуют таблицы кодировки?
3. На чем основывается дискретное представление изображения?
4. Что такое модель цвета RGB?
5. Напишите 8-разрядный код ярко-синего цвета, ярко-желтого (смесь красного с зеленым), бледно-желтого.
6. Почему в полиграфии не используется модель RGB?
7. Что такое CMYK?
8. Какое устройство в компьютере производит оцифровку вводимого звукового сигнала?
9. Как (качественно) качество цифрового звука зависит от частоты дискретизации и разрядности дискретизации?
10. Чем удобен формат MP3?




Практическая работа № 1.4 «Представление текстов. Сжатие текстов»

Цель работы: практическое закрепление знаний о представлении в компьютере текстовых данных.

Задание 1

Определить, какие символы кодируются таблицей ASCII (DOS) соответствуют всем прописным буквам русского алфавита в кодировочной таблице ANSI (Windows). Для выполнения задания создать текст с русским алфавитом в Блокноте, а затем открыть его в режиме просмотра (клавиша F3) в любом файловом менеджере (Windows Commander, Far, Total Commander, Norton Commander) и преобразовать в другую кодировку. После выполнения задания заполнить таблицу.

Задание 2

Закодировать текст Happy Birthday to you!! с помощью кодировочной таблицы ASCII

Записать двоичное и шестнадцатеричное представление кода (для записи шестнадцатеричного кода использовать средство для просмотра файлов любого файлового менеджера).

Задание 3

Декодировать текст, записанный в международной кодировочной таблице ASCII (дано десятичное представление).

72 101 108 108 111 44 32 109 121 32 102 114 105 101 110 100 33

Задание 4

Пользуясь таблицей кодировки ASCII, расшифровать текст, представленный в виде двоичных кодов символов.

01010000 01100101 01110010 01101101 00100000 01010101

01101110 01101001 01110110 01100101 01110010 01110011

01101001 01110100 01111001

Задание 5

Пользуясь кодовой страницей Windows-1251 таблицы кодировки ASCII, получить шестнадцатеричный код слова ИНФОРМАТИЗАЦИЯ.

Задание 6

Во сколько раз увеличится объём памяти, необходимый для хранения текста, если его преобразовать из кодировки KOI8-R в кодировку Unicode?

Задание 7

С помощью табличного процессора Excel построить кодировочную таблицу ASCII, в которой символы буду автоматически отображаться на экране в соответствии с их заданным десятичным номером (использовать соответствующую текстовую функцию).

Справочная информация

Алгоритм Хаффмена. Сжатием информации в памяти компьютера называют такое её преобразование, которое ведёт к сокращению объёма ханимаемой памяти при сохранении закодированного содержания. Рассмотрим один из способов сжатия текстовой информации — алгоритм Хаффмена. С помощью этого алгоритма строится двоичное дерево, которое позволяет однозначно декодировать двоичный код, состоящий из символьный кодов различной длины. Двоичным называется дерево, из каждой вершины которого выходят две ветви. На рисунке приведён пример такого дерева, построенный для алфавита английского языка с учётом частоты встречаемости его букв.

Закодируем с помощью данного дерева слово «hello»:
   0101 100 01111 01111 1110

   При размещении этого кода в памяти побитово он примет вид:
   010110001111011111110

   Таким образом, текст, занимающий в кодировки ASCII 5 байтов, в кодировке Хаффмена займет 3 байта.

Задание 8

Используя метод сжатия Хаффмена, закодируйте следующие слова:
     а) administrator
     б) revolution
     в) economy
     г) department

Задание 9

Используя дерево Хаффмена, декодируйте следующие слова:
     а) 01110011 11001001 10010110 10010111 100000
     б) 00010110 01010110 10011001 01101101 01000100 000

Практическая работа № 1.
5 «Представление изображения и звука»

Цель работы: практическое закрепление знаний о представлении в компьютере графических данных и звука.

Справочная информация

В некоторых заданиях используется модельный (учебный) вариант монитора с размером растра 10×10 пикселей.
   При векторном подходе изображение рассматривается как совокупность простых элементов: прямых линий, дуг, окружностей, эллипсов,
прямоугольников, закрасок и пр., которые называются графическими примитивами. Графическая информация — это данные, однозначно
определяющие все графические примитивы, составляющие рисунок.
   Положение и форма графических примитивов задаются в системе графических координату связанных с экраном. Обычно начало координат
расположено в верхнем левом углу экрана. Сетка пикселей совпадает с координатной сеткой. Горизонтальная ось X направлена слева направо; вертикальная ось У — сверху вниз.
   Отрезок прямой линии однозначно определяется указанием координат его концов; окружность — координатами центра и радиусом; многоугольник — координатами его углов, закрашенная область — граничной линией и цветом закраски и пр.

Учебная система векторных команд представлена в таблице.

Например, требуется написать последовательность получения изображения буквы К:

Изображение буквы «К» на рисунке описывается тремя векторными командами:
      Линия(4, 2, 4, 8)
      Линия(5, 5, 8, 2)
      Линия(5, 5, 8, 8)

Задание 1

Построить двоичный код приведенного черно-белого растрового изображения, полученного на мониторе с размером растра 10×10.

Задание 2

Определить, какой объем памяти требуется для хранения 1 бита изображения на вашем компьютере (для этого нужно через Свойства экрана определить битовую глубину цвета).

Задание 3

Битовая глубина цвета равна 24. Сколько различных оттенков серого цвета может быть отображено на экране (серый цвет получается, если уровни яркости всех трех базовых цветов одинаковы)?

Задание 4

Дан двоичный код 8-цветного изображения. Размер монитора — 10×10 пикселей. Что изображено на рисунке (зарисовать)?

001 111 111 111 010 010 111 111 111 001
   111 111 111 011 011 011 011 111 111 111
   111 111 011 111 111 111 111 011 111 111
   111 011 111 111 111 111 111 111 011 111
   110 011 111 111 110 110 111 111 011 110
   110 011 111 111 110 110 111 111 011 110
   111 011 111 111 111 111 111 111 011 111
   111 111 011 111 111 111 111 011 111 111
   111 111 111 011 011 011 011 111 111 111
   001 111 111 111 010 010 111 111 111 001

Задание 5

Описать с помощью векторных команд следующие рисунки (цвет заливки произвольный).

Задание 6

Получить растровое и векторное представления всех цифр от 0 до 9.

Задание 7

По приведенному ниже набору векторных команд определить, что изображено на рисунке (зарисовать).

Цвет рисования Голубой
   Прямоугольник 12, 2, 18, 8
   Прямоугольник 10, 1, 20, 21
   Прямоугольник 20, 6, 50, 21
   Цвет рисования Желтый
   Цвет закраски Зеленый
   Окружность 20, 24, 3
   Окружность 40, 24, 3
   Закрасить 20, 24, Желтый
   Закрасить 40, 24, Желтый
   Цвет закраски Голубой
   Закрасить 30, 10, Голубой
   Закрасить 15, 15, Голубой
   Цвет закраски Розовый
   Закрасить 16, 6, Голубой

Задание 8

Определить, какой объем имеет 1 страница видеопамяти на вашем компьютере (узнать для этого, какое у компьютера разрешение и битовая глубина цвета). Ответ записать в мегабайтах.

Задание 9

Нарисовать в редакторе Paint изображение солнца, сохранить его в формате BMP, а затем с помощью Photoshop преобразовать его в форматы JPEG (с наивысшим качеством), JPEG (с наименьшим качеством), GIF, TIFF.
   Сравнить эффективность сжатия каждого формата, заполнив таблицу.

Задание 10

Битовая глубина цвета равна 32. Видеопамять делится на две страницы. Разрешающая способность дисплея 800×600. Вычислить объем видеопамяти.

Задание 11

На компьютере установлена видеокарта объемом 2 Мбайт. Какое максимально возможное количество цветов теоретически допустимо в палитре при работе с монитором, имеющим разрешение 1280×1024?

Задание 12

Какой объем видеопамяти в килобайтах нужен для хранения изображения размером 600×350 пикселей, использующего 8-цветную палитру?

Задание 13

Зеленый цвет на компьютере с объемом страницы видеопамяти 125 Кбайт кодируется кодом 0010. Какова может быть разрешающая способность монитора?

Задание 14

Монитор работает с 16-цветной палитрой в режиме 640×400 пикселей. Для кодирования изображения требуется 1250 Кбайт. Сколько страниц видеопамяти оно занимает?

Задание 15

Сколько цветов можно максимально использовать для хранения изображения размером 350×200 пикселей, если объем страницы видеопамяти — 65 Кбайт?

Задание 16

Определить объем памяти для хранения цифрового аудиофайла, время звучания которого 5 минут при частоте дискретизации 44,1 КГц и глубине кодирования 16 битов.

Задание 17

Записать с помощью стандартного приложения «Звукозапись» звук длительностью 1 минута с частотой дискретизации 22,050 КГц и глубиной кодирования 8 битов (моно), а затем тот же самый звук с частотой дискретизации 44,1 КГц и глубиной кодирования 16 битов (моно). Сравнить объемы полученных файлов.

Задание 18

Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мбайт, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?

Задание 19

Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мбайт. Частота дискретизации — 22 050 Гц. Какова разрядность аудиоадаптера?

Задание 20

Объем свободной памяти на диске — 0,01 Гбайт, разрядность звуковой платы — 16. Какова будет длительность звучания цифрового аудиофайла, если его записать с частотой дискретизации 44 100 Гц?

Лабораторная работа №3 Измерение информации

Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

КАТЕГОРИИ:

Археология
Биология
Генетика
География
Информатика
История
Логика
Маркетинг
Математика
Менеджмент
Механика
Педагогика
Религия
Социология
Технологии
Физика
Философия
Финансы
Химия
Экология

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву



Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

⇐ ПредыдущаяСтр 2 из 12Следующая ⇒

Цель работы: закрепление знаний о различных подходах к измерению информации.

 

Задание 1 Решите следующие задачи: 1. В корзине лежат 16 шаров. Все шары разного цвета и среди них есть красный. Сколько информации несет сообщение о том, что из корзины достали красный шар? 2. В корзине лежат 8 черных и 8 белых шаров. Сколько информации несет сообщение о том, что из корзины достали белый шар? 3. В корзине лежат 16 шаров. Среди них 4 белых, 4 черных, 4 красных и 4 зеленых. Сколько информации несет сообщение о том, что из корзины достали красный шар? 4. При угадывании целого числа в диапазоне от 1 до N было получено 7 бит информации. Чему равно N? 5. Какое количество информации содержит один символ алфавита, состоящего из 1024 символов? 6. Сколько бит несет слово «ИНФОРМАЦИЯ»? 7. В алфавите некоторого языка две буквы «А» и «Б». Все слова на этом языке состоят из 11 букв. Каков словарный запас этого языка, т.е. сколько слов он содержит? 8. Информационное сообщение объемом 1,5 килобайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? 9. Алфавит первого племени содержит N символов, алфавит второго – в два раза больше. Племена обменялись приветствиями, каждое по 100 символов. Приветствие какого племени содержит больше информации (в битах) и на сколько? 10. В процессе преобразования растрового графического файла количество всех возможных цветов было уменьшено с 1024 до 32. Как и во сколько раз изменился размер файла? Задание 2 Решите следующие задачи: 1. В ящике лежат 36 красных и несколько зеленых яблок. Сообщение «Из ящика достали зеленое яблоко» несет 2 бита информации. Сколько яблок в ящике? 2. В концертном зале 270 девушек и несколько юношей. Сообщение «Первым из зала выйдет юноша» содержит 4 бита информации. Сколько юношей в зале. 3. На остановке останавливаются автобусы с разными номерами. Сообщение о том, что к остановке подошел Автобус с номером N1 несет 4 бита информации. Вероятность появления на остановке автобуса с номером N2 в два раза меньше, чем вероятность появления автобуса с номером N1. Сколько информации несет сообщение о появлении на остановке автобуса с номером N2? 4.Известно, что в ящике лежат 20 шаров. Из них 10 — черных, 4 — белых, 4 — желтых и 2 — красных. Какое количество информации несѐт сообщения о цвете вынутого шара?  

Лабораторная работа №4 Представление чисел


Цель работы. Закрепление знаний о системах счисления и о представлении чисел в памяти компьютера, полученных при изучении курса информатики.

Задание 1

Ответьте письменно на вопросы:

1.Какое множество понятий однозначно определяет позиционную систему счисления:

1) {базис, алфавит, основание};

2) {базис, алфавит};

3) {базис}?

2. Какая последовательность чисел может быть использована в качестве базиса позиционной системы счисления?

3. Какие символы могут быть использованы в качестве цифр системы счисления?

 

Задание 2

Решите задачи: 1.Запишите десятичные представления чисел: а) 1011001112; 4. 11001,0112; б) 1AC9F16; 5.ED4A,C116; в) 17458; 6.147,258. 2.Переведите числа в десятичную систему, а затем проверьте результаты, выполнив обратные переводы:
а) 10110112; г) 5178; ж) 1F16;  
б) 0,10001102; д) 0,348; з) 0,А416;  
в) 110100,112; е) 123,418; и) 1DE,C816  

 

3.Сложите числа:

 

а) 10111012 и 11101112; д) 378 и 758; и) A16 и F16;  

4. Вычтите числа:

а) 1112 из 101002; д) 158 из 208; и) 1А16 из 3116  

5.Перемножьте числа:

а) 1011012 и 1012; д) 378 и 48;  

 

Задание 3

6. Представьте числа в двоичном виде в восьмибитовой ячейке в формате целого со знаком:

а) 56 б) -56 в) 127 г) -127.

7. Представьте вещественные числа в четырехбайтовой ячейке памяти в формате с плавающей точкой:

а) 0,5 б) 25,12 в) – 25,12

Лабораторная работа №5. Представление текста. Сжатие текста.

Цель работы. Практическое закрепление знаний о представлении в компьютере текстовых данных.

Задание 1

Определить, какие символы кодировочной таблицы ASCII (DOS) соот­ветствуют всем прописным буквам русского алфавита в кодировочной таблице ANSI (Windows). Для выполнения задания создать текст с рус­ским алфавитом в Блокноте, а затем открыть его в режиме просмотра (клавиша F3) в любом файловом менеджере (Windows Commander, Far, Total Commander, Norton Commander) и преобразовать в другую кодиров­ку. После выполнения задания заполнить таблицу.

 

Буква в ANSI Буква в ASCII Буквав ANSI Буква вASCII Буква в ANSI Буква в ASCII
А   К   X  
Б   Л   Ц  
В   М   Ч  
Г   Н   III  
Д   О   Щ  
Е   П   Ъ  
Ё   Р   Ы  
ЭК   С   Ь  
  Т   Э  
И   У   Ю  
Й   Ф   Я  

 

Задание 2

Закодировать текст с помощью кодировочной таблицы ASCII «Happy Birthday to you!»

Записать двоичное и шестнадцатеричное представления кода (для за­писи шестнадцатеричного кода использовать средство для просмотра фай­лов любого файлового менеджера).

Задание 3

Декодировать текст, записанный в международной кодировочной таб­лице ASCII (дано десятичное представление).

71 101 108 108 111 44 32 109 121 32 102 114 105 101 110 100 33

Задание 4

Пользуясь таблицей кодировки ASCII, расшифровать текст, представ­ленный в виде двоичных кодов символов.

01010000 01100101 01110010 01101101 001О0000 01010101 01101110 01101001 01110110 01100101 01110010 01110011 01101001 01110100 01111001

Задание 5

Пользуясь кодовой страницей Windows-1251 таблицы кодировки ASCII, получить шестнадцатеричный код слова ИНФОРМАТИЗАЦИЯ.

Задание 6

Во сколько раз увеличится объем памяти, необходимый для хранения текста, если его преобразовать из кодировки KOI8-R в кодировку Unicode?

⇐ Предыдущая12345678910Следующая ⇒



Читайте также:



Техника прыжка в длину с разбега

Организация работы процедурного кабинета

Области применения синхронных машин

Оптимизация по Винеру и Калману



Последнее изменение этой страницы: 2016-12-30; просмотров: 706; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia. su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь — 161.97.168.212 (0.008 с.)

Лабораторная работа №3 Измерение информации — Мегаобучалка

Цель работы: закрепление знаний о различных подходах к измерению информации.

 

Задание 1 Решите следующие задачи: 1. В корзине лежат 16 шаров. Все шары разного цвета и среди них есть красный. Сколько информации несет сообщение о том, что из корзины достали красный шар? 2. В корзине лежат 8 черных и 8 белых шаров. Сколько информации несет сообщение о том, что из корзины достали белый шар? 3. В корзине лежат 16 шаров. Среди них 4 белых, 4 черных, 4 красных и 4 зеленых. Сколько информации несет сообщение о том, что из корзины достали красный шар? 4. При угадывании целого числа в диапазоне от 1 до N было получено 7 бит информации. Чему равно N? 5. Какое количество информации содержит один символ алфавита, состоящего из 1024 символов? 6. Сколько бит несет слово «ИНФОРМАЦИЯ»? 7. В алфавите некоторого языка две буквы «А» и «Б». Все слова на этом языке состоят из 11 букв. Каков словарный запас этого языка, т.е. сколько слов он содержит? 8. Информационное сообщение объемом 1,5 килобайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? 9. Алфавит первого племени содержит N символов, алфавит второго – в два раза больше. Племена обменялись приветствиями, каждое по 100 символов. Приветствие какого племени содержит больше информации (в битах) и на сколько? 10. В процессе преобразования растрового графического файла количество всех возможных цветов было уменьшено с 1024 до 32. Как и во сколько раз изменился размер файла? Задание 2 Решите следующие задачи: 1. В ящике лежат 36 красных и несколько зеленых яблок. Сообщение «Из ящика достали зеленое яблоко» несет 2 бита информации. Сколько яблок в ящике? 2. В концертном зале 270 девушек и несколько юношей. Сообщение «Первым из зала выйдет юноша» содержит 4 бита информации. Сколько юношей в зале. 3. На остановке останавливаются автобусы с разными номерами. Сообщение о том, что к остановке подошел Автобус с номером N1 несет 4 бита информации. Вероятность появления на остановке автобуса с номером N2 в два раза меньше, чем вероятность появления автобуса с номером N1. Сколько информации несет сообщение о появлении на остановке автобуса с номером N2? 4.Известно, что в ящике лежат 20 шаров. Из них 10 — черных, 4 — белых, 4 — желтых и 2 — красных. Какое количество информации несѐт сообщения о цвете вынутого шара?  

Лабораторная работа №4 Представление чисел



Цель работы. Закрепление знаний о системах счисления и о представлении чисел в памяти компьютера, полученных при изучении курса информатики.

Задание 1

Ответьте письменно на вопросы:

1. Какое множество понятий однозначно определяет позиционную систему счисления:

1) {базис, алфавит, основание};

2) {базис, алфавит};

3) {базис}?

2. Какая последовательность чисел может быть использована в качестве базиса позиционной системы счисления?

3. Какие символы могут быть использованы в качестве цифр системы счисления?

 

Задание 2

Решите задачи: 1.Запишите десятичные представления чисел: а) 1011001112; 4. 11001,0112; б) 1AC9F16; 5.ED4A,C116; в) 17458; 6.147,258. 2.Переведите числа в десятичную систему, а затем проверьте результаты, выполнив обратные переводы:
а) 10110112; г) 5178; ж) 1F16;  
б) 0,10001102; д) 0,348; з) 0,А416;  
в) 110100,112; е) 123,418; и) 1DE,C816  

 

3. Сложите числа:

 

а) 10111012 и 11101112; д) 378 и 758; и) A16 и F16;  

4.Вычтите числа:

а) 1112 из 101002; д) 158 из 208; и) 1А16 из 3116  

5.Перемножьте числа:

а) 1011012 и 1012; д) 378 и 48;  

 

Задание 3

6. Представьте числа в двоичном виде в восьмибитовой ячейке в формате целого со знаком:

а) 56 б) -56 в) 127 г) -127.

7. Представьте вещественные числа в четырехбайтовой ячейке памяти в формате с плавающей точкой:

а) 0,5 б) 25,12 в) – 25,12

Лабораторная работа №5. Представление текста. Сжатие текста.

Цель работы. Практическое закрепление знаний о представлении в компьютере текстовых данных.

Задание 1

Определить, какие символы кодировочной таблицы ASCII (DOS) соот­ветствуют всем прописным буквам русского алфавита в кодировочной таблице ANSI (Windows). Для выполнения задания создать текст с рус­ским алфавитом в Блокноте, а затем открыть его в режиме просмотра (клавиша F3) в любом файловом менеджере (Windows Commander, Far, Total Commander, Norton Commander) и преобразовать в другую кодиров­ку. После выполнения задания заполнить таблицу.

 

Буква в ANSI Буква в ASCII Буквав ANSI Буква вASCII Буква в ANSI Буква в ASCII
А   К   X  
Б   Л   Ц  
В   М   Ч  
Г   Н   III  
Д   О   Щ  
Е   П   Ъ  
Ё   Р   Ы  
ЭК   С   Ь  
  Т   Э  
И   У   Ю  
Й   Ф   Я  

 

Задание 2

Закодировать текст с помощью кодировочной таблицы ASCII «Happy Birthday to you!»

Записать двоичное и шестнадцатеричное представления кода (для за­писи шестнадцатеричного кода использовать средство для просмотра фай­лов любого файлового менеджера).

Задание 3

Декодировать текст, записанный в международной кодировочной таб­лице ASCII (дано десятичное представление).

71 101 108 108 111 44 32 109 121 32 102 114 105 101 110 100 33

Задание 4

Пользуясь таблицей кодировки ASCII, расшифровать текст, представ­ленный в виде двоичных кодов символов.

01010000 01100101 01110010 01101101 001О0000 01010101 01101110 01101001 01110110 01100101 01110010 01110011 01101001 01110100 01111001

Задание 5

Пользуясь кодовой страницей Windows-1251 таблицы кодировки ASCII, получить шестнадцатеричный код слова ИНФОРМАТИЗАЦИЯ.

Задание 6

Во сколько раз увеличится объем памяти, необходимый для хранения текста, если его преобразовать из кодировки KOI8-R в кодировку Unicode?

Лабораторная работа №6 Представление изображения и звука

Цель работы.Практическое закрепление знаний о представлении в компьютере графических данных и звука.

Справочная информация

В некоторых заданиях используется модельный (учебный) вариант мо­нитора с размером растра 10×10 пикселей. При векторном подходе изображение рассматривается как совокуп­ность простых элементов: прямых линий, дуг, окружностей, эллипсов, прямоугольников, закрасок и пр., которые называются графическими примитивами. Графическая информация — это данные, однозначно определяющие все графические примитивы, составляющие рисунок. Положение и форма графических примитивов задаются в системе гра­фических координат, связанных с экраном. Обычно начало координат расположено в верхнем левом углу экрана. Сетка пикселей совпадает с ко­ординатной сеткой. Горизонтальная ось X направлена слева направо; вер­тикальная ось Y — сверху вниз.

Отрезок прямой линии однозначно определяется указанием координат его концов; окружность — координатами центра и радиусом; многоуголь­ник — координатами его углов, закрашенная область — граничной лини­ей и цветом закраски и пр.

Учебная система векторных команд представлена в таблице.

Установить X, У Установить текущую позицию (X, У)
Линия к XI, У1 Нарисовать линию от текущей позиции в позицию (XI, У1), позиция (XI, У1) становится текущей
ЛинияXI, У1,Х2, У2 Нарисовать линию с координатами начала XI, У1 и координатами конца Х2, У2. Текущая позиция не устанавливается
Окружность X, У, R Нарисовать окружность; X, У — координаты цен­тра, ft — длина радиуса в пикселях
ЭллипсХ1,У1,Х2,У2 Нарисовать эллипс, ограниченный прямоугольни­ком; (XI, У1) — координаты левого верхнего, а (Х2, У2) — правого нижнего угла этого прямо­угольника
Прямоугольник XI,У1,Х2,У2 Нарисовать прямоугольник; (XI, У1) — координа­ты левого верхнего угла, а (Х2, У2) — правого ни­жнего угла этого прямоугольника
Цвет_рисования ЦВЕТ Установить текущий цвет рисования
Цвет_закраски ЦВЕТ Установить текущий цвет закраски
Закрасить X, У, ЦВЕТ ГРАНИЦЫ Закрасить произвольную замкнутую фигуру; X, У — координаты любой точки внутри замкнутой фигуры, ЦВЕТ ГРАНИЦЫ — цвет граничной ли­нии

Например, требуется написатьпоследовательность получения изобра­жения буквы К:

Изображение буквы «К» на рисунке описывается тремя векторными командами:

Линия(4, 2, 4, 8)

Линия(5, 5, 8, 2)

Линия(5, 5, 8, 8)

Задание 1

Построить двоичный код приведенного черно-белого растрового изо­бражения, полученного на мониторе размером растра 10×10.

 

Задание 2

Определить, какой объем памяти потребуется для хранения 1 бита изо­бражения на вашем компьютере (для этого нужно через Свойства экрана определить битовую глубину цвета).

Задание 3

Битовая глубина цвета равна 24. Сколько различных оттенков цвета может быть отображено на экране (серый цвет получается,’ уровни яркости всех трех базовых цветов одинаковы)?

Задание 4

Дан двоичный код 8-цветного изображения. Размер монитора — 1 пикселей. Что изображено на рисунке (зарисовать)?

001 111 111 111 111 111 111011 110011 110011 111011

111111 111111

001 111

111 111

111011 011111

111111 111111

111111 111 111

011 111 111011

010 010 111 011011011

111 111 111 111 111 111

110 110 111 110110 111

111111111 111111111

011011011 010 010 111

111 111001

011 111 111 111011 111 111011 110 111011 110 111011 111 011 111 111

111 111001

Задание 5

Описать с помощью векторных команд следующие рисунки (цвет заливки произвольный).

 

Задание 6

Получить растровое и векторное представления всех цифр от 0 до 9.

Задание 7

По приведенному ниже набору векторных команд определить, что изображено на рисунке (зарисовать).

Цвет рисования Голубой

Прямоугольник 12, 2, 18, 8

Прямоугольник 10, 1, 20, 21

Прямоугольник 20, 6, SO, 21

Цвет рисования Желтый

Цвет закраски Зеленый Окружность 20, 24, 3

Окружность 40, 24, 3

Закрасить 20, 24, Желтый

Закрасить 40, 24, Желтый

Цвет закраски Голубой

Закрасить 30, 10, Голубой

Закрасить 15, 15, Голубой

Цвет закраски Розовый

Закрасить 16, 6, Голубой

Задание 8

Определить, какой объем имеет 1 страница видеопамяти на вашем ком­пьютере (узнать для этого, какое у компьютера разрешение и битовая глу­бина цвета). Ответ записать в мегабайтах.

Задание 9

Нарисовать в редакторе Paintизображение солнца, сохранить его в фор­мате BMP, а затем преобразовать его в форматы JPEG (с наивысшим качеством), JPBG(с наименьшим качеством), GIF, TIFF. Сравнить эффективность сжатия каждого формата, заполнив таблицу.

Формат Размер файла Коэффициент сжатия (по сравнению с BMP)
JPEG (высшее качество)    
JPEG (низкое качество)    
GIF    
TIFF    

Задание 10

Битовая глубина цвета равна 32. Видеопамять делится на две страни­цы. Разрешающая способность дисплея 800×600. Вычислить объем видеопамяти.

Задание 11

На компьютере установлена видеокарта объемом 2 Мбайт. Какое мак­симально возможное количество цветов теоретически допустимо в палит­ре при работе с монитором, имеющим разрешение 1280×1024?

Задание 12

Какой объем видеопамяти в килобайтах нужен для хранения изобра­жения размером 600×350 пикселей, использующего 8-цветную палитру?

Задание 13

Зеленый цвет на компьютере с объемом страницы видеопамяти 125 Кбайт кодируется кодом 0010. Какова может быть разрешающая спо­собность монитора?

Задание 14

Монитор работает с 16-цветной палитрой в режиме 640×400 пикселей. Для кодирования изображения требуется 1250 Кбайт. Сколько страниц видеопамяти оно занимает?

Задание 15

Сколько цветов можно максимально использовать для хранения изо­бражения размером 350×200 пикселей, если объем страницы видеопамя­ти — 65 Кбайт?

Задание 16

Определить объем памяти для хранения цифрового аудиофайла, время звучания которого 5 минут при частоте дискретизации 44,1 КГц и глубине кодирования 16 битов.

Задание 17

Записать с помощью стандартного приложения «Звукозапись» звук длительностью 1 минута с частотой дискретизации 22,050 КГци глубиной кодирования 8 битов (моно), а затем тот же самый звук с частотой дискре­тизации 44,1 КГц и глубиной кодирования 16 битов (моно). Сравнить объ­емы полученных файлов.

Задание 18

Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мбайт, разрядность звуковой платы — 8. С какой частотой дискрети­зации записан звук?

Задание 19

Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мбайт. Частота дискретизации — 22 050 Гц. Какова разрядность аудиоадаптера?

Что такое ansi. Character encoding

В основном «ANSI» относится к устаревшей кодовой странице в Windows. См. Также по этой теме. Первые 127 символов идентичны ASCII на большинстве кодовых страниц, однако верхние символы различаются.

Однако ANSI автоматически не означает CP1252 или Latin 1.

Несмотря на всю путаницу, вы должны просто избегать таких проблем в настоящее время и использовать Unicode.

Что такое формат кодировки ANSI? Это системный формат по умолчанию? Чем он отличается от ASCII?

Когда-то Microsoft, как и все остальные, использовала 7-битные наборы символов, и они придумали свои собственные, когда они им подошли, хотя они сохранили ASCII в качестве основного подмножества. Затем они поняли, что мир перешел к 8-битным кодировкам и что существуют международные стандарты, такие как семейство ISO-8859. В те дни, если вы хотели получить международный стандарт, и вы жили в США, вы купили его у Американского национального института стандартов ANSI, который переиздал международные стандарты со своим собственным брендингом и цифрами (это потому, что правительство США хочет соответствие американским стандартам, а не международным стандартам). Итак, копия Microsoft ISO-8859 сказала «ANSI» на обложке. И поскольку Microsoft в те дни не очень привыкла к стандартам, они не понимали, что ANSI опубликовала множество других стандартов. Поэтому они ссылались на стандарты семейства ISO-8859 (и варианты, которые они изобрели, потому что в те дни они не понимали стандартов) по названию на обложке «ANSI», и он нашел свой путь в Microsoft пользовательскую документацию и, следовательно, в сообщество пользователей. Это было около 30 лет назад, но вы все еще иногда слышите это имя сегодня.

Или вы можете запросить свой реестр:

C:\>reg query HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage /f ACP HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage ACP REG_SZ 1252 End of search: 1 match(es) found. C:\>

При использовании однобайтовых символов формат ASCII определяет первые 127 символов. Расширенные символы из 128-255 определяются различными кодами ANSI, чтобы обеспечить ограниченную поддержку других языков. Чтобы понять кодировку ANSI, вам нужно знать, какую кодовую страницу она использует.

Технически ANSI должен быть таким же, как US-ASCII. Он относится к стандарту ANSI X3.4, который является просто утвержденной версией ASCII организации ANSI . Использование символов с верхним битом не определено в ASCII / ANSI, так как это 7-разрядный набор символов.

Однако годы неправильного использования термина DOS и впоследствии сообщества Windows оставили свое практическое значение как «системную кодовую страницу какой бы то ни было машины». Системная кодовая страница также иногда известна как «mbcs», так как в системах Восточной Азии, которая может быть кодировкой с несколькими байтами на символ. Некоторые кодовые страницы могут даже использовать байты с верхним битом в качестве байтов байтов в многобайтовой последовательности, поэтому он даже не является строго совместимым с простым ASCII . .. но даже тогда он по-прежнему называется ANSI.

В настройках по умолчанию в США и Западной Европе «ANSI» сопоставляется с кодовой страницей Windows 1252. Это не то же самое, что и ISO-8859-1 (хотя это довольно похоже). На других машинах это могло быть что угодно. Это делает ANSI совершенно бесполезным в качестве внешнего идентификатора кодирования.

Я помню, когда текст ANSI ссылался на escape-коды псевдо-VT-100, используемые в DOS через драйвер ANSI.SYS, чтобы изменить поток потокового текста…. Вероятно, это не то, о чем вы говорите, но если он видит

ANSI – это учреждение для стандартизации промышленных методов и технологий. Оно является членом Международной организации по нормированию (ИСО). В Германии существует свой аналог такой организации – немецкий институт нормирования (DIN), в Австрии – Австрийский институт стандарта (ASI), в Швейцарии — Швейцарское объединение норм (SNV).

Хотя нормы ANSI и находят свое распространение во многих промышленных областях, отдельное сокращение «ANSI» в компьютерной технике обозначает определенную группу символов, базирующуюся на ASCII. Подлинной ANSI — нормы не существует, однако, проекты ANSI плавно переняли норму ИСО 8859.

Задачи ANSI

Главным заданием Американского национального института стандартов (ANSI) является распространение и внедрение национальных стандартов США по всему миру, на предприятиях всех стран.

Кроме этого, работа данного института решает задачи мирового масштаба:

  • защита окружающей среды,
  • производственная безопасность,
  • бытовая безопасность.

Известно, что в США, как и в России, стандарты регулирует, прежде всего, государство (хотя ANSI и позиционирует себя как некоммерческую негосударственную организацию), поэтому стремление заполнить эту нишу и привести все нормы к американскому знаменателю – вполне логичная и последовательная мысль. Ведь через стандарты можно распространять не только чисто технические инновации, но также проводить государственную внешнюю политику глобализации и всемирной интеграции.

На поддержку программы АНСИ государством тратится не малый бюджет, который расходуется, главным образом, на оптимизацию, актуализацию и реорганизацию методик производства. В сталелитейной промышленности стандарты ANSI уже давно зарекомендовали себя как одни из самых лучших в мире.

Наша фирма также охотно в своей работе при производстве фланцевой продукции, которая расходится огромными партиями по промышленным предприятиям России и стран СНГ.

Иногда даже достаточно опытный специалист не сразу скажет вам, чему соответствует то или иное значение давления или длины в одной системе значениям в другой системе величин.

Чтобы облегчить вам эту задачу, мы предлагаем таблицы соотношения величин давления и длины в европейской и американской системах с небольшими пояснениями . Но сначала несколько слов о самих стандартах.

DIN — это немецкий стандарт (расшифровывается как Deutsches Institut für Normung , то есть разработанный Германским институтом стандартизации), который разрабатывается строго в рамках положений Международной организации по стандартизации — ISO (International Organization for Standardization).

ANSI – стандарт, принятый в Соединённых Штатах Америки. Расшифровывается как American National Standards Institute , то есть стандарт Американского национального института по стандартизации.

Соответственно, нормы ANSI определяются именно этим институтом, и далеко не всегда между стандартами DIN и ANSI можно проследить точные соответствия в различных сферах.

Перевод единиц давления из ANSI в DIN

Здесь всё просто: если по стандарту ANSI напротив давления стоит цифра 150 — это означает, что номинальное (на которое рассчитана арматура) давление составляет 20 бар, 300 — 50 бар и т.д. Максимальное значение по ANSI Class – 2500 будет равно 420 бар по европейскому стандарту DIN .

Пользуясь этой таблицей, несложно переводить значения давления и обратно: из DIN в ANSI , хотя осуществлять такой перевод нашим инженерам требуется гораздо реже .

Перевод единиц длины из американской системы в европейскую (российскую)

Как известно, американцы всё измеряют дюймами и футами, а мы и европейцы — миллиметрами, сантиметрами и метрами, то есть, как и подавляющее большинство государств мира, мы живём в метрической системе единиц.

Как же переводить дюймы в миллиметры? На самом деле, в этом также нет ничего сложного, достаточно лишь запомнить, что 1 дюйм равняется 25,4 мм. Однако нередко цифрой после запятой пренебрегают и для ровного счёта указывают, что 1 дюйм = 25 мм .

Таким образом, если, например, сечение входного отверстия равно 2 дюймам по американской системе мер, то, переведя по вышеуказанному правилу это значение в нашу систему мер, получаем 50 мм или, что более точно — 51 мм (округлив 50,8 по правилам).

Осталось добавить, что диаметр в технических характеристиках маркируется латинскими буквами DN и нередко указывается именно в дюймах , а давление обозначается при помощи букв PN и указывается чаще всего в барах — во всяком случае, мы используем именно такую маркировку как наиболее удобную .

А следующая таблица поможет вам высчитать не только точное количество миллиметров в одном дюйме (с точностью до тысячной миллиметра), но и поможет узнать, сколько миллиметров содержится, например, в 2,5 дюймах.

Для этого находим колонку 2″» (2 дюйма), а слева ищем значение 1/2. Итого 2,5 дюйма = 63,501 мм, что вполне можно округлить до 64 мм, а, например, 6,25 дюйма (то есть 6 и 1/4) = 158,753 мм или 159 мм.


Дюймы «» в миллиметрах



ANSI-люмен (лм, lm), единица измерения — это.

..

ANSI-люмен – единица измерения освещенности в мультимедийных проекторах, создаваемой лампой при просвечивании через линзу. «Lumen» по-латыни означает «свет», ANSI расшифровывается как «American National Standards Institute». Это стандарт для измерения светового потока, используемый для сравнения проекторов.

Этот параметр был введен в 1992 году Американским институтом Национальных Стандартов в качестве единицы, характеризующей среднюю величину светового потока на контрольном экране с диагональю 40″ при минимальном фокусном расстоянии вариообъектива проектора.

Измерение проводится на полностью белой картинке (full white), освещенность экрана измеряется с помощью люксметра в люксах (Lux) в 9 контрольных точках экрана. Значение светового потока рассчитывается как среднее значение этих 9 измерений — умножаются на его площадь и усредняются.

Результирующая световая энергия на экране на каждый квадратный метр указывается в люксах и находится по формуле: люкс = люмен /м². Но измерение люменов/люксов варьируется в зависимости от окружения, настройки прибора и проецируемого изображения, поэтому сегодня в качестве стандарта всеобщее признание получила процедура определения полезного светового потока в ANSI-люменах.

Такое измерение позволяет оценить равномерности распределения светового потока по поверхности экрана. Снижение яркости изображения по его краям называют «Hot Spot» или световым пятном. Равномерность распределения светового потока рассчитывается как соотношение наименьшего и наибольшего из полученных измерений освещенности. В хороших проекторах это значение не падает ниже 70%.

Данная методика точно описывает порядок проведения измерений. При строго определенных условиях окружающей среды и настройках прибора проецируемое на экран изображение делится на девять равных частей, и в каждой из них определяется световая энергия. Среднее значение, полученное из всех девяти замеров и умноженное на площадь экрана в м², дает значение ANSI-люмена.

Интересно, что световой поток, в отличие от освещенности (измеряемой в ANSI-люменах), не зависит от проецируемой площади. К тому же, указанные производителем значения в ANSI-люменах часто опираются на эталонные максимальные настройки, которые редко используются на практике.

Также часто значение в ANSI-люменах является лишь средним значением, поэтому на основе него трудно сделать вывод, насколько хорошо или плохо проектор распределяет свет по поверхности экрана.

Значения ANSI-люменов у цифровых проекторов могут достигать от 900 ANSI-люменов у более старых моделей до 4700 ANSI-люменов у современных мощных приборов. Хороший цифровой проектор для домашнего кинотеатра должен иметь порядка 2000 ANSI-люменов.

Reg.ru: домены и хостинг

Крупнейший регистратор и хостинг-провайдер в России.

Более 2 миллионов доменных имен на обслуживании.

Продвижение, почта для домена, решения для бизнеса.

Более 700 тыс. клиентов по всему миру уже сделали свой выбор.

*Наведите курсор мыши для приостановки прокрутки.

Назад Вперед

Кодировки: полезная информация и краткая ретроспектива

Данную статью я решил написать как небольшой обзор, касающийся вопроса кодировок.

Мы разберемся, что такое вообще кодировка и немного коснемся истории того, как они появились в принципе.

Мы поговорим о некоторых их особенностях а также рассмотрим моменты, позволяющие нам работать с кодировками более осознанно и избегать появления на сайте так называемых кракозябров , т.е. нечитаемых символов.

Итак, поехали…

Что такое кодировка?

Упрощенно говоря, кодировка — это таблица сопоставлений символов, которые мы можем видеть на экране, определенным числовым кодам.

Т.е. каждый символ, который мы вводим с клавиатуры, либо видим на экране монитора, закодирован определенной последовательностью битов (нулей и единиц). 8 бит, как вы, наверное, знаете, равны 1 байту информации, но об этом чуть позже.

Внешний вид самих символов определяется файлами шрифтов , которые установлены на вашем компьютере. Поэтому процесс вывода на экран текста можно описать как постоянное сопоставление последовательностей нулей и единиц каким-то конкретным символам, входящим в состав шрифта.

Прародителем всех современных кодировок можно считать ASCII .

Эта аббревиатура расшифровывается как American Standard Code for Information Interchange (американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов).

Это однобайтовая кодировка , в которую изначально заложено всего 128 символов: буквы латинского алфавита, арабские цифры и т.д.


Позже она была расширена (изначально она не использовала все 8 бит), поэтому появилась возможность использовать уже не 128, а 256 (2 в 8 степени) различных символов, которые можно закодировать в одном байте информации.

Такое усовершенствование позволило добавлять в ASCII символы национальных языков , помимо уже существующей латиницы.

Вариантов расширенной кодировки ASCII существует очень много по причине того, что языков в мире тоже немало. Думаю, что многие из вас слышали о такой кодировке, как KOI8-R — это тоже расширенная кодировка ASCII , предназначенная для работы с символами русского языка.

Следующим шагом в развитии кодировок можно считать появление так называемых ANSI-кодировок .

По сути это были те же расширенные версии ASCII , однако из них были удалены различные псевдографические элементы и добавлены символы типографики, для которых ранее не хватало «свободных мест».

Примером такой ANSI-кодировки является всем известная Windows-1251 . Помимо типографических символов, в эту кодировку также были включены буквы алфавитов языков, близких к русскому (украинский, белорусский, сербский, македонский и болгарский).


ANSI-кодировка — это собирательное название . В действительности, реальная кодировка при использовании ANSI будет определяться тем, что указано в реестре вашей операционной системы Windows. В случае с русским языком это будет Windows-1251, однако, для других языков это будет другая разновидность ANSI.

Как вы понимаете, куча кодировок и отсутствие единого стандарта до добра не довели, что и стало причиной частых встреч с так называемыми кракозябрами — нечитаемым бессмысленным набором символов.

Причина их появления проста — это попытка отобразить символы, закодированные с помощью одной кодировочной таблицы, используя другую кодировочную таблицу .

В контексте веб-разработки, мы можем столкнуться с кракозябрами, когда, к примеру, русский текст по ошибке сохраняется не в той кодировке, которая используется на сервере .

Разумеется, это не единственный случай, когда мы можем получить нечитаемый текст — вариантов тут масса, особенно, если учесть, что есть еще база данных, в которой информация также хранится в определенной кодировке, есть сопоставление соединения с базой данных и т.д.

Возникновение всех этих проблем послужило стимулом для создания чего-то нового. Это должна была быть кодировка, которая могла бы кодировать любой язык в мире (ведь с помощью однобайтовых кодировок при всем желании нельзя описать все символы, скажем, китайского языка, где их явно больше, чем 256), любые дополнительные спецсимволы и типографику.

Одним словом, нужно было создать универсальную кодировку, которая решила бы проблему кракозябров раз и навсегда .

Юникод — универсальная кодировка текста (UTF-32, UTF-16 и UTF-8)

Сам стандарт был предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode Consortium, Unicode Inc.), и первым результатом его работы стало создание кодировки UTF-32 .

Кстати, сама аббревиатура UTF расшифровывается как Unicode Transformation Format (Формат Преобразования Юникод).

В этой кодировке для кодирования одного символа предполагалось использовать аж 32 бита , т.е. 4 байта информации. Если сравнивать это число с однобайтовыми кодировками, то мы придем к простому выводу: для кодирования 1 символа в этой универсальной кодировке нужно в 4 раза больше битов , что «утяжеляет» файл в 4 раза.

Очевидно также, что количество символов, которое потенциально могло быть описано с помощью данной кодировки, превышает все разумные пределы и технически ограничено числом, равным 2 в 32 степени. Понятно, что это был явный перебор и расточительство с точки зрения веса файлов, поэтому данная кодировка не получила распространения.

На смену ей пришла новая разработка — UTF-16 .

Как очевидно из названия, в этой кодировке один символ кодируют уже не 32 бита, а только 16 (т.е. 2 байта). Очевидно, это делает любой символ вдвое «легче», чем в UTF-32, однако и вдвое «тяжелее» любого символа, закодированного с помощью однобайтовой кодировки.

Количество символов, доступное для кодирования в UTF-16 равно, как минимум, 2 в 16 степени, т.е. 65536 символов. Вроде бы все неплохо, к тому же окончательная величина кодового пространства в UTF-16 была расширена до более, чем 1 миллиона символов.

Однако и данная кодировка до конца не удовлетворяла потребности разработчиков. Скажем, если вы пишете, используя исключительно латинские символы, то после перехода с расширенной версии кодировки ASCII к UTF-16 вес каждого файла увеличивался вдвое.

В результате, была предпринята еще одна попытка создания чего-то универсального , и этим чем-то стала всем нам известная кодировка UTF-8.

UTF-8 — это многобайтовая кодировка с переменной длинной символа . Глядя на название, можно по аналогии с UTF-32 и UTF-16 подумать, что здесь для кодирования одного символа используется 8 бит, однако это не так. Точнее, не совсем так.

Дело в том, что UTF-8 обеспечивает наилучшую совместимость со старыми системами, использовавшими 8-битные символы. Для кодирования одного символа в UTF-8 реально используется от 1 до 4 байт (гипотетически можно и до 6 байт).

В UTF-8 все латинские символы кодируются 8 битами, как и в кодировке ASCII . Иными словами, базовая часть кодировки ASCII (128 символов) перешла в UTF-8, что позволяет «тратить» на их представление всего 1 байт, сохраняя при этом универсальность кодировки, ради которой все и затевалось.

Итак, если первые 128 символов кодируются 1 байтом, то все остальные символы кодируются уже 2 байтами и более. В частности, каждый символ кириллицы кодируется именно 2 байтами.

Таким образом, мы получили универсальную кодировку, позволяющую охватить все возможные символы, которые требуется отобразить, не «утяжеляя» без необходимости файлы.

C BOM или без BOM?

Если вы работали с текстовыми редакторами (редакторами кода), например Notepad++ , phpDesigner , rapid PHP и т.д., то, вероятно, обращали внимание на то, что при задании кодировки, в которой будет создана страница, можно выбрать, как правило, 3 варианта:

ANSI
— UTF-8
— UTF-8 без BOM


Сразу скажу, что выбирать всегда стоит именно последний вариант — UTF-8 без BOM .

Итак, что же такое BOM и почему нам это не нужно?

BOM расшифровывается как Byte Order Mark . Это специальный Unicode-символ, используемый для индикации порядка байтов текстового файла. По спецификации его использование не является обязательным, однако если BOM используется, то он должен быть установлен в начале текстового файла.

Не будем вдаваться в детали работы BOM . Для нас главный вывод следующий: использование этого служебного символа вместе с UTF-8 мешает программам считывать кодировку нормальным образом , в результате чего возникают ошибки в работе скриптов.

Длина кодовой комбинации, включающая информационные символы и проверочные (контрольные) символы, называется _ кода

Другие предметы, 17.04.2019 04:50, danarinka

Действия, при которых абонент А заявляет, что не посылал сообщения абоненту В, хотя на самом деле посылал, называются
(*ответ*) ренегатством
 подменой
 переделкой
 маскарадом
Действия, при которых абонент В изменяет документ и утверждает, что данный документ (измененный) получил от абонента A, называются
(*ответ*) переделкой
 ренегатством
 маскарадом
 подменой
Действия, при которых абонент В формирует документ (новый) и заявляет, что получил его от абонента A, называется
(*ответ*) подменой
 активным перехватом
 маскарадом
 переделкой
Действия, при которых абонент С посылает документ от имени абонента А, называется
(*ответ*) маскарадом
 пассивным перехватом
 активным перехватом
 ренегатством
Действия, при которых абонент С посылает ранее переданный документ, который абонент A послал абоненту В, называются
(*ответ*) повтором
 маскарадом
 ренегатством
 подменой
Действия, при которых нарушитель, подключившийся к сети, получает документы (файлы) и изменяет их, называются
(*ответ*) активным перехватом
 фальсификацией
 копированием
 пассивным перехватом
Дефекты, проявляющиеся в невозможности правильного чтения и/или записи данных на отдельных участках магнитного диска из-за механических повреждений, неудовлетворительного качества или старения магнитного покрытия диска, называются
(*ответ*) физическими
 нерезидентными вирусами
 безвредными вирусами
 логическими
Деятельность субъекта, в ходе которой он получает сведения об интересующем его объекте, называется _ информации
(*ответ*) сбором
 обработкой
 накоплением
 обменом
Длина ключа в шифроалгоритме DES в битах составляет
(*ответ*) 56
 16
 64
 65
Длина кодовой комбинации, включающая информационные символы и проверочные (контрольные) символы, называется _ кода
(*ответ*) значностью
 корректирующей способностью
 размерностью
 избыточностью
Для «взламывания» системы защиты используется
(*ответ*) криптоанализ
 шифроанализ
 шифрография
 криптография

Всего ответов: 2

Посмотреть ответы

Похожие вопросы

Другие предметы, 16. 04.2019 22:42, кракозябрлохиябра2

Устройство, переводящее цифры, буквы и другие языковые символы в комбинации проколов, доступных для обработки на ЭВМ

Ответов: 2

Посмотреть

Другие предметы, 17.04.2019 00:20, Oleksandra2005

Информационные технологии, которые реализуют технологию решения задач в конкретной предметной области путем использования комбинации

Ответов: 2

Посмотреть

Другие предметы, 17.04.2019 05:30, Аккаунт удален

Кодовая комбинация состоит из 10 импульсов трех форм: А, В и С, причем в каждой кодовой комбинации три импульса имеют форму

Ответов: 2

Посмотреть

Другие предметы, 16.04.2019 23:00, перемена1

Пользуясь кодовой страницей Windows-1251 таблицы кодировки ASCII, получить шестнадцатеричный код слова ИНФОРМАТИЗАЦИЯ.

Ответов: 2

Посмотреть

Знаешь правильный ответ?

Длина кодовой комбинации, включающая информационные символы и проверочные (контрольные) символы, наз…

Вопросы по предметам

Математика

Назови попарно номера машин, которые двигаются: в одном направлении; в противоположных направлениях в разных направлениях. ..

3 ответ(ов)

Биология

Каково значение фотосинтеза отдельно для растений и…

2 ответ(ов)

Русский язык

Подберите антонимы к словам: 1)темный(ночь, лицо, рубашка) 2)верный(друг, решение, вывод) 3)легкий(танец, решение, запах)…

2 ответ(ов)

Математика

Назовите 10 писателей 10 поэтов 10 художников…

3 ответ(ов)

Русский язык

Подобрать 6 слов на каждый чередующейся корень…

2 ответ(ов)

Химия

Какой объем водорода надо затратить, (при н. у) , чтобы восстановить 125 г оксида магния до металла?…

2 ответ(ов)

Математика

Кобщему знаменателю знаменатели 693 672…

2 ответ(ов)

Русский язык

Словообразовательный разбор слов: спор (*_*)…

3 ответ(ов)

Литература

Скакой главы по какую в романе «война и мир» идет речь о партизанской войне? том 4,часть 3,глава 1-начало. а конец? последняя глава 3 части или дальше еще есть?…

1 ответ(ов)

Алгебра

X*(x-2)(x-4)(x-6)=33 произведение корней найти. ..

1 ответ(ов)

Больше вопросов по предмету: Другие предметы Случайные вопросы

Задать вопрос

Популярные вопросы

Из ряда чисел выбери то, в записи которого отсутст…

1 ответ(ов)

.(Сторона квадрата равна 20 см. на сколько процент…

1 ответ(ов)

Сочинение на тему мы в ответе за того, кого прируч…

1 ответ(ов)

Напишите всё что знаите про имя существительное…

2 ответ(ов)

С: для образования средней соли к раствору серной…

1 ответ(ов)

Составте предложение со словом «пренебрегать»…

2 ответ(ов)

Врастворённом виде минеральные соли поступают в ра…

2 ответ(ов)

Решите уравнение пож 1) х/3 — х/4 =1/6 2)х/4=х-1/6…

1 ответ(ов)

Знайти векторний добуток векторів a(-5; 5; -5) b(4…

2 ответ(ов)

Вектор а=-3i + 4j, чему тогда равна длинна вектора…

2 ответ(ов)

Кодовая страница Windows 1251

Кодовая страница Windows 1251 Эта страница содержит таблицу кодовой страницы Microsoft Windows 1251 для русского и некоторые другие языки, написанные кириллицей. CP1251 символы заключены буквально в скобки слева от каждой строки. Если вы сохраните эту страницу, у вас будет таблица CP1251, которую вы сможете использовать для проверки своих конфигурация набора символов эмулятора терминала.
Кодовая страница Microsoft Windows 1251
char dec col/row oct шестнадцатеричное описание
[] 128 08/00 200 80 ЗАГЛАВНАЯ БУКВА DJE
[] 12901.08.201 81 ЗАГЛАВНАЯ БУКВА ГЖЕ
[] 130 02/08 202 82 LOW 9 ОДИНОЧНАЯ ЦИТАТА
[] 131 03/08 203 83 СТРОЧНАЯ БУКВА ГЖЕ
[] 132 08/04 204 84 LOW 9 ДВОЙНАЯ ЦИТАТА
[] 133 05.08.205 85 ЭЛЛИПСИС
[] 134 08/06 206 86 КИНЖАЛ
[] 135 07.08 207 87 ДВОЙНОЙ КИНЖАЛ
[] 136 08/08 210 88 ЗНАК ЕВРО
[] 137 08/09 211 89 ПРОМИЛЬ ЗНАК
[] 138 08/10 212 8A ЗАГЛАВНАЯ БУКВА LJE
[] 139 08/11 213 8B ЛЕВАЯ ОДИНАРНАЯ СКОБКА
[] 140 08/12 214 8C ЗАГЛАВНАЯ БУКВА NJE
[] 141 08/13 215 8D ЗАГЛАВНАЯ БУКВА KJE
[] 142 08/14 216 8E ЗАГЛАВНАЯ БУКВА ТШЕ
[] 143 08/15 217 8F ЗАГЛАВНАЯ БУКВА ДЖЕ
[] 144 09/00 220 90 СТРОЧНАЯ БУКВА DJE
[] 145 09/01 221 91 HIGH 6 ОДИНОЧНАЯ ЦИТАТА
[] 146 09/02 222 92 ВЫСОКИЙ 9 ОДИНОЧНАЯ ЦИТАТА
[] 147 03/09 223 93 HIGH 6 ДВОЙНАЯ ЦИТАТА
[] 148 04/04 224 94 HIGH 9 ДВОЙНАЯ ЦИТАТА
[] 149 05/09 225 95 БОЛЬШАЯ ТОЧКА ПО ЦЕНТРУ
[] 150 09/06 226 96 РУССКИЙ ТИРЕ
[] 151 07. 09.227 97 EM ТИРЕ
[] 152 08/09 230 98 (НЕОПРЕДЕЛЕНО)
[] 153 09/09 231 99 ЗНАК ТОРГОВОГО ЗНАКА
[] 154 09/10 232 9A СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА LJE
[] 155 09/11 233 9B ПРАВАЯ ОДИНАРНАЯ КАТЫЧКА
[] 156 09/12 234 9C СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА NJE
[] 157 09/13 235 9D СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА KJE
[] 158 09/14 236 9E ЗАГЛАВНАЯ БУКВА ЦШЕ
[] 159 09/15 237 9F ЗАГЛАВНАЯ БУКВА ДЖЕ
[] 160 10/00 240 A0 НЕРАЗРЫВНЫЙ ПРОБЕЛ
[] 161 10/01 241 A1 КИРИЛЛИЧНАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ U
[] 162 10/02 242 A2 СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА КОРОТКАЯ U
[] 163 10/03 243 A3 ЗАГЛАВНАЯ БУКВА JE
[] 164 10/04 244 A4 ЗНАК ВАЛЮТЫ
[] 165 10/05 245 A5 ЗАГЛАВНАЯ БУКВА GHE С ПЕРЕВЕРТОМ ВВЕРХ
[] 166 10/06 246 A6 Сломанная полоса
[] 167 10/07 247 A7 ЗНАК АБЗАЦА
[] 168 10/08 250 A8 ЗАГЛАВНАЯ БУКВА IO
[] 16910/09 251 A9 ЗНАК АВТОРСКОГО ПРАВА
[] 170 10/10 252 АА КИРИЛЛИЧНАЯ ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ ИЕ
[] 171 10/11 253 AB ЛЕВАЯ УГЛОВАЯ КАвычка
[] 172 12/10 254 AC НЕ ЗНАК
[] 173 13/10 255 ОБЪЯВЛЕНИЕ МЯГКИЙ ДЕФЕС
[] 174 10/14 256 AE ЗНАК ЗАРЕГИСТРИРОВАННОЙ ТОРГОВОЙ МАРКИ
[] 175 10/15 257 AF ЗАГЛАВНАЯ БУКВА ЙИ
[] 176 11/00 260 B0 ЗНАК ГРАДУСА, КОЛЬЦО ВВЕРХУ
[] 177 11/01 261 B1 ЗНАК ПЛЮС-МИНУС
[] 178 11/02 262 B2 ЗАГЛАВНАЯ БУКВА БЕЛОРУСЬ-УКРАИНСКАЯ I
[] 179 11/03 263 B3 СТРОЧНАЯ КИРИЛЛИЧНАЯ БЕЛОРУССКАЯ-УКРАИНСКАЯ I
[] 180 11/04 264 B4 КИРИЛЛИЧНАЯ СТРОЧНАЯ БУКВА GHE С ПЕРЕВЕРТОМ
[] 181 11/05 265 B5 МИКРОЗНАК
[] 182 11/06 266 B6 ЗНАК ПОДУШКА
[] 183 11/07 267 B7 СРЕДНЯЯ ТОЧКА
[] 184 11/08 270 B8 СТРОЧНАЯ БУКВА IO
[] 185 11/09271 B9 ЦИФРОВОЙ ЗНАК
[] 186 11/10 272 БА СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА УКРАИНСКИЙ ИЕ
[] 187 11/11 273 BB ПРЯМОЙ УГОЛ КАвычки
[] 188 12/11 274 г.  до н.э. СТРОЧНАЯ БУКВА ДЖЕ
[] 189 13/11 275 БД ЗАГЛАВНАЯ БУКВА ДЗЕ
[] 190 14/11 276 BE СТРОЧНАЯ БУКВА ДЗЕ
[] 191 15/11 277 BF СТРОЧНАЯ БУКВА ЙИ
[] 192 12/00 300 C0 ЗАГЛАВНАЯ БУКВА A
[] 193 12/01 301 C1 ЗАГЛАВНАЯ БУКВА BE
[] 194 12/02 302 C2 ЗАГЛАВНАЯ БУКВА VE
[] 195 12/03 303 C3 ЗАГЛАВНАЯ БУКВА GHE
[] 196 12/04 304 C4 ЗАГЛАВНАЯ БУКВА DE
[] 197 12/05 305 C5 ЗАГЛАВНАЯ БУКВА IE
[] 198 12/06 306 C6 ЗАГЛАВНАЯ БУКВА ЖЕ
[] 199 12/07 307 C7 ЗАГЛАВНАЯ БУКВА ZE
[] 200 12/08 310 C8 ЗАГЛАВНАЯ БУКВА I
[] 201 12/09 311 C9 ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I
[] 202 12/10 312 CA ЗАГЛАВНАЯ БУКВА КА
[] 203 12/11 313 CB ЗАГЛАВНАЯ БУКВА EL
[] 204 12/12 314 CC ЗАГЛАВНАЯ БУКВА EM
[] 205 12/13 315 CD ЗАГЛАВНАЯ БУКВА RU
[] 206 12/14 316 CE ЗАГЛАВНАЯ БУКВА O
[] 207 12/15 317 CF ЗАГЛАВНАЯ БУКВА PE
[] 208 13/00 320 D0 ЗАГЛАВНАЯ БУКВА ER
[] 20913/01 321 D1 ЗАГЛАВНАЯ БУКВА ES
[] 210 13/02 322 D2 ЗАГЛАВНАЯ БУКВА TE
[] 211 13/03 323 D3 ЗАГЛАВНАЯ БУКВА U
[] 212 13/04 324 D4 ЗАГЛАВНАЯ БУКВА EF
[] 213 13/05 325 D5 ЗАГЛАВНАЯ БУКВА HA
[] 214 13/06 326 D6 ЗАГЛАВНАЯ БУКВА ТСЕ
[] 215 13/07 327 D7 ЗАГЛАВНАЯ БУКВА ЧЕ
[] 216 13/08 330 D8 ЗАГЛАВНАЯ БУКВА ША
[] 217 13/09 331 D9 ЗАГЛАВНАЯ БУКВА ЩА
[] 218 13/10 332 DA КИРИЛЛИЧНАЯ ЗАГЛАВНАЯ БУКВА ПРОБНЫЙ ЗНАК
[] 21913/11 333 ДБ ЗАГЛАВНАЯ БУКВА ЕРУ
[] 220 13/12 334 DC КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК
[] 221 13/13 335 DD ЗАГЛАВНАЯ БУКВА E
[] 222 13/14 336 DE ЗАГЛАВНАЯ БУКВА Ю
[] 223 13/15 337 DF ЗАГЛАВНАЯ БУКВА Я
[] 224 14/00 340 E0 СТРОЧНАЯ БУКВА А
[] 225 14/01 341 E1 СТРОЧНАЯ БУКВА BE
[] 226 14/02 342 E2 СТРОЧНАЯ БУКВА VE
[] 227 14/03 343 E3 СТРОЧНАЯ БУКВА GHE
[] 228 14/04 344 E4 СТРОЧНАЯ БУКВА DE
[] 22914/05 345 E5 СТРОЧНАЯ БУКВА IE
[] 230 14/06 346 E6 СТРОЧНАЯ БУКВА ЖЕ
[] 231 14/07 347 E7 СТРОЧНАЯ БУКВА ZE
[] 232 14/08 350 E8 СТРОЧНАЯ БУКВА I
[] 233 14/09 351 E9 СТРОЧНАЯ БУКВА КИРИЛЛИЦЫ КОРОТКАЯ I
[] 234 14/10 352 EA СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА КА
[] 235 14/11 353 EB СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА EL
[] 236 14/12 354 EC СТРОЧНАЯ БУКВА EM
[] 237 14/13 355 ЭД СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА EN
[] 238 14/14 356 EE СТРОЧНАЯ БУКВА О
[] 23914/15 357 EF СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА PE
[] 240 15/00 360 F0 СТРОЧНАЯ БУКВА ER
[] 241 15/01 361 F1 СТРОЧНАЯ БУКВА ES
[] 242 15/02 362 F2 СТРОЧНАЯ БУКВА TE
[] 243 15/03 363 F3 СТРОЧНАЯ БУКВА U
[] 244 15/04 364 F4 СТРОЧНАЯ БУКВА EF
[] 245 15/05 365 F5 СТРОЧНАЯ БУКВА HA
[] 246 15/06 366 F6 СТРОЧНАЯ БУКВА ТСЭ
[] 247 15/07 367 F7 СТРОЧНАЯ БУКВА ЧЕ
[] 248 15/08 370 F8 СТРОЧНАЯ БУКВА ЧА
[] 24915/09 371 F9 СТРОЧНАЯ БУКВА ЩА
[] 250 15/10 372 FA СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЖЕСТКИЙ ЗНАК
[] 251 15/11 373 FB СТРОЧНАЯ БУКВА ЕРУ
[] 252 15/12 374 FC СТРОЧНАЯ БУКВА КИРИЛИЦЫ МЯГКИЙ ЗНАК
[] 253 15/13 375 FD СТРОЧНАЯ БУКВА Е
[] 254 15/14 376 ФЕ СТРОЧНАЯ БУКВА Ю
[] 255 15/15 377 FF СТРОЧНАЯ БУКВА Я
 

Франк да Круз, Проект Кермит, Колумбийский университет, март 2003 г.

Языковые драйверы > Образцы языковых драйверов BDE

Многие или, по крайней мере, некоторые современные базы данных используют символы Unicode для представления текста, что позволяет избежать проблем с неправильным представлением символов, используемых в региональных языках.
Поскольку BDE не обновлялся с 2001 года и никогда не будет обновляться, таблицы, зависящие от поддержки BDE, никогда не будут совместимы с Unicode (UTF-8 или Unicode) и, таким образом, будут по-прежнему зависеть от интерпретации символов на основе различных кодовых страниц для 224-символьного расширенного ASCII. набор символов (коды символов 32-255).
Единственными символьными данными, способными поддерживать правильное представление символов независимо от языкового драйвера, являются данные, хранящиеся в формате RTF либо в FormattedMemo, либо в формате RTF в обычных полях Memo.

Таким образом, чтобы удовлетворить потребности различных надписей, адаптирующихся к различным языкам, даже при использовании только обычного диапазона из 224 символов, каждая таблица данных связана с драйверами языка и набора символов, что позволяет интерпретировать региональные символы одних и тех же числовых кодов символов в пределах расширенный набор символов ASCII.

Это означает, что таблицу Paradox или dBase можно переносить от одного пользователя к другому без потери надлежащих настроек символов для заголовков столбцов и содержимого строк таблицы, поскольку настройка языкового драйвера встроена в каждую таблицу данных .db и .dbf.

Поскольку наборы символов, используемые с переносимыми таблицами, могут быть неправильными во время экспорта или импорта между различными системами баз данных, вам может потребоваться настроить выбор символов, используемых с определенными таблицами, например. получение таблицы Paradox, экспортированной из базы данных MS Access.

Изменение языкового драйвера таблицы вообще не меняет данные, меняется только символ, считываемый из каждого сохраненного числового кода символа.

Смена языкового драйвера для текущей отображаемой таблицы осуществляется через меню таблицы.

В меню «Справка» вы можете увидеть большое количество доступных кодов драйверов.

См. также внешнюю ссылку Коды символов.

Расширенный набор символов ASCII в таблицах BDE и системные настройки, отличные от Unicode

Поскольку BDE не поддерживает Unicode, отображение символов, отличных от тех, которые поддерживаются символами, не поддерживающими Unicode по умолчанию в вашей текущей системе, зависит от адаптации системных настроек Windows для приложений, не поддерживающих Unicode, как показано в справке PdxEditor | Диалоговое окно «О программе» (IBM/OEM CodePage).
Обычно набор символов Windows по умолчанию сопровождается определенным набором символов DOS по умолчанию, например. cp1252 с cp850, cp1251 с cp866 и т. д.
Однако это можно изменить в системных настройках по мере необходимости (но обычно это не рекомендуется!).

Отображение символов таблицы BDE зависит от этих настроек, однако псевдографические символы не будут отображаться даже при применении, например, cp437 для приложений Windows, не поддерживающих Юникод.
При отображении таблицы BDE с помощью драйвера ASCII все псевдографические символы недоступны, отображаются с символом замены #, как и исторические Pesetas Pts (₧ — #158), малоиспользуемый знак «Не перевернуто» (⌐ — #169), а также большинство греческих и математических символов.

На современном компьютере (например, с Windows 7, 8 или 10 и западными системными настройками) при отображении таблицы BDE все символы набора CodePage 1252 отображаются с использованием, например, любой из языковых драйверов Windows DBWINUS0, DBWINES0 или DBWINWE0.

С драйвером INTL850 отображаются все символы CodePage 850, за исключением псевдографических рисунков и символов штриховки, используемых в старых системах DOS.

В некоторых настройках некоторые символы могут отображаться соответствующими замещающими символами, например. в CodePage 850 символ i без точки #213 (используется в турецком и армянском языках) заменен в BDE стандартным i (системная настройка cp1252/cp850).

Что касается DBWINWE0, то на самом деле он не указывает набор символов Windows Western 1252, а только текущий набор символов Windows, поэтому при отображении таблицы BDE с драйвером DBWINWE0 на компьютере, использующем набор символов кириллицы cp1251/cp866, расширенный набор символов не будет отображаться. символы из CodePage 1252, а скорее символы кириллицы из CodePage 1251.
Кроме того, в той же таблице в системе, использующей cp1252/cp866 (необычная настройка!) неожиданно будет отображаться полный набор кириллических символов, такой как CP1251 (см. ниже).

Отображение других символов, напр. Таким образом, кириллица в диапазоне 128–255 с применением драйвера ancyrr будет зависеть от системных настроек для приложений, не поддерживающих юникод, например. Кодовая страница 866 для кириллицы.
 

Таблица BDE (Paradox) при просмотре с примененным драйвером языка ASCII и системными настройками CodePage 1252 с CP437 для приложений, не поддерживающих Unicode:

 

Таблица BDE (Paradox) при просмотре с примененным языковым драйвером INTL850 и системными настройками CodePage 12502 с CP8552 с CP8502 для приложений, не поддерживающих Юникод:

 

Таблица BDE (Paradox) просматривается с примененным драйвером языка DBWINWE0 и системными настройками CodePage 1252 с CP850 для приложений, не поддерживающих Unicode:

   

Таблица BDE с применением системного драйвера DBWINWE (Paradox) CodePage 1252 с CP866 для приложений, не поддерживающих Unicode:

 

Таблица BDE (Paradox), просмотренная с применением драйвера языка cyrr и системных настроек CodePage 1252 с CP866 для приложений, не поддерживающих Unicode:

 

Таблица BDE (Paradox), просмотренная с применением драйвера языка ancyrr и системных настроек CodePage 1252 с CP866 для приложений, не поддерживающих Unicode:

Различия кодовых страниц

Для сравнения в следующих примерах показан один и тот же код символов из незакодированного текстового файла, открытого в текстовом редакторе с четырьмя разными кодовыми страницами: 437 (США), 850 (международная западная), 1252 (западная Windows) и 1251 (кириллица Windows).

При просмотре с кодовой страницей 437:

 
При просмотре с кодовой страницей 850:

 
При просмотре с кодовой страницей 1252:

 

При просмотре с кодовой страницей 1251 (кириллица):

1 __________________________
Справка по приложению PdxEditor, 18 июля 2022 г.; © 2010-2022 Нильс Кнабе

Кодовая страница и компания

Кодовая страница и компания В начале 1980-х годов еще не существовало согласованных международных стандартов. например, ISO-8859 или Unicode о том, как расширить US-ASCII для международных пользователей, и многие производители придумали собственные кодировки, используя трудно запоминаемые номера:

Кодовые страницы MS-DOS

CP437 (DOSLatinUS)

Промышленный стандарт IBM Персональный компьютер начинался со знаменитой кодовой страницы CP437 с множество символов, рисующих прямоугольники, и несколько избранных иностранных букв:


кодировка=cp437 [ТЕКСТ] [БДФ]

CP850 (DOSLatin1)

Некоторые более поздние версии MS-DOS позволяли изменять кодовые страницы на Видеокарты VGA до чего-то вроде CP850, которые представляли репертуар Latin1 на позициях совместим с CP437, так что рисование линий по-прежнему работал:


кодировка=cp850 [ТЕКСТ] [БДФ]

CP852 (DOSLatin2)

CP852 сделал то же самое для Latin2 (Восточная Европа):


кодировка=cp852 [ТЕКСТ] [БДФ]

CP855 (DOSCyrillic)

CP855 был введен как соответствующая кодовая страница кириллицы:


кодировка=cp855 [ТЕКСТ] [БДФ]

CP866 (DOSCyrillicRussian)

За

CP855 вскоре последовал CP866, который следовал более логичному порядку русского алфавита альтернативный вариант, который предпочли многие российские пользователи:


кодировка=cp866 [ТЕКСТ] [БДФ]

Еще более широко используемая кириллическая кодировка (KOI8-R) позже получила номер CP878.

CP874 (DOSThai)

Тайский процессор Microsoft CP874 также соответствует установленным стандартам. а именно ТИС-620, но добавляет нестандартные символы в неиспользуемых позициях:


кодировка=cp874 [ТЕКСТ] [БДФ]

CP737..CP862

Теперь я избавил вас от кровавых подробностей из

CP737
DOSГреческий
CP775
ДОСБалтРим
CP857
DOSТурецкий
CP860
DOSПортугальский
CP861
DOSисландский
CP862
DOSИврит
CP863
DOSCanadaF
CP864
DOSAрабский
CP865
DOSNordic
CP869
DOSGreek2

Кодовые страницы MS-Windows

CP1252 (WinLatin1)

С появлением Windows Microsoft осмелилась попрощаться с символы рисования линий и совместимость с CP437, а также принят модифицированный расширенный набор ISO-8859. -1 как CP1252:


кодировка = Windows-1252 [ТЕКСТ] [БДФ]

CP1250 (WinLatin2)

Как ни странно, WinLatin2 получил номер CP1250 и отличается от ISO-8859-2 в некоторых позициях, но принесли Microsoft большой доход на развивающихся рынках Восточная Европа в 1990-е годы:


кодировка = Windows-1250 [ТЕКСТ] [БДФ]

CP1251 (WinCyrillic)

Другим таким примером является кириллица. кодовая страница CP1251, для которой Microsoft зарегистрировала метку «Windows-1251». По состоянию на декабрь 1997, даже новый веб-сервер ГОСТа (Lotus Notes) приветствует вас с кодировкой=WINDOWS-1251. ГОСТ (российская стандартизация органа и организации-члена ISO) не даже после своего стандартов больше нет!

CP1251 имеет богатый репертуар в порядке, несовместимом с обоими ISO-IR-111 (KOI8) и ISO-8859-5:


кодировка = Windows-1251 [ТЕКСТ] [БДФ]

CP1257 (WinBaltic)

Это WinBaltic, который мог послужить моделью для ISOLatin7:


кодировка = Windows-1257 [ТЕКСТ] [БДФ]

CP1253.

..CP1258 Вы понимаете, другие кодовые страницы Windows:
1253
WinGreek отличается от ISO-8859-7 расположением заглавной буквы с тонами и только несколько символов.
1254
WinTurkish делает с WinLatin1 что ISO-8859-9 соответствует ISO-8859-1.
1255
WinHebrew совместим по буквам с ISO-8859-8.
1256
WinArabic сохраняет символы и маленькие французские буквы из WinLatin1 и вставляет арабские буквы в свободные слоты так, чтобы только позиции =C1..=D6 (первая половина арабский алфавит) совместимы с ISO-8859-6.
1257
WinBaltic совместим с ISOLatin7 по буквам.
1258
WinVietnamese похож на WinLatin1 и сильно отличается от VISCII.

Кодовые страницы CJK

Очень сильно отличается от кодировок расширенного кодирования Unix EUC, все следующие кодовые страницы Восточной Азии незаконно повторно используют C1 управляющие коды {=80. .=9F} для их ведущих байтов и значений ASCII {=40..=7E} для их вторых байтов, чтобы закодировать более десяти тысяча символов с двумя байтами. Это означает, что значения ASCII за пределами =3F в своих потоках байтов не всегда означают символы ASCII.

CP932
Shift-JIS сочетает в себе Японские кодировки JIS X 0201 (один байт на символ) и JIS X 0208 (два байта на символ), чтобы JIS X 0201 Hiragana оставался однобайтовые символы половинной ширины и 60 свободных 8-битных кодовых позиций которые не содержат хираганы, используются в качестве ведущих байтов для 7076 кандзи и 648 других символов полной ширины. В отличие от EUC-JP, Shift-JIS не имеет осталось место для дополнительных 5802 кандзи из JIS X 0212.
CP936
GBK расширяет EUC-CN (8-битный кодировка GB 2312-80 с 6763 hanzi) для упрощенного zh_CN Материк китайский , чтобы охватить все 20902 иероглифов хань, найденных в Юникод (GB 13000.1-93).
CP949
UnifiedHangul (UHC) — это расширенный набор Корейский EUC-KR (8-битная кодировка KS C 5601-1992 с его 2350 слогов хангыль и 4888 ханджа) с 8822 дополнительными предварительно составленные слоги хангыль в диапазоне C1.
CP950
Big5 (13072 традиционный zh_TW китайский ханзи) для тайваньский вместо EUC-TW (ЦНС 11643-1992).
Дополнительные сведения см. в CJK.INF Кена Лунде или в таблицах сопоставления Unicode. Вы найдете эти кодировки проиллюстрированными у Кена Лунде и бестселлеры Надин Кано, хотя последний написан с чистая перспектива Microsoft с небольшим упоминанием стандартов ISO.

Стандарты других поставщиков

Microsoft — не единственная компания, изобретающая собственные более или менее несовместимые стандарты, как вы можете видеть на ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/:

AdobeStandardEncoding

Страница Adobe PostScript язык описания называет свою собственную кодировку StandardEncoding и требует, чтобы вы сначала переключились на ISOLatin1Encoding, если хотите печатать тексты ISO-8859-1.


charset=Adobe-Standard-Encoding [ТЕКСТ] [БДФ]

МакРоман

Macintosh от Apple давно традиция многоязычной поддержки Apple собственные кодировки, из которых MacRoman был первым:


кодировка=макинтош [ТЕКСТ] [БДФ]

СЛЕДУЮЩИЙ ШАГ

NeXTSTEP имеет нечто подобное:


набор символов = следующий [ТЕКСТ] [БДФ]

HP-Roman8

Hewlett-Packard HPUX и hpterm есть их HP-Roman8:


кодировка=HP-Roman8 [ТЕКСТ] [БДФ]


Отправьте письмо на roman@czyborra. com, если вам нужны дополнительные шрифты или вы нашли ошибки как Андреас Прилоп, Кент Карлссон, Юнгшик Шин и Ян Томасек.

Роман Чиборра
$Дата: 27.06.1998 08:25:38 $

PostgreSQL: Документация: 14: 24.3. Поддержка набора символов

24.3.1. Поддерживаемые наборы символов
24.3.2. Установка набора символов
24.3.3. Автоматическое преобразование набора символов между сервером и клиентом
24.3.4. Доступные преобразования набора символов
24.3.5. Дальнейшее чтение

Поддержка набора символов в PostgreSQL позволяет хранить текст в различных наборах символов (также называемых кодировками), включая однобайтовые наборы символов, такие как серия ISO 8859, и многобайтовые наборы символов, такие как EUC (расширенный код Unix). ), UTF-8 и внутренний код Mule. Все поддерживаемые наборы символов могут использоваться клиентами прозрачно, но некоторые из них не поддерживаются для использования на сервере (то есть в качестве кодировки на стороне сервера). Набор символов по умолчанию выбирается при инициализации кластера базы данных PostgreSQL с использованием initdb . Его можно переопределить при создании базы данных, поэтому у вас может быть несколько баз данных, каждая из которых имеет свой набор символов.

Однако важным ограничением является то, что набор символов каждой базы данных должен быть совместим с настройками локали базы данных LC_CTYPE (классификация символов) и LC_COLLATE (порядок сортировки строк). Для локали C или POSIX разрешен любой набор символов, но для других локалей, предоставляемых libc, корректно работает только один набор символов. (Однако в Windows кодировку UTF-8 можно использовать с любой локалью.) Если у вас настроена поддержка ICU, локали, предоставленные ICU, можно использовать с большинством, но не со всеми кодировками на стороне сервера.

24.3.1. Поддерживаемые наборы символов

В таблице 24.1 показаны наборы символов, доступные для использования в PostgreSQL.

Таблица 24.1. Наборы символов PostgreSQL

символов
Имя Описание Язык Сервер? ОИТ? байт/ Псевдонимы
БОЛЬШОЙ5 Большая пятерка Традиционный китайский 1–2 ВИН950 , Виндовс950
EUC_CN Расширенный код UNIX-CN Упрощенный китайский Да Да 1–3  
EUC_JP Расширенный код UNIX-JP японский Да Да 1–3  
EUC_JIS_2004 Расширенный код UNIX-JP, JIS X 0213 904:00 японский Да 1–3  
EUC_KR Расширенный код UNIX-KR Корейский Да Да 1–3  
EUC_TW Расширенный код UNIX-TW Традиционный китайский, тайваньский Да Да 1–3  
ГБ18030 Национальный стандарт китайский 1–4  
ГБК Расширенный национальный стандарт Упрощенный китайский 1–2 ВИН936 , Виндовс936
ИСО_8859_5 ИСО 8859-5, ЕСМА 113 Латиница/кириллица Да Да 1  
ИСО_8859_6 ИСО 8859-6, ЕСМА 114 Латинский/арабский Да Да 1  
ИСО_8859_7 ИСО 8859-7, ЕСМА 118 Латинский/греческий 904:00 Да Да 1  
ИСО_8859_8 ИСО 8859-8, ЕСМА 121 Латинский/иврит Да Да 1  
ДЖОХАБ ЙОХАБ Корейский (хангыль) 1–3  
КОИ8Р КОИ8-Р Кириллица (русская) Да Да 1 КОИ8
КОИ8У КОИ8-У Кириллица (украинский) Да Да 1  
ЛАТИНА1 ИСО 8859-1, ЕСМА 94 Западноевропейская Да Да 1 ИСО88591
ЛАТИНСКИЙ2 ИСО 8859-2, ЕСМА 94 Центральноевропейский Да Да 1 ИСО88592
ЛАТИН3 ИСО 8859-3, ЕСМА 94 Южно-Европейский Да Да 1 ИСО88593
ЛАТИН4 ИСО 8859-4, ЕСМА 94 Североевропейский Да Да 1 ИСО88594
ЛАТИНСКИЙ5 ИСО 8859-9, ЕСМА 128 Турецкий 904:00 Да Да 1 ИСО88599
ЛАТИНСКИЙ6 ИСО 8859-10, ЕСМА 144 Северный Да Да 1 ИСО885910
ЛАТИНСКИЙ 7 ИСО 8859-13 Балтика Да Да 1 ИСО885913
ЛАТИНСКИЙ 8 ИСО 8859-14 Селтик Да Да 1 ИСО885914
ЛАТИНСКИЙ 9 ИСО 8859-15 LATIN1 с евро и акцентами Да Да 1 ИСО885915
ЛАТИНСКИЙ10 ИСО 8859-16, АСРО СР 14111 Румынский Да № 904:00 1 ИСО885916
MULE_INTERNAL Мул внутренний код Многоязычный Emacs Да 1–4  
СЖИС Сдвиг JIS японский 904:00 1–2 Мсканджи , ШифтДжИС , ВИН932 , Виндовс932
SHIFT_JIS_2004 Сдвиг JIS, JIS X 0213 японский 1–2  
SQL_ASCII не указано (см. текст) любой Да 1  
УВК Единый код хангыль Корейский 1–2 ВИН949 , Виндовс949
UTF8 Юникод, 8-битный все Да Да 1–4 Юникод
WIN866 Windows CP866 Кириллица Да Да 1 АЛЬТЕРНАТИВНЫЙ
WIN874 Windows CP874 тайский Да 1  
WIN1250 Windows CP1250 Центральноевропейский Да Да 1  
WIN1251 Windows CP1251 Кириллица Да Да 1 ВЫИГРЫШ
WIN1252 Windows CP1252 Западноевропейская Да Да 1  
WIN1253 Windows CP1253 Греческий Да Да 1  
WIN1254 Windows CP1254 Турецкий Да Да 1  
WIN1255 Windows CP1255 Иврит Да Да 1  
WIN1256 Windows CP1256 Арабский Да Да 1  
WIN1257 Windows CP1257 Балтика Да Да 1   904:00
WIN1258 Windows CP1258 вьетнамский Да Да 1 АБК , ТКВН , ТКВН5712 , ВСКИИ

Не все клиентские API поддерживают все перечисленные наборы символов. Например, драйвер JDBC PostgreSQL не поддерживает MULE_INTERNAL , LATIN6 , LATIN8 и LATIN10 .

Параметр SQL_ASCII ведет себя значительно иначе, чем другие параметры. Когда набор символов сервера равен SQL_ASCII , сервер интерпретирует байтовые значения 0–127 в соответствии со стандартом ASCII, а байтовые значения 128–255 воспринимаются как неинтерпретируемые символы. Преобразование кодировки не будет выполнено, если задано значение SQL_ASCII . Таким образом, эта установка является не столько декларацией того, что используется конкретная кодировка, сколько декларацией незнания кодировки. В большинстве случаев, если вы работаете с любыми данными, отличными от ASCII, неразумно использовать SQL_ASCII , потому что PostgreSQL не сможет помочь вам путем преобразования или проверки символов, отличных от ASCII.

24.3.2. Установка набора символов

initdb определяет набор символов по умолчанию (кодировку) для кластера PostgreSQL. Например,

initdb -E EUC_JP
 

задает набор символов по умолчанию EUC_JP (расширенный код Unix для японского языка). Вы можете использовать --encoding вместо -E , если вы предпочитаете более длинные строки параметров. Если нет -E или --encoding указана опция, initdb пытается определить подходящую кодировку для использования на основе указанной локали или локали по умолчанию.

Во время создания базы данных можно указать кодировку, отличную от используемой по умолчанию, при условии, что кодировка совместима с выбранной локалью:

createdb -E EUC_KR -T template0 --lc-collate=ko_KR.euckr --lc-ctype=ko_KR.euckr корейский
 

Это создаст базу данных с именем korean , которая использует набор символов EUC_KR и языковой стандарт ko_KR . Другой способ сделать это — использовать следующую команду SQL:

.
СОЗДАТЬ БАЗУ ДАННЫХ на корейском языке С КОДИРОВАНИЕМ 'EUC_KR' LC_COLLATE='ko_KR. euckr' LC_CTYPE='ko_KR.euckr' TEMPLATE=template0;
 

Обратите внимание, что приведенные выше команды задают копирование базы данных template0 . При копировании любой другой базы данных параметры кодировки и локали нельзя изменить по сравнению с исходной базой данных, поскольку это может привести к повреждению данных. Для получения дополнительной информации см. раздел 23.3.

Кодировка базы данных хранится в системном каталоге pg_database . Вы можете увидеть это, используя опцию psql -l или команду \l .

$   psql -l  
                                         Список баз данных
   Имя | Владелец | Кодирование | сортировка | Тип | Права доступа
-----------+----------+------------+-------------+- ---------------------------+-------------------------------------
 клокаледб | глиннака | SQL_ASCII | С | С |
 английский БД | глиннака | UTF8 | en_GB.UTF8 | en_GB.UTF8 |
 японский | глиннака | UTF8 | ja_JP. UTF8 | ja_JP.UTF8 |
 корейский | глиннака | ЕСК_КР | ko_KR.euckr | ko_KR.euckr |
 постгрес | глиннака | UTF8 | fi_FI.UTF8 | fi_FI.UTF8 |
 шаблон0 | глиннака | UTF8 | fi_FI.UTF8 | fi_FI.UTF8 | {=c/hlinnaka,hlinnaka=CTc/hlinnaka}
 шаблон1 | глиннака | UTF8 | fi_FI.UTF8 | fi_FI.UTF8 | {=c/hlinnaka,hlinnaka=CTc/hlinnaka}
(7 рядов)
 

Important

В большинстве современных операционных систем PostgreSQL может определить, какой набор символов подразумевается параметром LC_CTYPE , и обеспечит использование только соответствующей кодировки базы данных. В более старых системах вы несете ответственность за использование кодировки, ожидаемой выбранной вами локалью. Ошибка в этой области может привести к странному поведению операций, зависящих от языкового стандарта, таких как сортировка.

PostgreSQL позволит суперпользователям создавать базы данных с Кодировка SQL_ASCII , даже если LC_CTYPE не является C или POSIX . Как отмечалось выше, SQL_ASCII не требует, чтобы данные, хранящиеся в базе данных, имели какую-либо конкретную кодировку, и поэтому этот выбор создает риск неправильного поведения, зависящего от локали. Использование этой комбинации настроек устарело и может быть когда-нибудь вообще запрещено.

24.3.3. Автоматическое преобразование наборов символов между сервером и клиентом

PostgreSQL поддерживает автоматическое преобразование наборов символов между сервером и клиентом для многих комбинаций наборов символов (раздел 24.3.4 показывает, какие именно).

Чтобы включить автоматическое преобразование набора символов, вы должны указать PostgreSQL набор символов (кодировку), который вы хотите использовать в клиенте. Это можно сделать несколькими способами:

  • С помощью команды \encoding в psql. \encoding позволяет менять кодировку клиента на лету. Например, чтобы изменить кодировку на SJIS , введите:

    \кодирование SJIS
     
  • libpq (раздел 34. 11) имеет функции для управления кодировкой клиента.

  • Использование SET client_encoding TO . Задать кодировку клиента можно с помощью этой команды SQL:

    УСТАНОВИТЕ CLIENT_ENCODING TO '  значение  ';
     

    Также для этой цели можно использовать стандартный синтаксис SQL SET NAMES :

    УСТАНОВИТЬ ИМЕНА '  значение  ';
     

    Чтобы запросить текущую кодировку клиента:

    ПОКАЗАТЬ client_encoding;
     

    Чтобы вернуться к кодировке по умолчанию:

    СБРОС client_encoding;
     
  • Использование PGCLIENTENCODING . Если переменная среды PGCLIENTENCODING определена в среде клиента, эта клиентская кодировка выбирается автоматически при подключении к серверу. (Впоследствии это можно переопределить, используя любой из других методов, упомянутых выше. )

  • Использование переменной конфигурации client_encoding. Если установлена ​​переменная client_encoding , эта клиентская кодировка выбирается автоматически при подключении к серверу. (Впоследствии это можно переопределить любым из других методов, упомянутых выше.)

Если преобразование определенного символа невозможно — допустим, вы выбрали EUC_JP для сервера и LATIN1 для клиента, и возвращаются некоторые японские символы, не имеющие представления в LATIN1 — сообщается об ошибке.

Если набор символов клиента определен как SQL_ASCII , преобразование кодировки отключено, независимо от набора символов сервера. (Однако, если набор символов сервера отличается от SQL_ASCII , сервер все равно будет проверять, допустимы ли входящие данные для этой кодировки; таким образом, чистый эффект будет таким, как если бы набор символов клиента был таким же, как у сервера. ) Так же, как и для сервер, использование SQL_ASCII неразумно, если только вы не работаете с данными, полностью состоящими из ASCII.

24.3.4. Доступные преобразования наборов символов

PostgreSQL допускает преобразование между любыми двумя наборами символов, для которых функция преобразования указана в системном каталоге pg_conversion . PostgreSQL поставляется с некоторыми предопределенными преобразованиями, которые обобщены в таблице 24.2 и более подробно показаны в таблице 24.3. Вы можете создать новое преобразование с помощью команды SQL CREATE CONVERSION. (Чтобы использоваться для автоматического преобразования клиент/сервер, преобразование должно быть помечено как «по умолчанию» для его пары наборов символов.)

Таблица 24.2. Преобразование встроенного набора символов клиент/сервер

5555555
Набор символов сервера Доступные клиентские наборы символов
БОЛЬШОЙ5 не поддерживается в качестве серверной кодировки
EUC_CN EUC_CN , MULE_INTERNAL , УТФ8
EUC_JP EUC_JP , MULE_INTERNAL , SJIS , UTF8
EUC_JIS_2004 EUC_JIS_2004 , SHIFT_JIS_2004 , UTF8
EUC_KR EUC_KR , MULE_INTERNAL , УТФ8
EUC_TW EUC_TW , BIG5 , MULE_INTERNAL , UTF8
ГБ18030 не поддерживается в качестве серверной кодировки
ГБК не поддерживается в качестве серверной кодировки
ИСО_8859_5 ISO_8859_5 , KOI8R , MULE_INTERNAL , UTF8 , WIN866 , WIN1201
ИСО_8859_6 ИСО_8859_6 , УТФ8
ИСО_8859_7 ИСО_8859_7 , УТФ8
ИСО_8859_8 ИСО_8859_8 , УТФ8
ДЖОХАБ не поддерживается в качестве серверной кодировки
КОИ8Р КОИ8Р , ИСО_8859_5 , МУЛЕ_ИНТЕРНАЛ , УТФ8 , ВИН866 , ВИН1201
КОИ8У КОИ8У , УТФ8
ЛАТИНА1 LATIN1 , MULE_INTERNAL , UTF8
ЛАТИНА2 LATIN2 , MULE_INTERNAL , UTF8 , WIN1250
ЛАТИН3 LATIN3 , MULE_INTERNAL , UTF8
ЛАТИН4 LATIN4 , MULE_INTERNAL , UTF8
ЛАТИНСКИЙ5 ЛАТИН5 , УТФ8
ЛАТИНСКИЙ6 ЛАТИН6 , UTF8
ЛАТИНСКИЙ 7 ЛАТИН7 , УТФ8
ЛАТИНСКИЙ 8 ЛАТИН8 , УТФ8
ЛАТИНСКИЙ 9 ЛАТИН9 , УТФ8
ЛАТИНСКИЙ10 LATIN10 , UTF8
MULE_INTERNAL MULE_INTERNAL , BIG5 , EUC_CN , EUC_JP , EUC_KR , EUC_TW , ISO_8859_5 , KOI8R , LATIN1 to LATIN4 , SJIS , WIN866 , ВИН1250 , ВИН1251
СЖИС не поддерживается в качестве серверной кодировки
SHIFT_JIS_2004 не поддерживается в качестве серверной кодировки
SQL_ASCII любой (преобразование производиться не будет)
УВК не поддерживается в качестве серверной кодировки
UTF8 все поддерживаемые кодировки
WIN866 ВИН866 , ИСО_8859_5 , КОИ8Р , МУЛЕ_ИНТЕРНАЛ , УТФ8 , ВИН1201
WIN874 ВИН874 , УТФ8
WIN1250 WIN1250 , LATIN2 , MULE_INTERNAL , UTF8
WIN1251 ВИН1251 , ИСО_8859_5 , КОИ8Р , МУЛЕ_ИНТЕРНАЛ , УТФ8 , ВИН866

5

WIN1252 ВИН1252 , UTF8
WIN1253 ВИН1253 , УТФ8
WIN1254 ВИН1254 , УТФ8
WIN1255 ВИН1255 , УТФ8
WIN1256 ВИН1256 , УТФ8
WIN1257 ВИН1257 , УТФ8
WIN1258 ВИН1258 , УТФ8

Таблица 24. 3. Преобразования всех встроенных наборов символов

Имя преобразования [а] Исходное кодирование Кодировка назначения
big5_to_euc_tw БОЛЬШОЙ5 EUC_TW
big5_to_mic БОЛЬШОЙ5 МУЛЕ_ВНУТРЕННИЙ
big5_to_utf8 БОЛЬШОЙ5 UTF8
euc_cn_to_mic EUC_CN МУЛЕ_ВНУТРЕННИЙ
euc_cn_to_utf8 EUC_CN UTF8
euc_jp_to_mic 904:00 EUC_JP МУЛЕ_ВНУТРЕННИЙ
euc_jp_to_sjis EUC_JP СЖИС
euc_jp_to_utf8 EUC_JP UTF8
euc_kr_to_mic 904:00 EUC_KR МУЛЕ_ВНУТРЕННИЙ
euc_kr_to_utf8 EUC_KR UTF8
euc_tw_to_big5 EUC_TW БОЛЬШОЙ5
euc_tw_to_mic 904:00 EUC_TW МУЛЕ_ВНУТРЕННИЙ
euc_tw_to_utf8 EUC_TW UTF8
gb18030_to_utf8 ГБ18030 UTF8
gbk_to_utf8 904:00 ГБК UTF8
iso_8859_10_to_utf8 ЛАТИНСКИЙ6 UTF8
iso_8859_13_to_utf8 ЛАТИНСКИЙ 7 UTF8
iso_8859_14_to_utf8 904:00 ЛАТИНСКИЙ 8 UTF8
iso_8859_15_to_utf8 ЛАТИНСКИЙ9 UTF8
iso_8859_16_to_utf8 ЛАТИНСКИЙ10 UTF8
iso_8859_1_to_mic ЛАТИНСКИЙ1 МУЛЕ_ВНУТРЕННИЙ
iso_8859_1_to_utf8 ЛАТИНСКИЙ1 UTF8
iso_8859_2_to_mic ЛАТИНСКИЙ2 МУЛЕ_ВНУТРЕННИЙ
изо_8859_2_to_utf8 ЛАТИНСКИЙ2 UTF8
iso_8859_2_to_windows_1250 ЛАТИНСКИЙ2 WIN1250
iso_8859_3_to_mic ЛАТИНСКИЙ3 МУЛЕ_ВНУТРЕННИЙ
iso_8859_3_to_utf8 ЛАТИНСКИЙ3 UTF8
iso_8859_4_to_mic ЛАТИНСКИЙ4 МУЛЕ_ВНУТРЕННИЙ
iso_8859_4_to_utf8 ЛАТИНСКИЙ4 UTF8
iso_8859_5_to_koi8_r ИСО_8859_5 КОИ8Р
iso_8859_5_to_mic ИСО_8859_5 МУЛЕ_ВНУТРЕННИЙ
iso_8859_5_to_utf8 ИСО_8859_5 UTF8
iso_8859_5_to_windows_1251 ИСО_8859_5 WIN1251
iso_8859_5_to_windows_866 ИСО_8859_5 WIN866
iso_8859_6_to_utf8 ИСО_8859_6 UTF8
iso_8859_7_to_utf8 ИСО_8859_7 UTF8
iso_8859_8_to_utf8 ИСО_8859_8 UTF8
iso_8859_9_to_utf8 ЛАТИНСКИЙ5 UTF8
johab_to_utf8 ЙОХАБ UTF8
koi8_r_to_iso_8859_5 КОИ8Р ИСО_8859_5
кои8_р_то_мик КОИ8Р МУЛЕ_ВНУТРЕННИЙ
koi8_r_to_utf8 КОИ8Р UTF8
koi8_r_to_windows_1251 КОИ8Р WIN1251
koi8_r_to_windows_866 КОИ8Р WIN866
koi8_u_to_utf8 КОИ8У UTF8
mic_to_big5 МУЛЕ_ВНУТРЕННИЙ БОЛЬШОЙ5
mic_to_euc_cn МУЛЕ_ВНУТРЕННИЙ EUC_CN
mic_to_euc_jp МУЛЕ_ВНУТРЕННИЙ EUC_JP
mic_to_euc_kr МУЛЕ_ВНУТРЕННИЙ EUC_KR
mic_to_euc_tw МУЛЕ_ВНУТРЕННИЙ EUC_TW
mic_to_iso_8859_1 МУЛЕ_ВНУТРЕННИЙ ЛАТИНСКИЙ1
mic_to_iso_8859_2 МУЛЕ_ВНУТРЕННИЙ ЛАТИНСКИЙ2
mic_to_iso_8859_3 МУЛЕ_ВНУТРЕННИЙ ЛАТИНСКИЙ3
mic_to_iso_8859_4 МУЛЕ_ВНУТРЕННИЙ ЛАТИНСКИЙ4
mic_to_iso_8859_5 МУЛЕ_ВНУТРЕННИЙ ИСО_8859_5
mic_to_koi8_r МУЛЕ_ВНУТРЕННИЙ КОИ8Р
mic_to_sjis МУЛЕ_ВНУТРЕННИЙ СЖИС
mic_to_windows_1250 МУЛЕ_ВНУТРЕННИЙ WIN1250
mic_to_windows_1251 904:00 МУЛЕ_ВНУТРЕННИЙ WIN1251
mic_to_windows_866 МУЛЕ_ВНУТРЕННИЙ WIN866
sjis_to_euc_jp СЖИС EUC_JP
sjis_to_mic СЖИС МУЛЕ_ВНУТРЕННИЙ
sjis_to_utf8 СЖИС UTF8
windows_1258_to_utf8 WIN1258 UTF8
uhc_to_utf8 УВК UTF8
utf8_to_big5 UTF8 БОЛЬШОЙ5
utf8_to_euc_cn UTF8 EUC_CN
utf8_to_euc_jp UTF8 EUC_JP
utf8_to_euc_kr UTF8 EUC_KR
utf8_to_euc_tw UTF8 EUC_TW
utf8_to_gb18030 UTF8 ГБ18030
utf8_to_gbk UTF8 ГБК
utf8_to_iso_8859_1 UTF8 ЛАТИНСКИЙ1
utf8_to_iso_8859_10 UTF8 ЛАТИНСКИЙ6
utf8_to_iso_8859_13 UTF8 ЛАТИНСКИЙ 7
utf8_to_iso_8859_14 UTF8 ЛАТИНСКИЙ 8
utf8_to_iso_8859_15 UTF8 ЛАТИНСКИЙ9
utf8_to_iso_8859_16 UTF8 ЛАТИНСКИЙ10
utf8_to_iso_8859_2 UTF8 ЛАТИНСКИЙ2
utf8_to_iso_8859_3 UTF8 ЛАТИНСКИЙ3
utf8_to_iso_8859_4 UTF8 ЛАТИНСКИЙ4
utf8_to_iso_8859_5 UTF8 ИСО_8859_5
utf8_to_iso_8859_6 UTF8 ИСО_8859_6
utf8_to_iso_8859_7 UTF8 ИСО_8859_7
utf8_to_iso_8859_8 UTF8 ИСО_8859_8
utf8_to_iso_8859_9 UTF8 ЛАТИНСКИЙ5
utf8_to_johab UTF8 ЙОХАБ
утф8_то_кои8_р UTF8 КОИ8Р
утф8_то_кои8_у UTF8 КОИ8У
utf8_to_sjis UTF8 СЖИС
utf8_to_windows_1258 UTF8 WIN1258
utf8_to_uhc UTF8 904:00 УВК
utf8_to_windows_1250 UTF8 WIN1250
utf8_to_windows_1251 UTF8 WIN1251
utf8_to_windows_1252 UTF8 WIN1252
utf8_to_windows_1253 UTF8 WIN1253
utf8_to_windows_1254 UTF8 WIN1254
utf8_to_windows_1255 UTF8 WIN1255
utf8_to_windows_1256 UTF8 WIN1256
utf8_to_windows_1257 UTF8 WIN1257
utf8_to_windows_866 UTF8 WIN866
utf8_to_windows_874 UTF8 WIN874
windows_1250_to_iso_8859_2 WIN1250 ЛАТИНСКИЙ2
windows_1250_to_mic WIN1250 МУЛЕ_ВНУТРЕННИЙ
windows_1250_to_utf8 WIN1250 UTF8
windows_1251_to_iso_8859_5 WIN1251 ИСО_8859_5
windows_1251_to_koi8_r WIN1251 КОИ8Р
windows_1251_to_mic WIN1251 МУЛЕ_ВНУТРЕННИЙ
windows_1251_to_utf8 WIN1251 UTF8
windows_1251_to_windows_866 WIN1251 WIN866
windows_1252_to_utf8 WIN1252 UTF8
windows_1256_to_utf8 WIN1256 UTF8
windows_866_to_iso_8859_5 WIN866 ИСО_8859_5
windows_866_to_koi8_r WIN866 КОИ8Р
windows_866_to_mic WIN866 МУЛЕ_ВНУТРЕННИЙ
windows_866_to_utf8 WIN866 UTF8
windows_866_to_windows_1251 WIN866 ВЫИГРЫШ
windows_874_to_utf8 WIN874 UTF8
euc_jis_2004_to_utf8 EUC_JIS_2004 UTF8
utf8_to_euc_jis_2004 UTF8 EUC_JIS_2004
shift_jis_2004_to_utf8 SHIFT_JIS_2004 UTF8
utf8_to_shift_jis_2004 UTF8 SHIFT_JIS_2004
euc_jis_2004_to_shift_jis_2004 EUC_JIS_2004 SHIFT_JIS_2004
shift_jis_2004_to_euc_jis_2004 SHIFT_JIS_2004 EUC_JIS_2004

[a] Имена преобразования следуют стандартной схеме именования: официальное имя исходной кодировки, в котором все небуквенно-цифровые символы заменены символами подчеркивания, за которыми следует _to_ , за которым следует аналогично обработанное имя кодировки назначения. Поэтому эти имена иногда отличаются от обычных имен кодировок, показанных в таблице 24.1.


24.3.5. Дополнительная литература

Это хорошие источники для начала изучения различных систем кодирования.

CJKV Обработка информации: китайские, японские, корейские и вьетнамские вычисления

Содержит подробные объяснения EUC_JP , EUC_CN , EUC_KR , EUC_TW .

https://www.unicode.org/

Веб-сайт Консорциума Unicode.

RFC 3629
Здесь определяется

UTF-8 (8-битный формат преобразования UCS/Unicode).

Коды символов Windows 1251. Кодировка ASCII (американский стандартный код для обмена информацией)

Главная / Яндекс.Диск / Коды символов Windows 1251. Кодировка ASCII (американский стандартный код для обмена информацией) - базовая кодировка текста для латинского алфавита

28.06.2021 Яндекс.Диск

Как известно, компьютер хранит информацию в двоичном виде, представляя ее в виде последовательности нулей и единиц. Для перевода информации в форму, удобную для восприятия человеком, каждая уникальная последовательность цифр при отображении заменяется соответствующим символом.

Одной из систем соотнесения двоичных кодов с печатными и управляющими символами является

При современном уровне развития компьютерных технологий от пользователя не требуется знать код каждого конкретного символа. Однако общее представление о том, как осуществляется кодирование, крайне полезно, а для некоторых категорий специалистов даже необходимо.

Создание ASCII

В своем первоначальном виде кодировка была разработана в 1963 году и затем дважды обновлялась в течение 25 лет.

В исходной версии таблица символов ASCII включала 128 символов, позже появилась расширенная версия, где были сохранены первые 128 символов, а отсутствующие ранее символы были присвоены кодам с задействованием восьмого бита.

На протяжении многих лет эта кодировка была самой популярной в мире. В 2006 году лидирующее место заняла латиница 1252, а с конца 2007 года и по настоящее время Unicode прочно удерживает лидирующие позиции.

Компьютерное представление ASCII

Каждый символ ASCII имеет собственный код из 8 символов, представляющих ноль или единицу. Минимальное число в этом представлении — ноль (восемь нулей в двоичной системе), что является кодом первого элемента в таблице.

Два кода в таблице зарезервированы для переключения между стандартным US-ASCII и его национальной версией.

После того, как ASCII стал включать не 128, а 256 символов, распространение получил вариант кодировки, при котором исходный вариант таблицы сохранялся в первых 128 кодах с нулевым 8-м битом. Знаки национальной письменности сохранились в верхней половине таблицы (позиции 128-255).

Пользователю не обязательно знать коды символов ASCII напрямую. Для девелоперского ПО обычно достаточно знать номер элемента в таблице, чтобы при необходимости вычислить его код в двоичной системе.

Русский язык

После разработки кодировок для скандинавских языков, китайского, корейского, греческого и т.д. в начале 70-х, в СССР тоже начал создавать свою версию. Вскоре была разработана версия 8-битной кодировки под названием KOI8, которая сохраняет первые 128 кодов символов ASCII и выделяет такое же количество позиций для букв национального алфавита и дополнительных символов.

До введения Unicode KOI8 доминировал в русскоязычном сегменте Интернета. Были варианты кодировки как для русского, так и для украинского алфавита.

Проблемы с ASCII

Так как количество элементов даже в расширенной таблице не превышало 256, не было возможности разместить несколько разных шрифтов в одной кодировке. В 90-е годы в Рунете появилась проблема «крокозябров», когда тексты, набранные русскими символами ASCII, отображались некорректно.

Проблема заключалась в том, что коды различных вариантов ASCII не совпадали друг с другом. Напомним, что позиции 128-255 могли содержать разные символы, и при смене одной кириллической кодировки на другую все буквы текста заменялись на другие, имеющие идентичный номер в другой версии кодировки.

Текущее состояние

С появлением Unicode популярность ASCII резко упала.

Причина этого кроется в том, что новая кодировка позволила вместить знаки почти всех письменных языков. В этом случае первые 128 символов ASCII соответствуют тем же символам в Unicode.

В 2000 году ASCII была самой популярной кодировкой в ​​Интернете и использовалась на 60% веб-страниц, проиндексированных Google. К 2012 году доля таких страниц упала до 17%, а место самой популярной кодировки занял Юникод (UTF-8). 9→

  • o BS / → ø
  • c БС, → ç
  • н БС ~ → с
  • Примечание : в старых шрифтах апостроф "рисовался с наклоном влево, а тильда ~ смещалась вверх, чтобы они как раз подходили на роль акут и тильда сверху.

    Если тот же символ накладывается на символ, то получается эффект жирного шрифта, а если на символ накладывается подчеркивание, то получается подчеркнутый текст.` { | } ~ ... Кроме этого вместо # можно разместить £ , а вместо $ - ¤ ... Эта система хорошо подходит для европейских языков, где требуется всего несколько дополнительных символов. Версия ASCII без национальных символов называется US-ASCII или «Международная справочная версия».

    Впоследствии оказалось удобнее использовать 8-битные кодировки (кодовые страницы), где нижняя половина кодовой таблицы (0-127) занята символами US-ASCII, а верхняя половина (128- 255) занимают дополнительные символы, в том числе набор национальных символов. Таким образом, верхняя половина таблицы ASCII до широкого внедрения Unicode активно использовалась для представления локализованных символов, букв местного языка. Отсутствие единого стандарта размещения символов кириллицы в таблице ASCII вызывало множество проблем с кодировками (КОИ-8, Windows-1251 и др. ). Другие языки с нелатинской письменностью также страдали от наличия нескольких разных кодировок.

    сомов
    .0 .1 .2 .3 .4 .5 .6 .7 .8 .9
    0. НУЛ ЭОА ЕОМ ЭКВТ ВРУ РУ ЗВОНОК БКСП 904:00 НТ ЛФ ВТ ФФ КР СО СИ
    1. DC 0 DC 1 DC 2 DC 3 DC 4 ОШИБКА СИНХРОНИЗАЦИЯ ЛЕМ С 0 С 1 С 2 С 3 С 4 С 5 С 6 С 7
    2.
    3. 904:00
    4. ПУСТОЙ ! " # $ % & " ( ) * + , - . /
    5. 0 1 2 3 4 5 6 7 8 9 : ; = > ?
    6.
    7.
    8.
    9.
    А. @ А Б С Д Е Ф Г Х я Дж К л М Н О
    Б. Р В Р С Т У В Вт х Д З [ \ ]
    С.
    Д.
    Э. и б с д и ф г ч и и к л м н или
    Ф. р к р с т и против ш х г из ЭСК ДЕЛ

    На тех компьютерах, где минимальной адресуемой единицей памяти было 36-битное слово, изначально использовались 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах стали размещать в одном слове либо 5 семибитных символов (1 бит оставался лишним), либо 4 девятибитных символа.

    Коды ASCII также используются для идентификации нажатой клавиши во время программирования. Для стандартной QWERTY-клавиатуры кодовая таблица выглядит так:

    904:00

    Набор символов, которыми записывается текст, называется алфавитом .

    Количество символов в алфавите его сила .

    Формула определения количества информации: N = 2 b ,

    где N - мощность алфавита (количество символов),

    b - количество бит (информационный вес символа).

    256-символьный алфавит может вместить почти все необходимые вам символы. Этот алфавит называется достаточным.

    Поскольку 256 = 2 8, вес 1 символа равен 8 битам.

    8-битный блок был назван 1 байт:

    1 байт = 8 бит.

    Двоичный код каждого символа компьютерного текста занимает 1 байт памяти.

    Как текстовая информация представлена ​​в памяти компьютера?

    Удобство байтового кодирования символов очевидно, так как байт является наименьшей адресуемой частью памяти и, следовательно, процессор может обращаться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов вполне достаточно для представления большого разнообразия символьной информации.

    Теперь возникает вопрос, какой восьмибитный двоичный код присвоить каждому символу.

    Понятно, что это дело условное, способов кодирования можно придумать много.

    Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждое число соответствует восьмизначному двоичному коду от 00000000 до 11111111. Этот код представляет собой просто порядковый номер символа в двоичной системе.

    Таблица, в которой всем символам компьютерного алфавита присвоены порядковые номера, называется таблицей кодирования.

    Для разных типов компьютеров используются разные таблицы кодирования.

    Международным стандартом для ПК стала таблица ASCII (читается asci) (американский стандартный код для обмена информацией).

    Таблица ASCII разделена на две части.

    Международный стандарт - это только первая половина таблицы, т.е. символы с цифрами от 0 (00000000), до 127 (01111111).

    Структура таблицы кодирования ASCII

    Серийный номер

    Код

    Символ

    0 - 31

    00000000 - 00011111

    Символы с номерами от 0 до 31 обычно называются управляющими символами.
    Их функция заключается в управлении процессом вывода текста на экран или печати, подачи звукового сигнала, маркировки текста и т. д.

    32 - 127

    00100000 - 01111111

    Стандартная часть стола (англ.). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
    Символ 32 — это пробел, т.е. пустая позиция в тексте.
    Все остальные отражаются в определенных знаках.

    128 - 255

    10000000 - 11111111

    904:00

    Альтернативная часть таблицы (рус.).
    Вторая половина таблицы кодов ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и заканчивая 11111111), может иметь разные варианты, каждый вариант имеет свой номер.
    Кодовая страница в основном используется для размещения национальных алфавитов, отличных от латиницы. В русских национальных кодировках эта часть таблицы содержит символы русского алфавита.

    Первая половина таблицы ASCII


    Обращаю внимание, что в таблице кодировки буквы (прописные и строчные) расположены в алфавитном порядке, а цифры в порядке возрастания значений. Это соблюдение лексикографического порядка в расположении знаков называется принципом последовательного кодирования алфавита.

    Для букв русского алфавита также соблюдается принцип последовательного кодирования.

    Вторая половина таблицы ASCII


    К сожалению, в настоящее время существует пять различных кодировок кириллицы (KOI8-R, Windows, MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, с одной программной системы на другую.

    Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка использовалась еще в 70-х годах на ЭВМ серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях. операционная система UNIX.

    С начала 90-х, времени господства операционной системы MS DOS, сохраняется кодировка CP866 ("CP" расшифровывается как "Code Page").

    Компьютеры Apple под управлением Mac OS используют собственную кодировку Mac.

    Кроме того, Международная организация по стандартизации (ISO) утвердила в качестве стандарта для русского языка другую кодировку под названием ISO 8859-5.

    В настоящее время наиболее распространенной является кодировка Microsoft Windows, сокращенно обозначаемая как CP1251.

    С конца 90s проблема стандартизации кодировки символов была решена введением нового международного стандарта под названием Unicode . Это 16-битная кодировка т. е. она выделяет 2 байта памяти для каждого символа. Конечно, это удваивает объем используемой памяти. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и других символов.

    Давайте попробуем использовать таблицу ASCII, чтобы представить, как слова будут выглядеть в памяти компьютера.

    Внутреннее представление слов в памяти компьютера

    Иногда бывает, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, не читается - на экране монитора видна какая-то "тарабарщина". Это связано с тем, что в компьютерах используется разная кодировка символов русского языка.

    Unicode (англ. Unicode) — стандарт кодировки символов. Проще говоря, это таблица соответствия текстовых символов (, букв, элементов пунктуации) двоичным кодам. Компьютер понимает только последовательность нулей и единиц. Для того чтобы он знал, что именно он должен отображать на экране, необходимо присвоить каждому символу уникальный номер. В восьмидесятых годах символы кодировались одним байтом, то есть восемью битами (каждый бит равен 0 или 1). Таким образом, оказалось, что одна таблица (она же кодировка или набор) может содержать только 256 символов. Этого может быть недостаточно даже для одного языка. Поэтому появилось множество различных кодировок, путаница с которыми часто приводила к тому, что вместо читаемого текста на экране появлялись какие-то странные кракозябры. Требовался единый стандарт, которым стал Unicode. Наиболее часто используемой кодировкой является UTF-8 (формат преобразования Unicode), в которой для отображения символа используется от 1 до 4 байтов.

    Символы

    Символы в таблицах Unicode нумеруются шестнадцатеричными числами. Например, кириллическая заглавная буква М обозначается U+041C. Это значит, что он стоит на пересечении строки 041 и столбца С. Его можно просто скопировать и потом куда-нибудь вставить. Чтобы не рыться в многокилометровом списке, стоит воспользоваться поиском. Зайдя на страницу символа, вы увидите его номер в Юникоде и то, как он прорисован разными шрифтами. Можно и сам знак вбить в строку поиска, пусть вместо него нарисован квадрат, хотя бы для того, чтобы узнать, что это было. Также на этом сайте есть специальные (причем - случайные) наборы однотипных иконок, собранные из разных разделов, для удобства использования.

    Стандарт Unicode является международным. Он включает в себя знаки практически всех письменностей мира. В том числе и те, которые больше не используются. Египетские иероглифы, германские руны, письменность майя, клинопись и алфавиты древних государств. Представлены и обозначения мер и весов, нотная запись, математические понятия.

    Сам Консорциум Unicode не изобретает новые символы. В таблицы добавляются те значки, которые находят свое применение в обществе. Например, знак рубля активно использовался в течение шести лет, прежде чем был добавлен в Юникод. Пиктограммы эмодзи (смайлики) также впервые широко использовались в Японии и до того, как их включили в кодировку. Но товарные знаки и логотипы компаний не добавляются в принципе. Даже такое обычное, как яблоко Apple или флаг Windows. На сегодняшний день в версии 8.0 закодировано около 120 тысяч символов.

    Excel для Office 365 Word для Office 365 Outlook для Office 365 PowerPoint для Office 365 Publisher для Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio стандартный 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio профессиональный 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 2007 Visio стандартный 2010 Меньше

    В этой статье

    Вставка символа ASCII или Юникода в документ

    Если вам нужно ввести только несколько специальных символов или символов, вы можете использовать любые сочетания клавиш. Список символов ASCII см. в следующих таблицах или в статье Вставка национальных алфавитов с помощью сочетаний клавиш.

    Примечания:

    Вставка символов ASCII

    Чтобы вставить символ ASCII, нажмите и удерживайте клавишу ALT при вводе кода символа. Например, чтобы вставить символ градуса (º), нажмите и удерживайте клавишу Alt, затем введите 0176 на цифровой клавиатуре.

    Используйте цифровую клавиатуру для ввода цифр вместо цифр на основной клавиатуре. Если вам нужно ввести цифры на цифровой клавиатуре, убедитесь, что горит индикатор NUM LOCK.

    Вставка символов Unicode

    Чтобы вставить символ Unicode, введите код символа, затем последовательно нажмите клавиши ALT и X. Например, чтобы вставить знак доллара ($), введите 0024 и последовательно нажмите клавиши ALT и X. Все коды символов Unicode см.

    Важно: Некоторые программы Microsoft Office, такие как PowerPoint и InfoPath, не поддерживают преобразование кодов Unicode в символы. Если вам нужно вставить символ Unicode в одну из этих программ, используйте.

    Примечания:

      Если вы видите неверный символ Unicode после нажатия ALT + X, выберите правильный код, а затем снова нажмите ALT + X.

      Кроме того, перед кодом необходимо ввести «U+». Например, если ввести «1U + B5» и нажать Alt + X, отобразится текст «1µ», а если ввести «1B5» и нажать Alt + X, отобразится символ «Ƶ».

    Использование таблицы символов

    Карта символов — это программа, встроенная в Microsoft Windows, которая позволяет просматривать символы, доступные для выбранного шрифта.

    Используя таблицу символов, вы можете копировать отдельные символы или группу символов в буфер обмена и вставлять их в любую программу, которая может отображать эти символы. Открытие таблицы символов

      В Windows 10 Введите слово «символ» в поле поиска на панели задач и выберите таблицу символов из результатов поиска.

      В Windows 8 Введите слово «персонаж» на главном экране и выберите таблицу символов из результатов поиска.

      В Windows 7 нажать кнопку Пуск , последовательно выбрать Все программы , Стандарт , Сервис и нажать Таблица символов .

    Символы сгруппированы по шрифту. Нажмите на список шрифтов, чтобы выбрать соответствующий набор символов. Чтобы выбрать символ, нажмите его, затем нажмите Выберите ... Чтобы вставить символ, щелкните правой кнопкой мыши нужное место в документе и выберите Вставить .

    Часто используемые коды символов

    Полный список символов см. на компьютере, в таблице кодов символов ASCII или в таблицах наборов символов Unicode.

    Глиф

    Глиф

    Денежные единицы

    Юридические символы

    Математические символы

    Дроби

    Пунктуационные и диалектные символы

    904:00

    Символы формы

    Часто используемые коды диакритических знаков

    Полный список глифов и соответствующих кодов см.

    Глиф

    Глиф

    Непечатаемые управляющие символы ASCII

    Символы, используемые для управления некоторыми периферийными устройствами, такими как принтеры, пронумерованы от 0 до 31 в таблице ASCII. Например, символ подачи/новой страницы имеет номер 12. Этот символ указывает принтеру перейти к началу следующей страницы.

    Таблица непечатаемых управляющих символов ASCII

    Десятичный

    Знак

    Десятичный

    Знак

    Освобождение канала данных

    Начало товарной позиции

    Код управления первым устройством

    Начало текста

    Код управления вторым устройством

    Конец текста

    Код управления третьим устройством

    Конец передачи

    Код управления четвертым устройством

    пятиконечная

    Отрицательное подтверждение

    Подтверждение

    Синхронный режим передачи

    Звуковой сигнал

    Конец блока передаваемых данных

    Горизонтальная вкладка

    Конец носителя

    Перевод строки/новая строка

    Символ замены

    Вертикальная вкладка

    превышает

    Перевод страницы / новая страница

    Двенадцатый

    Разделитель файлов

    Возврат каретки

    Разделитель групп

    Сдвиг без сохранения цифр

    Разделитель записей

    Сдвиг с сохранением цифр

    пятнадцать

    Разделитель данных

    2016-05-11

    Назад Почему Вконтакте не играет музыка на Android?

    Следующая ошибка E_FAIL (0x80004005) при запуске виртуальной машины VirtualBox Почему виртуальная коробка выдает ошибку

    HTML Справочник по Windows-1252

    ❮ Предыдущий Далее ❯


    Windows-1252

    Windows-1252 был первым набором символов по умолчанию в Microsoft Windows.

    Это был самый популярный набор символов в Windows с 1985 по 1990 год.


    ANSI

    Исторически термин «кодовые страницы ANSI» использовался в Windows для обозначения наборов символов, отличных от DOS.

    Намерение состояло в том, чтобы эти наборы символов соответствовали стандартам ANSI, таким как ISO-8859.-1.

    Несмотря на то, что Windows-1252 почти идентична ISO-8859-1, она никогда не была стандартом ANSI. или стандарт ISO.


    Windows-1252 и ASCII

    Первая часть Windows-1252 (номера объектов от 0 до 127) является исходным ASCII набор символов. Он содержит цифры, прописные и строчные английские буквы и некоторые специальные символы.

    Для более подробного ознакомления, пожалуйста, изучите наш Полный Ссылка ASCII.


    Набор символов Windows-1252

    7 # 30394 1
    Символ Номер Имя объекта Описание
      0 - 31   Control characters (see below)
      32   space
    ! 33   восклицательный знак
    " 34 " кавычки 35   number sign
    $ 36   dollar sign
    % 37   percent sign
    & 38 & ; Ampersand
    ' 39 Apostrophe
    ( 40
    0
    (8. 0400
    ) 41   right parenthesis
    * 42   asterisk
    + 43   plus sign
    , 44   запятая
    - 45   дефис-минус
    . 46   точка
    / 47   solidus
    0 48   digit zero
    1 49   digit one
    2 50   digit two
    3 51   digit three
    4 52   digit four
    5 53   digit five
    6 54   digit six
    7 55   digit seven
    8 56   digit eight
    9 57   digit nine
    : 58   colon
    ; 59   точка с запятой
    < 60 < знак "меньше"
    = 61   знак равенства
    > 0 0; знак больше
    ? 63   знак вопроса
    @ 64   commercial at
    A 65   Latin capital letter A
    B 66   Latin capital letter B
    C 67   Latin capital буква C
    D 68   заглавная латинская буква D
    E 69 заглавная 9 E
     0400
    F 70   Latin capital letter F
    G 71   Latin capital letter G
    H 72   Latin capital letter H
    I 73   Латинская заглавная буква I
    J 74   90 9030 Латинская заглавная буква0397 K 75   Latin capital letter K
    L 76   Latin capital letter L
    M 77   Latin capital letter M
    N 78   Latin capital letter N
    O 79   Latin capital letter O
    P 80   Latin capital letter P
    Q 81   Latin capital letter Q
    R 82   Latin capital letter R
    S 83 Заглавная латинская буква S
    T 84   Заглавная латинская буква T
    U 9 9 0397 0 850397 Latin capital letter U
    V 86   Latin capital letter V
    W 87   Latin capital letter W
    X 88   Latin заглавная X
    Y 89   латинская заглавная буква Y
    Z 90
     
    94   circumflex accent
    _ 95   low line
    ` 96   grave accent
    a 97   Latin строчная a
    b 98   строчная латинская b
    c 99
     0400
    d 100   Latin small letter d
    e 101   Latin small letter e
    f 102   Latin small letter f
    g 103   Latin small letter g
    h 104   Latin small letter h
    i 105   Latin small letter i
    j 106   Latin small letter j
    k 107   Latin small letter k
    l 108   Latin small letter l
    m 109   Latin small letter m
    n 110   Latin small letter n
    o 111   Latin small letter o
    p 112   Latin small letter p
    q 113   Латинская маленькая буква Q
    R 114 Латинская маленькая буква R
    S 115 S 115 S 115 SMAL0400
    t 116   Latin small letter t
    u 117   Latin small letter u
    v 118   Latin small letter v
    w 119   Latin small letter w
    x 120   Latin small letter x
    y 121   Latin small letter y
    z 122   Latin small letter z
    { 123   left curly bracket
    | 124   vertical line
    } 125   right curly bracket
    ~ 126   тильда
      127   Управляющий символ (см. ниже)
    128 904; Знак евро
      129   НЕ ИСПОЛЬЗУЕТСЯ
    одинарная нижняя девятка
    ƒ 131 ƒ Строчная латинская буква f с крючком
    132 двойная нижняя девятка
    133 горизонтальный многоточие
    134 Кинжал
    135 &Кинжал; двойной кинжал
    ˆ 136 ˆ буква-модификатор с циркумфлексным акцентом
    137 Знак промилле
    Š 138 Š Заглавная латинская буква S с кароном
    139 одинарная левая кавычка
    Œ 140 Œ Латинская заглавная лигатура OE
      141   НЕ ИСПОЛЬЗУЕТСЯ
    Ž 142 Ž Latin capital letter Z with caron
      143   NOT USED
      144   NOT USED
    145 левая одинарная кавычка
    146 правая одинарная кавычка
    " 147 левая двойная кавычка
    148 правая двойная кавычка
    149 пуля
    150 в тире
    151 длинное тире
    ˜ 152 ˜ маленькая тильда
    153 товарный знак
    š 154 š Строчная латинская буква s с двоеточием
    155 одинарная правая кавычка
    156 œ Малая латинская лигатура oe
      157   НЕ ИСПОЛЬЗУЕТСЯ
    ž 158 ž Строчная латинская буква z с кароном
    Ÿ 159 Ÿ Латинская заглавная буква Y с диэрезисом
      160   неразрывный пробел
    ¡ 161 ¡ перевернутый восклицательный знак
    ¢ 162 ¢ знак цента
    £ 163 фунт; Знак фунта
    ¤ 164 ¤ знак валюты
    ¥ 165 ¥ знак иены
    ¦ 166 ¦ сломанный стержень
    § 167 § знак сечения
    ¨ 168 ¨ диэрезис
    © 169 © знак авторского права
    ª 170 ª женский порядковый номер
    « 171 « двойная кавычка, указывающая влево
    ¬ 172 ¬ без знака
    173 ­ мягкий дефис
    ® 174 ® зарегистрированный знак
    ¯ 175 ¯ макрон
    ° 176 &град; знак градуса
    ± 177 +плюсмн; знак плюс-минус
    ² 178 ² верхний индекс два
    ³ 179 ³ верхний индекс три
    ´ 180 ´ острый акцент
    µ 181 &микро; микро знак
    182 знак подушки
    · 183 · средняя точка
    ¸ 184 ¸ седилья
    ¹ 185 ¹ верхний индекс один
    º 186 º мужской порядковый номер
    » 187 » двойная кавычка, указывающая вправо
    = 188 ¼ вульгарная дробь одна четверть
    ½ 189 ½ вульгарная дробь одна половина
    ¾ 190 ¾ вульгарная дробь три четверти
    ¿ 191 ¿ перевернутый вопросительный знак
    À 192 À Заглавная латинская буква А с гравировкой
    Á 193 Á Латинская заглавная буква А с острым знаком
    Â 194 Â Заглавная латинская буква A с циркумфлексом
    Ã 195 &Атильда; Заглавная латинская буква A с тильдой
    Ä 196 Ä Заглавная латинская буква А с диэрезисом
    Å 197 Å Заглавная латинская буква A с кольцом вверху
    Æ 198 Æ Заглавная латинская буква AE
    Ç 199 Ç Заглавная латинская буква C с седильей
    È 200 È Заглавная латинская буква E с гравировкой
    É 201 É Латинская заглавная буква E с острым знаком
    Ê 202 Ê Заглавная латинская буква E с циркумфлексом
    Ë 203 Ë Заглавная латинская буква Е с диэрезисом
    М 204 Ì Латинская заглавная буква I с гравировкой
    Í 205 Í Латинская заглавная буква I с острым знаком
    Î 206 Î Заглавная латинская буква I с циркумфлексом
    Ï 207 Ï Латинская заглавная буква I с диэрезисом
    Р 208 Ð Заглавная латинская буква Eth
    Ñ 209 Ñ Заглавная латинская буква N с тильдой
    Ò 210 Ò Заглавная латинская буква O с гравировкой
    Ó 211 Ó Латинская заглавная буква O с острым знаком
    Ô 212 Ô Заглавная латинская буква O с циркумфлексом
    Õ 213 Õ Заглавная латинская буква O с тильдой
    Ö 214 Ö Латинская заглавная буква O с диэрезисом
    × 215 × знак умножения
    Ø 216 Ø Заглавная латинская буква О со штрихом
    Ù 217 Ù Латинская заглавная буква U с гравировкой
    Ú 218 Ú Латинская заглавная буква U с острым знаком
    Û 219 Û Латинская заглавная буква U с циркумфлексом
    Ü 220 Ü Латинская заглавная буква U с диэрезисом
    Ý 221 Ý Латинская заглавная буква Y с остротой
    Þ 222 Þ Заглавная латинская буква Thorn
    ß 223 ß Латинская строчная буква диез s
    à 224 à Строчная латинская буква а с запятой
    á 225 á Строчная латинская буква а с острым знаком
    â 226 &acir; Строчная латинская буква a с циркумфлексом
    ã 227 ã Строчная латинская буква a с тильдой
    ä 228 ä Строчная латинская буква a с диэрезисом
    å 229 å Строчная латинская буква а с кольцом над цифрой
    æ 230 æ Строчная латинская буква ae
    ç 231 ç Строчная латинская буква c с седилью
    и 232 è Строчная латинская буква e с запятой
    é 233 é Строчная латинская буква e с акутом
    ê 234 ê Строчная латинская буква e с циркумфлексом
    ë 235 ë Строчная латинская буква e с диэрезисом
    ì 236 ` Строчная латинская буква i с запятой
    í 237 í Строчная латинская буква i с акутом
    î 238 î Строчная латинская буква i с циркумфлексом
    ï 239 ï Строчная латинская буква i с диэрезисом
    ð 240 ð Латинская строчная буква eth
    241 ñ Строчная латинская буква n с тильдой
    ò 242 ò Строчная латинская буква о с запятой
    243 ó Строчная латинская буква o с акутом
    ô 244 ô Строчная латинская буква o с циркумфлексом
    х 245 õ Строчная латинская буква o с тильдой
    ö 246 ö Строчная латинская буква o с диэрезисом
    ÷ 247 &разделить; Знак деления
    ø 248 ø Строчная латинская буква o со штрихом
    ù 249 ù Строчная латинская буква u с запятой
    ú 250 ú Строчная латинская буква u с акутом
    û 251 û Строчная латинская буква u с циркумфлексом
    ü 252 ü Строчная латинская буква u с диэрезисом
    ý 253 ý Строчная латинская буква y с акутом
    þ 254 þ Латинская строчная буква thorn
    ÿ 255 ÿ Строчная латинская буква y с диэрезисом



    Управляющие символы

    Управляющие символы (диапазон 00-31, плюс 127) предназначены для управления аппаратные устройства.