php — Есть ли разница указывать header(‘Content-type: text/html; charset=utf-8’); или ?

Вопрос задан

Изменён 7 месяцев назад

Просмотрен 128 раз

Еще я указывал «AddDefaultCharset utf-8», но разницу не понял

  • php
  • html
  • header
  • charset

2

В спецификации HTML 4.01 в разделе 5.2.2 «Указание кодировки символов» четко указано, что информация в заголовке HTTP имеет приоритет над meta-тегом. HTML 5 не меняет этого поведения, а лишь дополняет относительно метки порядка байтов (BOM). Meta-тег, определяющий кодировку символов, вступает в силу, если информация о кодировке отсутствует в заголовке HTTP, или при наличии метки порядка байтов (BOM).

Вообще, клиент по некоторым причинам может не принять информацию о кодировке в заголовке Content-Type, также HTML-документ может быть открыт локально, так что HTTP-заголовки вообще могут отсутствовать. Когда пользователь сохраняет HTML-документ на своем устройстве, заголовки HTTP не сохраняются. Это основная причина использования Meta-тега для указания кодировки символов. И в этом случае он конечно должен указывать правильную кодировку.

конечно есть.

такой header насколько помню равносилен указанию myme-type в htaccess, а он насильно заставит браузер открывать любой output как html страницу, бинарник? парсим как html. mp3? тоже парсим как html. прям как css !important =)

а тег только кодировку задает — он срабатывает уже после того как браузер решил именно парсить контент как html\xhtml, а если парсинг не начнется, этот тег и не сработает.

0

Зарегистрируйтесь или войдите

Регистрация через Google

Регистрация через Facebook

Регистрация через почту

Отправить без регистрации

Почта

Необходима, но никому не показывается

Отправить без регистрации

Почта

Необходима, но никому не показывается

Нажимая на кнопку «Отправить ответ», вы соглашаетесь с нашими пользовательским соглашением, политикой конфиденциальности и политикой о куки

HTML/Атрибут charset (Элемент meta)

Синтаксис

<head>
  .
.. <meta charset="[значение]"> ... </head>

Описание

Атрибут / параметр charset (от англ. «charset» ‒ «кодировка») указывает кодировку символов, используемую в документе.

Условия использования

В документе не должно быть более одного meta элемента с атрибутом «charset».


Поддержка браузерами

Chrome

Поддерж.

Firefox

Поддерж.

Opera

Поддерж.

Maxthon

Поддерж.

IExplorer

Поддерж.

Safari

Поддерж.

iOS

Поддерж.

Android

Поддерж.


Спецификация

Верс.Раздел
HTML
2.0Associated Meta-information: META
3. 2META
4.01The META element
5.04.2.5 The meta element
The charset attribute…
5.14.2.5. The meta element
The charset attribute…
XHTML
1.0Extensible HyperText Markup Language
1.1Extensible HyperText Markup Language


Значения

В качестве значения данного параметра указывается кодировка символов документа. Примеры кодировок:

ISO-8859-1
Кодировка используемая большинством западноевропейских языков. (Данная кодировка также известна как «Latin-1».)
ISO-8859-5
Кодировка поддерживающая кириллицу.
SHIFT_JIS
EUC-JP
Японская кодировка
UTF-8
Одна из общепринятых и стандартизированных кодировок текста, поддерживающая множество различных письменностей.
windows-1251
Кодировка с поддержкой кириллицы.

Регистр символов: не учитывается.


Пример использования

Листинг кода

<!DOCTYPE html>
<html>
<head>
<meta charset=»utf-8″>
<title>Параметр charset (Элемент meta)</title>

</head>
<body>
<h2>Пример использования атрибута «charset»</h2>
<p>Просто обычный документ.</p>
</body>
</html>

Параметр charset (Элемент meta)

Как установить кодировку UTF8 в сценарии Powershell с тегом HTML для отображения персидских символов на странице HTML?

спросил

Изменено 5 лет, 4 месяца назад

Просмотрено 2к раз

Я новичок в powershell.

Я хочу создать веб-страницу с помощью powershell и помещаю теги HTML в сценарий powershell, как показано ниже:

 Импорт модуля ActiveDirectory
'

<голова>
    <мета-кодировка="UTF-8">
    
    
    
    
    
Поделиться <тело> <дел>

Возьмите на себя ответственность

<таблица> Вернуться Уверенность в себе Пожаловаться Узнай больше Ответить Полный список Пожаловаться Пожаловаться Узнай больше <тело>
имя фамилия имя_пользователя Подразделение Отдел должность объявление по электронной почте номер телефона Включено
'

Я поместил теги HTML внутри ‘ ‘ в скрипте powershell (файл .

ps1). Он показывает все правильно, но я хочу найти способ установить кодировку UTF8 для отображения многоязычных символов. Любая помощь приветствуется.

  • html
  • powershell
  • кодировка
  • utf-8

Вы имеете в виду, что хотите записать все содержимое HTML в файл с кодировкой UTF-8, верно?

Передайте всю строку команде Out-File -Encoding utf8 через конвейер.

 '

 ...
' | Out-File -Кодировка utf8 -Путь index.html
 

Зарегистрируйтесь или войдите в систему

Зарегистрируйтесь с помощью Google

Зарегистрироваться через Facebook

Зарегистрируйтесь, используя адрес электронной почты и пароль

Опубликовать как гость

Электронная почта

Требуется, но не отображается

Опубликовать как гость

Электронная почта

Требуется, но не отображается

Инструмент отладки символов UTF-8

i18nqa. com -> utf8-debug

Вот таблица проблем с кодировкой, которая помогает в отладке распространенных проблем с кодировкой символов UTF-8. Посмотрите эти 3 типичных сценария проблем, с которыми может помочь диаграмма.

  • Проблема кодирования 1: обработка байтов UTF-8 как Windows-1252 или ISO-8859-1
  • Проблема кодирования 2: неправильное двойное неправильное преобразование
  • Проблема кодирования 3: ISO-8859-1 против Windows-1252

В следующей таблице показаны символы в Windows-1252 от 128 до 255 (шестнадцатеричные от 80 до FF). Кодовая точка Unicode для каждого указан символ и шестнадцатеричные значения для каждого из байтов в кодировке UTF-8 для тех же символов. Эти байты UTF-8 также отображаются, как если бы они были символами Windows-1252. Вы можете использовать эту диаграмму для отладки проблемы, в которых встречаются эти последовательности латинских символов, где ожидался только один символ. Если вы сопоставите последовательность, которая встречается с последовательностью на диаграмме, и ожидаемое значение на диаграмме соответствует значению, которое вы ожидали увидеть, то проблема вызвана тем, что байты UTF-8 интерпретируются как Windows-1252 (или ISO 8859-1) байт. См. Проблема с кодировкой: обработка байтов UTF-8 как Windows-1252 или ISO-8859-1. для более подробного объяснения.

1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111н1пол 9Ы1111111111111111111111111111111111111111111111111111111111111111111111111111111Р1н €. %. %. %CB113 %CB113 CB113 %CB %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %CB113 %. 13 %C. %.1111111111111111111111111111111111111111111111111111111111111111111111111111113.. 190 %C2 12 %B % % % % % % % % % % % % % % % % % % %.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Таблица для отладки распространенных проблем с кодировкой символов UTF-8.
Кодовая точка Символы Байты UTF-8   Кодовая точка Символы Байты UTF-8
Юникод Windows
1252
Ожидаемый Фактический Unicode Windows
1252
Ожидаемый Фактический
U+20AC 0x80 %E2 %82 %AC   U+00C0 0xC0 À À %C3 %80
0x81   U+00C1 0xC1 Á Ã %C3 %81
U+201A 0x82 %E2 %   U+00C2 0xC2  Â %C3 %82
U+0192 0x83 ƒ Æ’ %C6 %92   U+00C3 0xC3 à Ã %C3 %83
U+201E 0x84 %E2 %80 %9E U+00C4 0xC4 ä ã %C3 %
U+2026 0X85 .   U+00C5 0xC5 Å Ã… %C3 %85
U+2020 0x86 %E2 %80 %A0   U+00C6 0xC6 Æ Ã† %C3 %86
U+2021 0x87 ‡ %E2 %80 %A1   U+00C7 0xC7 Ç Ã‡ %C3 %87
9 U+0136 0x88 ˆ ˆ %CB %86   U+00C8 0xC8 È Ãˆ %C3 %88
U+2030 0x89 ‰ %E2 %80 %B0   U+00C9 0xC9 É Ã‰ %C3 %89
U+0160 0x8A Š Å %C5 %A0 U+00CA 0XCA ê ãO %C3 %8A
U+2039 0x8B U+2039 0X8B
  U+00CB 0xCB Ë Ã‹ %C3 %8B
U+0152 0x8C Œ Å’ %C5 %92   U+00CC 0xCC Ì ÃŒ %C3 %8C
0x8D U+00CD 0xCD í ã %C3 %
U+017d 0x8E u+017d 0X8E ž 0X8E ž0112 ž ž ž ž ž ž ž. ž ž ž ž ž ž..   U+00CE 0xCE О ÃŽ %C3 %8E
0x8F   U+00CF 0xCF Ï Ã %C3 %8F
0x90   U+00D0 0xD0 Ð Ã %C3 %90
U+2018 0x91 %E2 %80 %98   U+00D1 0xD1 Ñ Ã‘ %C3 %91
U+2019 0x92 ’ %E2 %80 %99   U+00D2 0xD2 Ò Ã’ %C3 %92
U+201C 0x93 “ %E2 %80 %9С   U+00D3 0xD3 Ó Ã“ %C3 %93
U+201D 0x94 †%E2 %80 %9D U+00D4 0xd4 ô ã ã ã ã ã ” %C3 %94
U+2022 0X95
.   U+00D5 0xD5 õ ã %C3 %95
U+2013 0x96   U+00D6 0xD6 Ö Ã– %C3 %96
U+2014 0x97 — %E2 %80 %94   U+00D7 0xd7 × ã— %C3 %97
U+02DC 0x98 ˜ ë 4. U+00D8 0xd8 Ø ã %C3 %98
U+2122 0x999
U+2122 0X999 u+2122 0x999 re+2122 0x999
re+2122 0X999
.   U+00D9 0xD9 ٠Ù %C3 %99
U+0161 0x9A š Å¡ U+00DA 0xDA ú ãO %C3 %
U+203A 0X9B113 U+203A 0X9B113   U+00DB 0xDB Û Ã› %C3 %9B
U+0153 0x9C Å“ %C5 %93   U+00DC 0xDC Ü Ãœ %C3 %9C
0x9D   U+00DD 0xDD Ý Ã %C3 %9D
U+017E 0x9E ž ¾ %C5 %BE   U+00DE 0xDE Þ Ãž %C3 %9E
U+0178 0x9F Ÿ Ÿ %C5 %B8   U+00DF 0xDF ß ÃŸ %C3 %9F
U+00A0 0xA0 Â %C2 %A0   U+00E0 0xE0 à Ã %C3 %A0
U+00A1 0xA1 ¡ ¡ %C2 %A1   U+00E1 0xE1 á á %C3 %A1
U+00A2 0xA2 ¢ ¢ %C2 %A2   U+00E2 0xe2 â ã %C3 %A2
U+00A3 0XA3 £ ~ £ ~   U+00E3 0xE3 ã ã %C3 %A3
U+00A4 0xA4 ¤ ¤ %C2 %A4   U+00E4 0xE4 ä ä %C3 %A4
U+00A5 0xA5 ¥ 1¥ 5   U+00E5 0xE5 å Ã¥ %C3 %A5
U+00A6 0xA6 ¦ ¦ %C2 %A6   U+00E6 0xE6 æ æ %C3 %A6
U+00A7 0xA7 § § %C2 %A7   U+00E7 0xE7 ç ç %C3 %A7
U+00A8 0xA8 ¨ ¨ %C2 %A8   U+00E8 0xE8 и è %C3 %A8
U+00A9 0xA9 © © %C2 %A9   U+00E9 0xE9 é é %C3 %A9
U+00AA 0xAA ª ª %C2 %AA U+00EA 0XEA ê ª %C3 %AA
U+00AB 0XAB « 0XAB« 0XAB « 0XAB« 0XAB « 0XAB« 0XAB. 0113 « %C2 %AB   U+00EB 0xEB ë ë %C3 %AB
U+00AC 0xAC ¬ ¬ %C2 %AC   U+00EC 0xEC ì ì %C3 %AC
U+00AD 0xAD ­ ­ %C2 %AD   U+00ED 0xED í í %C3 %AD
U+00AE 0xAE ® ® %C2 %AE U+00EEE 0XEE î ã® %C3 %AE
U+00AF 0XAF %
  U+00EF 0xef ï ã %C3 %AF
U+00B0 0xB0 ° â ° ° â °   U+00F0 0xF0 ð ð %C3 %B0
U+00B1 0xB1 ± ± %C2 %B1   U+00F1 0xF1 ± %C3 %B1
U+00B2 0xB2 ² ²   U+00F2 0xF2 ò ò %C3 %B2
U+00B3 0xB3 ³ ³ %C2 %B3   U+00F3 0xF3 ó ó %C3 %B3
U+00B4 0xB4 ´ ´ %C2 %B4 U+00F4 0xf4 ô ã %C3 %B4
U+00B5 0XB5 00111111111111111111111111111111111111111111111111111111111111111111111111111111111Р1Р1Р1Р11.   U+00F5 0xF5 х õ %C3 %B5
U+00B6 0xB6 %C2 %B6   U+00F6 0xF6 ö ö %C3 %B6
U+00B7 0xB7 · · %C2 %B7   U+00F7 0xF7 ÷ ÷ %C3 %B7
U+00B8 0xB8 ¸ %C2 %B8   U+00F8 0xF8 ø ø %C3 %B8
U+00B9 0xB9 ¹ ¹ %C2 %B9 U+00F9 0xf9 ù ã %C3 %B9
U+00BA 0XBA.0113   U+00FA 0xFA ú ú %C3 %BA
U+00BB 0xBB » » %C2 %BB   U+00FB 0xFB û û %C3 %BB
U+00BC 0xBC ¼ ¼ %C2 %BC   U+00FC 0xfc ü ã %C3 %BC
U+00BD 0xBD ½ â â %