Codebra
23 января 2026 в 14:15

Урок 12. Кодировка HTML-страницы и атрибуты тегов

Что такое кодировка страницы? Как сделать? Для чего нужна кодировка? И практика по HTML.
📝

Внимание! На этой странице вы найдете материал урока из архивного курса по HTML. Курс был написан в 2015, обновлен в 2024 году и по-прежнему актуален для начинающих веб-разработчиков.

Теоретический материал сохранен в исходном виде, а практические задания с автоматической проверкой вынесены в отдельные роадмапы.

Полный список уроков доступен по тегу Архивный курс по HTML и на странице первого урока.

📋 Задание
  • Привести кодировку в нормальный вид - исправить ошибки (кодировка должна быть utf-8)
📝 Кратко

Проблема с кодировкой страницы

  • При просмотре веб-страниц, вы можете видеть знаки вопроса и квадратики вместо текста. Это связано с неправильной кодировкой сайта.

Что такое кодировка

  • Кодировка — это таблица символов, содержащая сам символ и его код.
  • Термин «набор символов» редко используется, чаще говорят «кодировка».
  • Популярные кодировки: ASCII и UTF-8.

История кодировок

  • ASCII разработана для английского языка.
  • Unicode расширил ASCII для других языков.
  • UTF-8 исправила недостатки Unicode, позволяя кодировать до 2 миллиардов символов.

UTF-8 и ASCII

  • В UTF-8 коды от 0 до 127 используются для символов ASCII.
  • Если символ не входит в ASCII, старший бит первого байта устанавливается в 1.
  • Каждый символ в UTF-8 кодируется восемью битами, если используется только ASCII.

Атрибуты в HTML

  • Атрибуты — это дополнения к тегам, расширяющие их возможности.
  • Атрибуты указываются в открывающемся теге и состоят из имени и значения, разделенных знаком равенства.
  • Имя атрибута пишется в нижнем регистре, хотя HTML5 позволяет использовать любой регистр и не использовать кавычки.

В предыдущем уроке мы говорили о важном элементе сайта: тег <title>. Он используется для указания заголовка страницы, который отображается в имени вкладки. В этом уроке поговорим о кодировке веб-страницы.

Как добавить кодировку страницы

Вы когда-нибудь видели на странице в интернете какие-то знаки вопроса, квадратики и прочее вместо текста? Думаю, что видели. Так вот, у этого сайта проблема с кодировкой, вполне возможно разработчик ее не указал.

Кодировка, простыми словами, это таблица содержащая набор символов. Для того чтобы добавить кодировку сайта, нужен многофункциональный тег <meta> , о нем написан целый урок.

Итак, чтобы браузер понял, какую кодировку вы используете, применяйте эту строку:

<meta charset = "utf-8">

Браузер увидит ее и будет использовать кодировку UTF-8.

Что такое кодировка

Кодировка, это набор символов, представленный в таблице. Таблица содержит сам символ и его код, например, двоичный (нули и единицы). Термин «набор символов» редко используется, чаще всего говорят «кодировка».

На данный момент популярны две кодировки: ASCII и UTF-8. На нашем сайте используется кодировка UTF-8.

Подробнее о кодировке

Кодировка ASCII является американской и разрабатывалась для английского языка.

Так как, к примеру, французский язык имеет надстрочные знаки, а русский алфавит не похож на английский, был разработан стандарт Unicode для расширения кодировки ASCII. Но и в Unicode, со временем, стало не хватать места для размещения новых символов. Поэтому на основе Unicode создали кодировку UTF-8, которая исправила эти недостатки.

Кодировка UTF-8 позволяет кодировать до 2 миллиардов символов, поэтому она доминирует в интернете.

В UTF-8 коды от 0 до 127 используются для представления символов ASCII. Если символ не входит в набор ASCII, то старший бит первого байта устанавливается в 1, что свидетельствует о дополнительном использовании байтов. То есть, если в документе используются только символы из ASCII, то каждый символ в UTF-8 будет кодироваться восьмью битами.

С кодировкой закончили, переходим к атрибутам тегов в HTML.

Что такое атрибуты

Настало время познакомиться с атрибутами в HTML. Вы их уже встречали, просто на них не акцентировалось внимание.

Атрибуты – это дополнения к тегам, расширяющие их возможности. Они всегда указываются в открывающемся теге. Атрибут состоит из имени и значения, разделенного знаком равенства.

Имя атрибута необходимо писать в нижнем регистре. Хотя HTML5 и позволяет писать значения атрибутов без кавычек, вы все равно про них не забывайте.

Например, в примере выше, charset - атрибут, а utf-8 - значение.

В следующем уроке будем разбираться как описать стили CSS в HTML-документе.

📝

Переходите к следующему уроку курса, а так же не забудьте посмотреть новый материал на Codebra по тегу HTML.