unicodeUTF-8кодуваннясимволиHTML entitiesпрограмування

Інформація про символ (Unicode, UTF-8)

Mariana Costa

Автор: Mariana Costa· Especialista em Ferramentas

·1 хв читання

Інструмент інформації про символ відображає детальні технічні дані для кожного символу введеного тексту: кодову точку Unicode (U+XXXX), десяткове значення, HTML-сутність та байтове представлення UTF-8.

Що таке інструмент інформації про символ?

Це технічний інструмент для розробників і лінгвістів, що показує внутрішнє представлення кожного символу Unicode. Для кожного символу відображається: код Unicode (U+0041 для A), десяткове значення (65), HTML-сутність (A або &) та байти UTF-8. Усе виконується у браузері.

Як отримати інформацію про символи

  1. Відкрийте Інформація про символ
  2. Вставте або введіть текст
  3. Перегляньте деталі кожного символу в таблиці

Реєстрація не потрібна.

Випадки використання

Часті запитання

Що таке кодова точка Unicode? Кодова точка - це унікальний числовий ідентифікатор символу в стандарті Unicode. Записується у форматі U+ і шістнадцяткового числа. Наприклад, U+0041 для "A".

Що таке UTF-8? UTF-8 - це спосіб кодування Unicode-символів у байти. ASCII-символи займають 1 байт, кирилиця - 2 байти, більшість інших мов - 2-4 байти.

Чому для emoji потрібно кілька байтів? Emoji мають великі кодові точки Unicode і займають 4 байти в UTF-8 (і навіть 2 кодові одиниці в UTF-16).

Як це допомагає при відлагодженні? Якщо текст виглядає неправильно після обробки, перевірка кодових точок допомагає визначити, де відбулась заміна або пошкодження символів.

Спробуйте зараз: Інформація про символ

Пов'язаний інструмент

Інформація про символ

Безкоштовний доступ, без реєстрації.