Академический Документы
Профессиональный Документы
Культура Документы
Урок 4. Строки
О чем урок
Вам предстоит изучить строки C# достаточно пристально. Вы узнаете тонкости их устройства и
специфику обработки. На простых примерах вы опробуете все самые полезные методы классов
символа и строки.
Будет подробно освещена тема кодировок и встроенных механизмов .Net Framework работы с
ними. Вы узнаете о том, что такое ASCII, Unicode, UTF-8, кодовые страницы, увидите отличия на
уровне байтовых последовательностей и, наконец, сможете пользоваться всем этим в .Net.
Для выполнения заданий вам придется научиться анализировать HTML, реализовать собственную
функцию «Перенос строк» и выполнить множество других задач обработки символьной
информации. Также вы познакомитесь с инструментом сканирования текстов, который
использовался при написании реальных Интернет-ботов.
Самоконтроль
строки в C и C++
строки в C#
immutable
ограничения и причины неизменности строк
равенство и неравенство строк
равенство и неравенство ссылок на строки
intern pool
строковые литералы
символьные литералы
символ и его размер
кодировка
популярные кодировки
родная кодировка C#
явное приведение символов и целых чисел
класс Char
статические методы класса Char
экранирование символов
форматирование строк
класс String
Домашнее задание
1. Требуется изучить программу WebBrowser и внести следующие доработки:
Реализовать класс HtmlCleaner, который должен удалять из HTML все теги, а также
скрипты и стили. На выходе должен остаться только тот текст, который виден на
странице при просмотре обычным браузером.