Компьютер и текст

Заказать работу

В информатике текстом считают последовательность любых символов. Сейчас компьютеры в основном пользуются алфавитами, содержащими 256 знаков1. Каждому из символов соответствует свой восьмиразрядный двоичный код. Таким образом любой символ текста, включая пробелы, занимает 8 бит (1 байт) в памяти компьютера. Зная это, можно легко оценить объем памяти, необходимый для хранения того или иного текстового документа.

Вспомним, как связано количество бит в коде с тем, сколько требуется различных кодов.

Один бит (двоичная цифра) может принимать два значения, добавление каждого разряда в код удваивает количество получаемых комбинаций: двухбитовый код -- четыре варианта, трехбитовый -- восемь, четырехбитовый -- шестнадцать и т. д.

Рассмотрим пример. Машинописная страница стандартного формата (А4) содержит около 55 строк. На каждой строке помещается в среднем 60 символов2. Подсчитаем количество текстовой информации на такой странице. Каждый символ -- 1 байт информации, а всего символов -- 60*55=3300. Значит, на странице 3300 байт (около 3 Кбайт). Как связаны двоичные коды и соответствующие им символы? Это определяется таблицей кодировки. Все используемые на персональных компьютерах таблицы3 основаны на американском стандарте ASCII4. Он определяет первые 128 кодов: для латинских букв, цифр, основных знаков препинания и математических операций. Остальные 128 кодов используются для специальных символов и букв национальных алфавитов (в том числе, русского). И, поскольку общепринятого стандарта для этого не было, возникло много различных кодировок, в том числе, несколько -- для кириллицы5. Именно поэтому, получив от кого-нибудь текст и попытавшись прочесть его на своем компьютере, мы зачастую видим на экране набор непонятных "закорючек".

код CP866 CP1251 KOI-8R Mac
01011010 Z Z Z Z
10001111 П

П
11111101 $ э Щ э

В такой ситуации на помощь приходят программы-конверторы6. Они заменяют двоичный код каждого символа на код, которым такой символ представляется в другой кодировке. Это соответствие определяется таблицей перекодировки. Обычно пользователь должен указать, из какой кодировки в какую идет преобразование, однако появились и программы, умеющие автоматически определять кодировку исходного текста.

Стремление упростить работу с различными текстами (сперва текстами программ, затем служебными документами, газетами, журналами, книгами и т.д.) привело к созданию множества программ, специально ориентированных на это -- текстовых редакторов (или текстовых процессоров).

Какими же данными оперируют эти программы? Очевидно, что наименьшим объектом будет символ. Однако можно работать не только с отдельными символами, но и со словами, строками, абзацами, произвольными фрагментами и текстом в целом. Некоторые действия можно выполнить с любой из этих структур, другие -- только с какй-то определенной. Обрабатываемый текст представляется как бы в виде рулона "бумаги", который можно прокручивать на экране вперед и назад. Большинство современных программ позволяет одновременно работать с несколькими текстами, каждый из которых выводится в отдельное окно. Кроме основных "листов" текстовый процессор, как и другие программы использует "конверт" (или "карман"), в котором можно временно хранить фрагмент текста при его копировании или перемещении.

Текстовый процессор -- не просто заменитель пишущей машинки, а универсальное средство для работы с текстами. Он предоставляет очень широкие возможности манипулирования текстовыми документами. Кроме таких очевидных операций как набор текста, удаление, копирование и перемещение его фрагментов, а также сохранение на диск и печать, имеется возможность изменять шрифт, его начертание, цвет и размер. Текстовый процессор может автоматически форматировать текст (включая установку абзацного отступа и выравнивание). Можно сразу во всем тексте заменить одно заданное слово на другое. Например, поменять "ЭВМ" на "компьютер". Многие редакторы умеют проверять орфографию: компьютер ищет каждое слово в своем словаре и, если не находит, сообщает об этом пользователю, предлагая возможные варианты исправления.

Примечания

Новый стандарт Unicode, на который осуществляется постепенный переход, позволяет использовать 216=65536 (а в последней версии -- 232) символов. Текст в такой кодировке будет занимать существенно (в среднем -- вдвое) больше памяти. [Примечание к примечанию: реальные системы используют не непосредственно Unicode (UTF-32), а представления UTF-8 и UTF-16. В первом из них символ может занимать от 1 до 6 байт, во втором -- 2 или 4 байта]

Это -- примерные значения для русской пишущей машинки. В англоязычных странах обычно используют более мелкий шрифт.

Речь идет о "стандартных" шрифтах. Кроме них существуют также шрифты, содержащие (вместо букв и цифр) специальные, например декоративные, символы.

American Standard Code for Information Interchange -- Американский стандартный код обмена информацией.

В России широко используются в настоящее время четыре кодировки:

CP866 ("DOS-альтернативная". Для PC-совместимых компьютеров под MS-DOS и OS/2, а также в любительской компьютерной сети Fido);

CP1251 (Для PC-совместимых компьютеров под Windows, а также на большинстве сайтов WWW);

KOI-8R (Компьютеры под UNIX, электронная почта и конференции Internet);

Mac-Cyrillic (Макинтош-совместимые компьютеры).

Converter (англ.) -- преобразователь.

Список литературы

Для подготовки данной работы были использованы материалы с сайта http://macedu.narod.ru

Другие материалы

  • Персональный компьютер
  • ... выросла до 150, 166 и 200 МГц. В 1995 г. была создана модификация Pentium Pro c тактовой частотой 150 и 200 МГц. В обычных персональных компьютерах данный процессор не имел преимущества перед стандартным Pentium. Некоторые программы он выполнял даже медленнее. Это связано с тем, что процессор ...

  • Компьютер (Интенет, Windows, пакет программ Micrsoft Office)
  • ... распространенных и популярных среди пользователей персональных компьютеров программный пакет Microsoft Office и покажем некоторые возможности одной из его прикладных программ по созданию презентаций - PowerPoint. Операционные системы WINDOWS NT WINDOWS 95. В настоящее время большинство ...

  • Программное обеспечение персонального компьютера
  • ... сложные, совершенные и универсаль- ные программы. По сути дела, компьютер IBM PC создал не только стабильный и обширный рынок персональных компьютеров, но и ог- ромный рынок прикладного программного обеспечения, на котором за последние полтора десятилетия разбогатело множество венчурных ...

  • Мой компьютер
  • ... имеет интерфейс EIDE, это значит, что данные диски должны подключаться к контроллерам типа EIDE. Практически все выпускаемые сейчас компьютеры имеют на материнской плате встроенный контроллер EIDE, EIDE-контроллер обеспечивает подключение до четырех устройств — жестких дисков, дисководов для компакт ...

  • Основы работы с компьютером
  • ... и задания: 1.  Объясните, для чего используется манипулятор «мышь»? 2.  Перечислите, какие элементы мыши использует пользователь для работы на компьютере? Объясните и покажите, как правильно держать и перемещать мышь? 3.  Что называют указателем мыши? 4.  От чего зависит вид ...

  • Как выжить, работая с компьютером
  • ... . Как выяснилось позже, драйвер монитора не был правильно настроен. Частота развертки для того разрешения, с которым вы работаете, должна быть не ниже 85 Гц! Лучше — 90 Гц. Еще лучше - 100или 110! Эта частота должна поддерживаться и монитором, и графической платой. Если вы работаете за компьютером ...

  • Персональные компьютеры
  • ... данных, позволяют автоматизировать поиск любой информации. Любую таблицу, числом столбцов для бумаги немыслимым /скажем 256/, можно занести в память персонального компьютера, чтобы затем доставать оттуда строки или их части, используя в качестве "ключа" для выбора, скажем, третью букву ...

  • Управление звуковой картой компьютера
  • ... в MIDI-сообщения и адаптеp с выходом MIDI Out. MIDI-клавиатура не способна звучать самостоятельно, она использует в качестве синтезатора звуковую карту компьютера. Иногда на MIDI-клавиатуре размещены некоторые дополнительные переключатели, например, глиссандо или вибрато. Большинство MIDI-клавиатур ...

  • История развития компьютеров
  • ... одно из самых значительных достижений человеческой мысли, влияние которого на развитие научно-технического прогресса трудно переоценить. Области применения ЭВМ непрерывно расширяются. 2.1. Компьютеры в учреждениях   Компьютеры в буквальном смысле совершили революцию в деловом мире. По мере ...

  • Компьютер - это не роскошь, а средство совершенствования творческих способностей человека
  • ... домашнего обучения. В дополнение к их потенциалным возможностям, как средств обучения компьютеры сами должны стать важным объектом изучения. Понимание их возможностей и ограничений необходимо каждому образованному человеку. Компьютер- это инструмент, но от всех других инструментов отличающихся тем ...

  • Совершенствование учебно-методического комплекса "Линия компьютера" с применением гипертекстовых технологий
  • ... для создания Web-страниц Front Page −  Программа Internet Explorer Для разработки самого учебного электронного пособия была выбрана гипертекстовая технология, так как гипертекст позволяет осуществлять мгновенный переход от одного фрагмента текста к другому. Также гипертекст – это ...

Каталог учебных материалов

Свежие работы в разделе

Наша кнопка

Разместить ссылку на наш сайт можно воспользовавшись следующим кодом:

Контакты

Если у вас возникли какие либо вопросы, обращайтесь на email администратора: admin@kazreferat.info