Академический Документы
Профессиональный Документы
Культура Документы
03
Л. А. Ходоровский
Leonard A. Khodorovskiy
Данная статья возникла как попытка дать в процессах, местах действия; 2) сведения, обра-
курсе информатики согласованные определе- ботанные специальным образом для принятия
ния основных понятий информатики – инфор- решений, информация (выделено мной. – Л. Х.).
мация, данные, документ.
Названные понятия относятся к числу пер- В других случаях эти понятия разделяют. Но
вичных, основных понятий. Они используются в одних работах данные определяются через
при обсуждении весьма разнообразных аспек- информацию: «данные – информация, обрабо-
тов информационной деятельности, и потому танная и представленная в формализованном
объективно существует большое количество виде для дальнейшей обработки»2, а в других –
разнообразных определений этих понятий. информация определяется через данные: «ин-
Эти определения отражают различные точки формация (выделено мной. – Л. Х.) – это смысл,
зрения на информационную деятельность. И, к который человек приписывает данным на осно-
сожалению, не всегда эти определения сформу- вании известных ему правил представления в
лированы достаточно точно и непротиворечиво. них фактов, идей, сообщений»3.
Основные противоречия отмечаются в Весьма разнообразны варианты использо-
парах понятий информация – данные и инфор- вания термина «информация» при определении
мация – документ. понятия «документ». В «Общей теории докумен-
В обыденной речи термины «информация» и та и книги»4 приводится 25 определений доку-
«данные» зачастую используются как синонимы: мента. Большинство из них являются варианта-
выражения «информация о выпуске продукции» ми утверждения «Документ есть материальный
и «данные о выпуске продукции» воспринима- объект, содержащий информацию» (которое мы
ются одинаково. И даже в терминологических будем обсуждать далее), но при этом одни опре-
изданиях информация определяется через дан- деления строятся в форме «Документ – это ин-
ные, а данные – через информацию. Например, в формация, зафиксированная на материальном
Современном экономическом словаре1: объекте…», другие в форме «Документ – это ма-
териальный объект с зафиксированной на нем
Информация – 1) любое сообщение о чем- информацией…».
либо; 2) сведения, данные, значения экономиче- Неудачные определения приводят к не-
ских показателей, являющиеся объектами хра- разберихе в понятиях. Например, Ю. Н. Столя-
нения, обработки и передачи и используемые в ров показывает противоречивость терминов
процессе анализа и выработки экономических в ГОСТ 7.0–99: «Информационные ресурсы де-
решений в управлении. финируются как „совокупность данных, органи-
Данные – 1) факты и характеризующие их зованных для эффективного получения досто-
числовые, количественные показатели: имена, верной информации“. В том же ГОСТе данные
даты событий, сведения об экономических определяются как „информация, обработанная
97
Л. А. Ходоровский
сигналов, технических средств и т. д.); с середи- хронно), когда результаты духовной или мыс-
ны XX в. – общенаучное понятие, включающее лительной деятельности передаются автором
обмен сведениями между людьми, человеком и получателю в устной форме, либо в режиме от-
автоматом, автоматом и автоматом, обмен сиг- ложенного общения (диахронно), когда сначала
налами в животном и растительном мире, пере- создается некий текст, а затем, через неопреде-
дачу признаков от клетки к клетке, от организма ленный отрезок времени этот текст восприни-
к организму. мается получателем.
Очевидно, что в режиме отложенного об-
В приведенном определении информация – щения исходящий от источника текст вначале
это то, что источник передает получателю. должен быть зарегистрирован на носителе
Не менее известным является определение, в виде данных, а через некоторое время из-
данное в ГОСТ 7.0–99: влечен из этих данных получателем (а, может
быть, и никогда никем не извлечен). В режиме
Информация – сведения, воспринимаемые непосредственного общения, казалось бы, не
человеком и (или) специальными устройствами требуется использование промежуточной сущ-
как отражение фактов материального или духов- ности – данных. Однако, на самом деле, сигналы,
ного мира в процессе коммуникации. получаемые человеком, после первичного пре-
образования на короткое время откладываются
В этом определении информация – это то, (фиксируются) в кратковременной (оператив-
что воспринимает получатель. ной) памяти, а затем уже поступают в дальней-
Это не случайно. Дело в том, что процесс шую обработку, результаты которой загружают-
информационной коммуникации содержит, как ся в долговременную память.
минимум, два этапа, два взаимодействия: Таким образом, и в случае, когда источни-
этап 1 – Сигнал от источника информации ком информации являются результаты духовной
доходит до носителя данных, преобразуется и или мыслительной деятельности, первым эта-
фиксируется на нем в виде данных; пом коммуникации является выдача передавае-
этап 2 – Данные передаются получателю, ко- мых сведений источником и фиксация их в виде
торый вычленяет, воспринимает содержащуюся данных на материальном носителе.
в данных информацию. Второй этап коммуникационного процес-
Первый этап коммуникационного про- са: данные – приемник. На этом этапе сведения,
цесса: источник – данные. В качестве источни- смыслы, зафиксированные в данных, извлекаются
ка информации могут выступать как процессы из данных, если нужно, преобразуются и поступа-
реального мира, так и процессы выражения ют в распоряжение воспринимающей системы.
результатов духовной и мыслительной деятель- Роль такой системы может играть конкретный
ности человека. человеческий мозг, конкретный мозг животного,
Пусть источник информации – процессы наследственная система конкретного организма
реального мира. Эти процессы сами по себе не или совокупность специальных программ в ком-
ориентированы на наличие или отсутствие на- пьютере. Третий вид воспринимающей системы
блюдателя этих процессов. Они становятся ис- при желании можно считать подвидом первого –
точниками информации (сигналами), если рас- ведь исполнение программ в компьютере можно
сматриваются с точки зрения участия в процессе считать особым способом проявления деятель-
коммуникации, а результаты фиксации сигнала ности человеческого мозга, инструментально
на материальном носителе тех особенностей поддерживаемой компьютером.
сигнала, которые служат для отражения разно- На пути от данных к приемнику можно
образия, рассматриваются как данные. выделить два шага. На первом шаге происхо-
Пусть теперь источник информации – ре- дит «считывание» данных, преобразование их
зультаты духовной и мыслительной деятель- в текст, понятный воспринимающей системе.
ности человека. Такие источники информации На втором шаге этот текст играет роль входной
предполагают наличие получателя информации: информации, которая далее обрабатывается
так, результаты мышления выдаются в виде тек- совместно с другой информацией (знаниями),
стов (устных или письменных), предназначенных известной воспринимающей системе (т. е., в тер-
для восприятия слушателем (читателем); лице- минологии работы Ю. А. Шрейдера13, совместно
действо актера рассчитано на восприятие его с тезаурусом воспринимающей системы). Итогом
зрителем и т.п. (В частности, информация может такой обработки является получение актуаль-
быть направлена и самому себе). ной информации – результата коммуникации
Передача информации происходит либо между источником и получателем. Существен-
в режиме непосредственного общения (син- нейшее влияние на результат оказывает при
99
Л. А. Ходоровский
этом то, какие знания доступны воспринимаю- ции от источника (реальная действительность)
щей системе и как она умеет ими пользоваться. к данным, выступающим как приемник инфор-
Можно назвать первый этап этапом коди- мации, этапу декодирования соответствует про-
рования (информация «кодируется» и «записы- цесс передачи информации от данных (выступа-
вается» в виде данных), а второй этап – этапом ющих как источник) к оконечному получателю
декодирования (данные поступают в распоря- информации, а между этими этапами возникает
жение воспринимающей системы, которая «де- промежуточный этап хранения данных, т. е. про-
кодирует» данные, выделяет из них информа- цесс передачи информации во времени:
цию). В целом процесс передачи и получения
информации представляется такой схемой: Источник – кодирование →
Данные – хранение →
Источник – кодирование → Данные –декодирование → Приемник
Данные – декодирование → Приемник
Информация, т. е. сведения о распределе-
Например, кодирование информации о том, нии материи и энергии, об изменениях в про-
как выглядит поверхность Луны, заключается в цессах – суть знания человека об окружающем
том, что эта поверхность отражает солнечные мире, в том числе о человеческой деятельности.
лучи, отраженный свет достигает Земли, попа- Как отмечает Б. А. Семеновкер, «разница
дает (например) на фотопленку и производит между знанием и информацией заключается в
на ней определенные физические изменения. том, что они характеризуют человеческое по-
Изображение, закрепленное на пленке – это и знание с разных сторон: знание – с гносеоло-
есть данные. Декодирование данных может за- гической, информация – в основном с комму-
ключаться в следующем: изображение с пленки никативной. Информация – это знание, которое
преобразуется (выводится на экран или печа- существует не только для данного человека, но
тается в виде фотографии), результат преоб- и для других людей»14.
разования воспринимается зрением человека, Таким образом, вся информации, употребляе-
преобразуется к внутреннему представлению, мая человечеством в его деятельности, воплоща-
обрабатывается мозгом человека с привлечени- ющая интеллектуальный и духовный потенциалы
ем известных человеку знаний, и воспринима- человечества, хранится в форме данных.
ется, как актуальная информация, поступившая Поэтому вместо известного образа «океаны
приемнику (человеку) от источника (поверхно- информации», уместнее был бы образ «конти-
сти Луны). ненты данных». А вместо терминов «информа-
А. С. Пушкин закодировал свое очарование ционный процесс», «хранилище информации»
осенней порой в нескольких словах: «В багрец точнее было бы употреблять «процесс обработ-
и золото одетые леса». Этот текст и есть данные. ки данных», «хранилище данных».
А декодирует эти данные каждый читатель по- Но эти термины не прижились в русском
своему. И есть основания полагать, что инфор- языке, может быть еще и потому, что слово
мация, полученная в результате декодирования «данные» грамматически неудобное, от него
этого текста жителем средней полосы, намного нельзя, например, образовать прилагательное
точнее отображает картину, очаровавшую поэта, и пр. Поэтому, несмотря на все вышесказанное,
чем результат декодирования жителем Крайне- нет смысла требовать строгого разграничения
го севера или джунглей (даже хорошо знающим понятий «информация» и «данные» в обыденной
русский язык). и даже, подчас, профессиональной речи. В конце
Вышеприведенная схема соответствует концов, потребителя интересует информация, а
схеме коммуникации «источник – передатчик – не способ ее упаковки. Однако в узко професси-
канал – получатель – потребитель». В этой ком- ональных целях (которым и посвящена насто-
муникации участвует два вида информации: ящая статья) необходимо четко соблюдать это
сначала исходная информация источника фик- разграничение.
сируется в данных, затем воспринимаемая ин- Данные – это результат фиксации любой ин-
формация извлекается из данных получателем. формации, однако, зачастую предпринимаются
Данные в этой схеме играют роль канала. попытки каким-либо образом ограничить сферу
Несколько более подробный анализ про- действия этого понятия.
цесса передачи информации показывает, что Например: «Данные суть факты, идеи, сведе-
данные могут выступать в нескольких ролях. ния, представленные в знаковой (символьной)
Весь процесс передачи информации можно раз- форме, позволяющей производить их передачу,
бить на три части, три процесса. Этапу кодирова- обработку и интерпретацию, а информация – это
ния соответствует процесс передачи информа- смысл, который человек приписывает данным
101
Л. А. Ходоровский
103
Л. А. Ходоровский
емые внутри общего текста: заголовком, адре- коловым дополнительные признаки выделены
сом в оглавлении и пр. Каждый такой фрагмент нами: «Документ – это стабильный веществен-
соотносится не со всем материальным объек- ный объект, предназначенный для использова-
том, а с некоторой его областью. Идентифика- ния в социальной смысловой коммуникации в
ция такого фрагмента включает идентификацию качестве завершенного сообщения»20.
материального объекта плюс идентификацию Иногда на понятие документа наклады-
фрагмента в общем тексте. Какие фрагменты ваются дополнительные условия. Например,
считать документами и как их идентифициро- А. В. Венгеров утверждает: «Именно такой при-
вать (например, считать ли главы и параграфы знак документа, как его юридическое значение,
в книге документами или нет) – это зависит от отличает документ от других носителей инфор-
соглашений соответствующей информационно- мации, фиксирующих объективную действитель-
документационной системы. ность и мыслительную деятельность человека».
С появлением компьютера возникло поня- И потому «документом является носитель такой
тие «электронный документ», т. е. документ, в информации, содержанию и способам фиксации
котором информация (сообщение) представле- которой действующее законодательство прида-
на в электронно-цифровой форме. ет определенное правовое значение»21.
По отношению к электронному документу С нашей точки зрения в основу понятия
применение понятия «материальный объект» «документ» следует положить определение О4,
становится достаточно условным. В роли доку- однако в каждой области деятельности долж-
мента может выступать компакт-диск («матери- ны определяться дополнительные требования
альный объект» без сомнения), или файл (т. е. к видам объектов, организации данных, инфор-
поименованный участок внешней памяти ком- мационному содержанию документов, отража-
пьютера, что можно с натяжкой назвать «матери- ющие специфику документов данной области
альным объектом»), или часть файла (что трудно деятельности.
назвать «материальным объектом»). Однако в В разных определениях на первый план вы-
любом случае под электронным документом по- ступает то объект, то информация. Например, в
нимается некоторая идентифицируемая сово- стандарте ГОСТ 16487–70 «Делопроизводство
купность данных, обособленная либо привязкой и архивное дело. Термины и определения» до-
к идентифицируемому материальному объекту, кумент определяется как «материальный объект
либо каким-либо другим способом. с информацией, закрепленной созданным чело-
Назовем идентифицируемым объектом веком способом для ее передачи во времени и
либо отдельный идентифицируемый материаль- пространстве». А в редакции того же стандарта
ный объект, либо совокупность материальных от 1998 г. (ГОСТ Р 51141–98) приводится (уже
объектов, идентифицируемую как один объект, рассмотренное нами выше) определение: «До-
либо область на идентифицируемом материаль- кументированная информация (документ) – за-
ном объекте, содержащую идентифицируемый фиксированная на материальном носителе
фрагмент данных. информация с реквизитами, позволяющими ее
Тогда определение документа можно моди- идентифицировать».
фицировать таким образом: В нашем определении документ – это ма-
Определение О4. Документ – идентифици- териальный объект. Во многих дефинициях упо-
руемый объект, содержащий данные. требляется термин «материальный носитель».
Определение О4 обобщает три предыду- Например: «Документ – это материальный
щих, но остается максимально лаконичным: в носитель с зафиксированной информацией,
нем не накладывается никаких ограничений предназначенный для ее сохранения и пере-
на данные, зафиксированные в документе, и на дачи во времени и в пространстве, пригодный
содержание информации, отражаемой в них: для использования в документационных про-
полезная или бесполезная, достоверная или цессах»22. Однако этот термин используют не
ложная, завершенная или нет – лишь бы был только в смысле «материальный объект», но и
распознаваемый объект и знаки на нем. для обозначения вида материальной среды (бу-
В практической деятельности предполага- мага, магнитная лента, полупроводник и пр.), и
ется, что документ должен содержать осмыс- для обозначения физического процесса, лежа-
ленную информацию, должен использоваться щего в основе сигнала (электромагнитное излу-
в рамках определенной информационно-доку- чение, звуковые волны и пр.). Поэтому термин
ментационной системы. Поэтому в определени- «материальный объект» предпочтительнее (в
ях документа наличествуют дополнительные (по частности, его употребление подчеркивает, что
сравнению с определением О4) признаки поня- каждый документ – это нечто, четко отделяемое
тия. Например, в определении, данном А. В. Со- от других документов). Кроме того, как будет по-
105
Л. А. Ходоровский
файл (объект), содержащий данные, следова- торых является описанием некоторого объек-
тельно, база данных – документ. Данные одного та предметной области.
такого документа содержат сведения о множе- Описываемые объекты могут быть двух
стве разнообразных объектов26. Так, база дан- видов – документы и не документы, т. е. прочие
ных об оборудовании предприятия содержит (материальные, мыслимые и др.) объекты. Прин-
сведения о составе оборудования, регламен- ципиальная разница между этими видами в том,
тах ремонтов, планах ремонтов и технического что описание обычного объекта (не документа)
обслуживания, отметки о фактическом выпол- представляется как совокупность значений су-
нении этих планов и пр. Информация об одном щественных свойств этого объекта. А описание
объекте представляется данными, соответству- документа – это описание его как идентифици-
ющими одной строке одной из таблиц этой руемого объекта (т. е. совокупность значений
базы данных. Эта информация вполне может его свойств, в том числе идентифицирующих),
рассматриваться как завершенное сообщение. плюс – некоторое описание текста документа
Данные, содержащие это сообщение, образуют (в частном случае «некоторое описание» может
запись – структурный элемент базы данных, но быть и полным текстом документа).
не являются документом27. Базы данных в зависимости от вида опи-
С изложенной точки зрения понятие «ин- сываемых объектов принято подразделять на
формационные ресурсы» отличается от «до- документальные и фактографические. По ГОСТ
кументных ресурсов», так как «совокупность 7.70–9629 рекомендуются следующие определе-
сообщений» не совпадает с «совокупностью ния типов БД:
документов». В связи с этим можно было бы Документальная – БД, в которой запись
предложить следующие определения: отражает документ и содержит его библиогра-
Документные ресурсы – отдельные до- фическое описание и, возможно, иную инфор-
кументы и отдельные массивы документов, мацию о нем.
документы и массивы документов в информа- Фактографическая – БД, записи в которой
ционных системах (библиотеках, архивах, фон- содержат данные о состоянии внешнего мира,
дах, банках данных, других информационных не опосредованные ссылками на отражающие
системах). их документы.
Информационные ресурсы – сообщения, Фактографические БД подразделяются на
размещенные на документах – элементах доку- объектографические (записи которых содержат
ментных ресурсов. данные об отдельном объекте внешнего мира) и
Указанные различия между двумя типами на базы показателей (записи которых содержат
ресурсов определяют разные подходы в орга- данные о той или иной характеристике (показа-
низации информационного поиска. теле) объектов внешнего мира). Однако харак-
теристика объекта сама может рассматриваться
4. Информационный поиск как объект, поэтому и базы показателей можно
считать объектографическими. Т. е. любые факто-
Документные ресурсы хранятся как в виде графические БД являются объектографическими.
отдельных разрозненных документов, так и в Поэтому можно говорить о двух типах БД:
специально организованных хранилищах до- документальные и объектографические. Объек-
кументов – информационных системах, как не- тографические БД содержат описания обычных
автоматизированных (например, традиционных объектов, документальные – описания объек-
библиотеках и архивах), так и автоматизирован- тов-документов.
ных, содержащих данные в электронной форме. В современных объектографических БД
Основой автоматизированной информа- описание объекта представляется как совокуп-
ционной системы является база данных (БД), ность значений его свойств. Эти описания хорошо
содержащая информацию о той или иной формализованы, им соответствует четко опре-
предметной области. Эта информация пред- деленные структура данных, форматы данных
ставляется как описание некоторого множе- (поэтому объектографические БД называют еще
ства объектов и отношений (связей) между сильно структурированными). Высокий уровень
ними. К таким множествам относятся «соб- формализации позволяет применять для поиска
ственно базы данных, сайты Интернета, реги- языки запроса (например, SQL) с мощными поис-
стры, каталоги, реестры, кадастры, библиотеч- ковыми возможностями и высокой точностью.
ные и архивные фонды, электронные издания, А для того, чтобы описать документ, необхо-
электронные музеи, электронные карты и димо, во-первых, описать его как некий объект,
др.»28. Структурно база данных рассматрива- во-вторых, описать содержание текста (контент)
ется как совокупность записей, каждая из ко- этого документа.
107
Л. А. Ходоровский
16
состав характеристик, отражающих основные Стерлинг Л., Шапиро Э. Искусство программирова-
понятия ПО, и разнообразные связи между ния на языке Пролог: пер. с англ. М.: Мир, 1990.
17
ними. Для представления онтологий разра- Об информации, информатизации и защите инфор-
батываются специальные языки, например, мации: федер. закон № 24-ФЗ от 20 февр. 1995 г. // Собр.
OWL. Понятия, входящие в онтологию, могут законодательства Рос. Федерации. 1995. № 8.
18
быть использованы для описания семантики Об информации, информационных технологиях и
(смысла) документа. Как для представления защите информации: федер. закон № 149-ФЗ от 27 июля
формальных характеристик документа, так и 2006 г. // Рос. газ.: федер. вып. 2006, 29 июля, № 4131.
19
для характеристики его семантики использу- Плешкевич Е. А. Основы обшей теории документа.
ется язык RDF. Саратов: Науч. кн, 2005. С. 95, 98.
20
Использование этих средств, а также более Соколов А. В. Социальные коммуникации: учеб.-
совершенных языков метаданных позволяет метод. пособие. М.: Профиздат, 2001. Ч. 1. С. 107.
21
создавать значительно более точный поиско- Венгеров А. В. Право и информация в условиях
вый образ документа. Повышение уровня фор- автоматизации управления. М.: Юрид. лит., 1978. С. 113.
22
мализации средств описания документа (за счет Справочник информационного работника. СПб.:
использования таких языков, как RDF) должно Профессия, 2005. (Сер. «Библиотека»).
23
привести к созданию более мощных и точных Швецова-Водка Г. Н. Указ. соч.
24
средств поиска и языков запросов, по мощности Об информации, информатизации и защите инфор-
аналогичных SQL. мации: федер. закон.
25
Ю. Н. Столяров. Указ. соч.
26
Примечания В некоторых СУБД (системах управления базами
данных) под базой данных понимается совокупность
1
Райзберг Б. А. и др. Современный экономический из нескольких файлов, при этом данные одного файла
словарь. 5-е изд., перераб. и доп. М.: Инфра-М, 2007. содержат сведения о множестве объектов одного типа.
2
ГОСТ 7. 0–99. Информационно-библиотечная дея- Можно считать документом эту совокупность файлов или
тельность. Термины и определения. М., 2000. каждый файл из этой совокупности.
3 27
Информатика как наука об информации / Р. С. Гиля- Заметим, что хотя сообщение и не документ, но
ревский и др. М., 2006. С. 9–10. оно может быть выведено в виде отчета на экран или
4
Швецова-Водка Г. Н. Общая теория документа и бумагу – и этот отчет уже является документом. Мало
книги: учеб. пособие. М.: Рыбари; Киев: Знання, 2009. того, база данных может содержать данные, которые по
5
Столяров Ю. Н. Документный ресурс: учеб. пособие сути своей являются документами, например, инструк-
для студентов высш. учеб. заведений. М.: Либерея-Бибин- ции по эксплуатации оборудования. В зависимости от
форм, 2009. способа реализации эти инструкции могут находиться в
6
См.: Ходоровский Л. А. Проектирование инфор- отдельных файлах, присоединенных к базе данных, и тогда
мационных систем: нач. этапы: учеб. пособие. М.: Нобель они выступают как отдельные документы. Но возможен
Пресс, 2013. такой способ реализации, когда тексты этих инструкций
7
Соколов А. В. Философия информации: проф.- погружены внутрь базы данных. В этом случае они могут
мировоззр. учеб. пособие. СПб.: Изд-во СПбГУКИ, 2010. превратиться в документ только после вывода их на экран
8
Глушков В. М. Мышление и кибернетика // Вопр. или на бумагу в виде отчета.
28
философии. 1963. № 1. С. 36. Антопольский А. Б. Информационные ресурсы
9
Урсул А. Д. Исследование информационных и России. М.: Либерея, 2004. С. 12.
29
глобальных процессов: междисциплинарные подходы и ГОСТ 7. 70–96. Система стандартов по информации,
связи // Проблемы о-ва и политики. 2012. № 3. С. 154–201. библиотечному и издательскому делу. Описание баз дан-
10
Там же. ных и машиночитаемых информационных массивов. Состав
11
Столяров Ю. Н. Указ. соч. и обозначение характеристик. М.: Стандартинформ, 2008.
12 30
Соколов А. В. Указ. соч. Исследование и разработка системы метаданных
13
Шрейдер Ю. А. Об одной модели семантической для электронных информационных ресурсов и сервисов в
теории информации // Проблемы кибернетики. М.: Наука, фундаментальной науке: отчет о рез. работ по гранту РФФИ
1965. Вып. 13. С. 18–28. № 04–07–90087 / А. Б. Антопольский, В. И. Ауссем, С. А. Блау,
14
Семеновкер Б. А. Эволюция информационной дея- А. И. Жежель. М., 2004 // Информрегистр: науч.-техн. центр.
тельности: бесписьм. о-во. М.: Пашков дом, 2007. С. 10–11. М., 2007–2014. URL: http: // db. inforeg. ru (дата обращения:
15
Информатика как наука об информации. С. 9–10. 30. 11. 2012).