Вы находитесь на странице: 1из 13

УДК 004.01:025.4.

03
Л. А. Ходоровский

Документ как структурная единица данных


В статье рассматриваются взаимосвязь между понятиями «информация», «данные», «документ» в приме-
нении как к традиционным, так и к электронным информационным ресурсам. Документ рассматривается как
составная часть данных, их элемент. Определяются подходы к составлению описаний документов в докумен-
тальных БД с целью организации эффективного поиска.
Ключевые слова: информация, данные, документ, электронный документ, документальный поиск

Leonard A. Khodorovskiy

Document as a structural unit of data


The article deals with the relationship between the concepts of «information», «data», «document» as it
applies to traditional as well as to electronic information resources. Document is viewed as a constituent part of
data. In order to organize the effective search the approach to the compilation of document’s descriptions in the
documentary database is defined.
Keywords: information, data, document, electronic document, document search

Данная статья возникла как попытка дать в процессах, местах действия; 2) сведения, обра-
курсе информатики согласованные определе- ботанные специальным образом для принятия
ния основных понятий информатики – инфор- решений, информация (выделено мной. – Л. Х.).
мация, данные, документ.
Названные понятия относятся к числу пер- В других случаях эти понятия разделяют. Но
вичных, основных понятий. Они используются в одних работах данные определяются через
при обсуждении весьма разнообразных аспек- информацию: «данные – информация, обрабо-
тов информационной деятельности, и потому танная и представленная в формализованном
объективно существует большое количество виде для дальнейшей обработки»2, а в других –
разнообразных определений этих понятий. информация определяется через данные: «ин-
Эти определения отражают различные точки формация (выделено мной. – Л. Х.) – это смысл,
зрения на информационную деятельность. И, к который человек приписывает данным на осно-
сожалению, не всегда эти определения сформу- вании известных ему правил представления в
лированы достаточно точно и непротиворечиво. них фактов, идей, сообщений»3.
Основные противоречия отмечаются в Весьма разнообразны варианты использо-
парах понятий информация – данные и инфор- вания термина «информация» при определении
мация – документ. понятия «документ». В «Общей теории докумен-
В обыденной речи термины «информация» и та и книги»4 приводится 25 определений доку-
«данные» зачастую используются как синонимы: мента. Большинство из них являются варианта-
выражения «информация о выпуске продукции» ми утверждения «Документ есть материальный
и «данные о выпуске продукции» воспринима- объект, содержащий информацию» (которое мы
ются одинаково. И даже в терминологических будем обсуждать далее), но при этом одни опре-
изданиях информация определяется через дан- деления строятся в форме «Документ – это ин-
ные, а данные – через информацию. Например, в формация, зафиксированная на материальном
Современном экономическом словаре1: объекте…», другие в форме «Документ – это ма-
териальный объект с зафиксированной на нем
Информация – 1) любое сообщение о чем- информацией…».
либо; 2) сведения, данные, значения экономиче- Неудачные определения приводят к не-
ских показателей, являющиеся объектами хра- разберихе в понятиях. Например, Ю. Н. Столя-
нения, обработки и передачи и используемые в ров показывает противоречивость терминов
процессе анализа и выработки экономических в ГОСТ 7.0–99: «Информационные ресурсы де-
решений в управлении. финируются как „совокупность данных, органи-
Данные – 1) факты и характеризующие их зованных для эффективного получения досто-
числовые, количественные показатели: имена, верной информации“. В том же ГОСТе данные
даты событий, сведения об экономических определяются как „информация, обработанная

96 Вестник СПбГУКИ · № 1 (18) март · 2014


Документ как структурная единица данных

и представленная в формализованном виде для Физический процесс взаимодействия систем


дальнейшей обработки“. Подставим это опре- (объектов) А и В заключается в том, что в зависи-
деление в понятие „информационные ресурсы“: мости от значений характеристик разнообразия
информационные ресурсы – совокупность ин- системы А (обозначим его RA) происходит изме-
формации (обработанной и представленной в нение некоторых вещественно-энергетических
формализованном виде для дальнейшей обра- характеристик разнообразия системы В (RB). Эти
ботки), организованной для эффективного полу- изменения реализуются либо в виде изменения
чения достоверной информации. Невнятность, параметров динамических процессов, либо в виде
тавтологичность данного определения в резуль- изменения свойств физических объектов (харак-
тате такой подстановки становится очевидной»5. теристик их внутренней структуры).
Попробуем рассмотреть более согласо- Изменения в характеристиках разнообра-
ванные определения. При этом рассмотрение зия RB неким образом зависят от характеристик
будем вести с точки зрения так сказать «техно- разнообразия RA. Тем самым изменения разно-
логического» подхода, т. е. такого, в котором на образия RB отражают состояние разнообразия
первый план выдвигается не оценка смысла RА. А. Д. Урсул отмечает, что отражение «выража-
информационных сообщений, а такие аспекты, ется в том, что из всего содержания взаимодей-
как структура информации и данных, методы ствия выделяется лишь то, что в одной системе
хранения и обработки данных, способы реали- появляется в результате воздействия другой си-
зации информационного поиска и т.п.6 Эта точка стемы и соответствует (тождественно, изо- или
зрения характерна для науки «информатика», в гомоморфно) этой последней»10.
то время как содержание информации является Те значения характеристик разнообразия
предметом рассмотрения других наук и обла- RA, которые повлияли на изменение разнообра-
стей применения. зия RB, суть сведения об объекте А. Эти сведения
Нам представляется, что сформулированная и есть информация, передаваемая источником.
в данной статье терминология может быть по- Взаимодействие между объектами А и В –
лезной при рассмотрении основных информа- это процесс передачи сведений: сведения о со-
ционных понятий и в других областях. стоянии разнообразия RА перенеслись в какие-
то характеристики состояния разнообразия RB,
1. Информация и данные возникшего в результате взаимодействия.
Процесс передачи сведений от объекта А к В,
Информация есть отражение реального как правило, представляется как последователь-
мира. Существуют различные точки зрения на ность нескольких (элементарных) отражений,
содержание этого отражения, способы отра- связанных с последовательностью физических
жения, выявления смысла отражаемого и, со- взаимодействий – физических процессов. Каждое
ответственно, разные определения основных физическое взаимодействие, как уже упомина-
понятий, связанных с информацией и инфор- лось, приводит к изменению либо параметров
мационными процессами. Весьма подробно эти динамических процессов, либо свойств физиче-
вопросы рассматриваются, например, в книге ских объектов. Разнообразие, характеризуемое
А. В. Соколова «Философия информации»7. значениями параметров динамических процес-
По определению В. М. Глушкова «информа- сов, само динамично, постоянно меняется, преоб-
ция в самом общем ее понимании представляет разуется в разнообразие, связанное с последую-
собой меру неопределенности распределения щими процессами взаимодействия. Результаты же
материи и энергии в пространстве и во времени, изменения характеристик физических объектов
меру изменений, которыми сопровождаются все статичны, они могут сохраняться во времени до
протекающие в мире процессы»8. Эти процессы тех пор, пока не будут изменены в процессе ка-
протекают как в материальном мире, так и в ду- кого-нибудь другого процесса взаимодействия.
ховном мире, мышлении людей. Два физических объекта могут взаимодей-
А. Д. Урсул называет неоднородность рас- ствовать друг с другом только посредством свя-
пределения материи в пространстве и времени, зывающего их динамического процесса. В этом
неравномерность протекания процессов на всех случае взаимодействие объектов А и В состоит
уровнях движения и эволюции в мироздании как минимум из двух взаимодействий: объекта
разнообразием и связывает понятие инфор- А с динамическим процессом ψ и процесса ψ
мации с отражением разнообразия9. С каждым с объектом В. Параметры динамического про-
объектом (системой) связано свое разнообра- цесса ψ отражают сведения об объекте А, а све-
зие, свои характеристики неоднородности рас- дения о процессе ψ (а, значит, и об объекте А)
пределения материи и неравномерности про- фиксируются в значениях характеристик физи-
текания процессов. ческого объекта В.

97
Л. А. Ходоровский

Если объект В – физический объект, то письма (в рукописном, печатном или электрон-


состояние его вещественно-энергетических ном виде), и картина художника, и молекула
характеристик, возникшее в результате взаи- ДНК, и следы падения Тунгусского или Челябин-
модействия (разнообразие RB), представляет ского метеорита.
собой данные, в которых отражены сведения Вышеприведенная дефиниция данных четко
об объекте А. разделяет понятия информация и данные. Это
Вышесказанное можно резюмировать, позволяет устранить неразбериху, например,
вводя следующие определения: в ситуации, на которую указал Ю. Н. Столяров:
Процесс передачи информации от А к «Из определения информационных ресурсов
В – физическое взаимодействие, в результате как „совокупности данных, организованных
которого характеристики разнообразия объ- для эффективного получения достоверной ин-
екта А отражаются в изменении разнообразия формации“ после подстановки определения
объекта В. „данные – это результат фиксации, представле-
Передаваемая информация – сведения об ния информации на каком-либо материальном
источнике, т. е. совокупность тех значений ха- носителе“ получается вполне корректная фраза:
рактеристик разнообразия объекта А, которые „информационные ресурсы – совокупность
повлияли на изменение характеристик разноо- результатов фиксации, представления инфор-
бразия объекта В. мации на каком-либо материальном носителе,
Сигнал – динамический физический про- организованных для эффективного получения
цесс, реализующий взаимодействие объектов достоверной информации“»11.
А и В, влияющий на изменение разнообразия Информацию, циркулирующую в челове-
объекта B в соответствии с состоянием разно- ческом обществе, в настоящее время часто
образия объекта А. называют «семантической». В «Философии ин-
Фиксация (регистрация) сигнала – измене- формации» А. В. Соколов приводит определе-
ние свойств физических объектов (характери- ние: «Семантическая информация – смысловое
стик их внутренней структуры) под действием сообщение, выраженное знаками (одним знаком
сигнала. или их организованной последовательностью).
Материальный носитель данных – физиче- Под смыслом сообщения понимаются знания,
ский объект, характеристики которого меняются умения, эмоции, волевые побуждения, фанта-
под действием сигнала. зии, являющиеся продуктами индивидуальной
Данные – результат фиксации (регистра- психической деятельности, которые могут быть
ции) сигнала на материальном носителе, т. е. поняты другими людьми. Понимание – необхо-
совокупность тех характеристик разнообразия димое условие движения семантической инфор-
объекта В, в которых отражаются сведения о мации. Организованная последовательность
разнообразии объекта А. знаков представляет собой текст»12. (Заметим,
Сам по себе физический процесс «не имеет что точнее было бы называть текстом организо-
цели» нести информацию. Об информации ванную совокупность (не обязательно последо-
имеет смысл говорить только в том случае, вательность) знаков).
когда этот процесс начинают рассматривать Таким образом, информация выражается
как сигнал. текстом. Под понятие текста подпадают и ре-
Процесс взаимодействия систем «не знает», зультаты регистрации показаний прибора, и
что он связан с отражением (оценкой разноо- картина художника, и запись симфонического
бразия) и с информацией. Он просто происхо- концерта и пр. При этом текстом может быть и
дит. Результаты изменения характеристик мате- сигнал (концерт симфонического оркестра) и
риального носителя «не знают», что они данные данные (запись этого концерта).
и отражают информацию. Они просто возникают
в процессе взаимодействия. 2. Данные
Но если рассматривать взаимодействие в и информационная коммуникация
рамках «информационного подхода», опреде-
ления сигнала и данных могут быть сформули- Информация – понятие, связанное с пред-
рованы так. ставлением о коммуникации, передаче чего-то
Сигнал – динамический физический про- от источника к получателю. Это очевидным об-
цесс, реализующий процесс передачи инфор- разом выступает в определении, данном в БСЭ:
мации.
Данные – результат фиксации, представ- Информация, первоначально – сведения,
ления информации на материальном носителе. передаваемые людьми устным, письменным
Например, данные – это и текст книги или или другим способом (с помощью условных

98 Вестник СПбГУКИ · № 1 (18) март · 2014


Документ как структурная единица данных

сигналов, технических средств и т. д.); с середи- хронно), когда результаты духовной или мыс-
ны XX в. – общенаучное понятие, включающее лительной деятельности передаются автором
обмен сведениями между людьми, человеком и получателю в устной форме, либо в режиме от-
автоматом, автоматом и автоматом, обмен сиг- ложенного общения (диахронно), когда сначала
налами в животном и растительном мире, пере- создается некий текст, а затем, через неопреде-
дачу признаков от клетки к клетке, от организма ленный отрезок времени этот текст восприни-
к организму. мается получателем.
Очевидно, что в режиме отложенного об-
В приведенном определении информация – щения исходящий от источника текст вначале
это то, что источник передает получателю. должен быть зарегистрирован на носителе
Не менее известным является определение, в виде данных, а через некоторое время из-
данное в ГОСТ 7.0–99: влечен из этих данных получателем (а, может
быть, и никогда никем не извлечен). В режиме
Информация – сведения, воспринимаемые непосредственного общения, казалось бы, не
человеком и (или) специальными устройствами требуется использование промежуточной сущ-
как отражение фактов материального или духов- ности – данных. Однако, на самом деле, сигналы,
ного мира в процессе коммуникации. получаемые человеком, после первичного пре-
образования на короткое время откладываются
В этом определении информация – это то, (фиксируются) в кратковременной (оператив-
что воспринимает получатель. ной) памяти, а затем уже поступают в дальней-
Это не случайно. Дело в том, что процесс шую обработку, результаты которой загружают-
информационной коммуникации содержит, как ся в долговременную память.
минимум, два этапа, два взаимодействия: Таким образом, и в случае, когда источни-
этап 1 – Сигнал от источника информации ком информации являются результаты духовной
доходит до носителя данных, преобразуется и или мыслительной деятельности, первым эта-
фиксируется на нем в виде данных; пом коммуникации является выдача передавае-
этап 2 – Данные передаются получателю, ко- мых сведений источником и фиксация их в виде
торый вычленяет, воспринимает содержащуюся данных на материальном носителе.
в данных информацию. Второй этап коммуникационного процес-
Первый этап коммуникационного про- са: данные – приемник. На этом этапе сведения,
цесса: источник – данные. В качестве источни- смыслы, зафиксированные в данных, извлекаются
ка информации могут выступать как процессы из данных, если нужно, преобразуются и поступа-
реального мира, так и процессы выражения ют в распоряжение воспринимающей системы.
результатов духовной и мыслительной деятель- Роль такой системы может играть конкретный
ности человека. человеческий мозг, конкретный мозг животного,
Пусть источник информации – процессы наследственная система конкретного организма
реального мира. Эти процессы сами по себе не или совокупность специальных программ в ком-
ориентированы на наличие или отсутствие на- пьютере. Третий вид воспринимающей системы
блюдателя этих процессов. Они становятся ис- при желании можно считать подвидом первого –
точниками информации (сигналами), если рас- ведь исполнение программ в компьютере можно
сматриваются с точки зрения участия в процессе считать особым способом проявления деятель-
коммуникации, а результаты фиксации сигнала ности человеческого мозга, инструментально
на материальном носителе тех особенностей поддерживаемой компьютером.
сигнала, которые служат для отражения разно- На пути от данных к приемнику можно
образия, рассматриваются как данные. выделить два шага. На первом шаге происхо-
Пусть теперь источник информации – ре- дит «считывание» данных, преобразование их
зультаты духовной и мыслительной деятель- в текст, понятный воспринимающей системе.
ности человека. Такие источники информации На втором шаге этот текст играет роль входной
предполагают наличие получателя информации: информации, которая далее обрабатывается
так, результаты мышления выдаются в виде тек- совместно с другой информацией (знаниями),
стов (устных или письменных), предназначенных известной воспринимающей системе (т. е., в тер-
для восприятия слушателем (читателем); лице- минологии работы Ю. А. Шрейдера13, совместно
действо актера рассчитано на восприятие его с тезаурусом воспринимающей системы). Итогом
зрителем и т.п. (В частности, информация может такой обработки является получение актуаль-
быть направлена и самому себе). ной информации – результата коммуникации
Передача информации происходит либо между источником и получателем. Существен-
в режиме непосредственного общения (син- нейшее влияние на результат оказывает при

99
Л. А. Ходоровский

этом то, какие знания доступны воспринимаю- ции от источника (реальная действительность)
щей системе и как она умеет ими пользоваться. к данным, выступающим как приемник инфор-
Можно назвать первый этап этапом коди- мации, этапу декодирования соответствует про-
рования (информация «кодируется» и «записы- цесс передачи информации от данных (выступа-
вается» в виде данных), а второй этап – этапом ющих как источник) к оконечному получателю
декодирования (данные поступают в распоря- информации, а между этими этапами возникает
жение воспринимающей системы, которая «де- промежуточный этап хранения данных, т. е. про-
кодирует» данные, выделяет из них информа- цесс передачи информации во времени:
цию). В целом процесс передачи и получения
информации представляется такой схемой: Источник – кодирование →
Данные – хранение →
Источник – кодирование → Данные –декодирование → Приемник
Данные – декодирование → Приемник
Информация, т. е. сведения о распределе-
Например, кодирование информации о том, нии материи и энергии, об изменениях в про-
как выглядит поверхность Луны, заключается в цессах – суть знания человека об окружающем
том, что эта поверхность отражает солнечные мире, в том числе о человеческой деятельности.
лучи, отраженный свет достигает Земли, попа- Как отмечает Б. А. Семеновкер, «разница
дает (например) на фотопленку и производит между знанием и информацией заключается в
на ней определенные физические изменения. том, что они характеризуют человеческое по-
Изображение, закрепленное на пленке – это и знание с разных сторон: знание – с гносеоло-
есть данные. Декодирование данных может за- гической, информация – в основном с комму-
ключаться в следующем: изображение с пленки никативной. Информация – это знание, которое
преобразуется (выводится на экран или печа- существует не только для данного человека, но
тается в виде фотографии), результат преоб- и для других людей»14.
разования воспринимается зрением человека, Таким образом, вся информации, употребляе-
преобразуется к внутреннему представлению, мая человечеством в его деятельности, воплоща-
обрабатывается мозгом человека с привлечени- ющая интеллектуальный и духовный потенциалы
ем известных человеку знаний, и воспринима- человечества, хранится в форме данных.
ется, как актуальная информация, поступившая Поэтому вместо известного образа «океаны
приемнику (человеку) от источника (поверхно- информации», уместнее был бы образ «конти-
сти Луны). ненты данных». А вместо терминов «информа-
А. С. Пушкин закодировал свое очарование ционный процесс», «хранилище информации»
осенней порой в нескольких словах: «В багрец точнее было бы употреблять «процесс обработ-
и золото одетые леса». Этот текст и есть данные. ки данных», «хранилище данных».
А декодирует эти данные каждый читатель по- Но эти термины не прижились в русском
своему. И есть основания полагать, что инфор- языке, может быть еще и потому, что слово
мация, полученная в результате декодирования «данные» грамматически неудобное, от него
этого текста жителем средней полосы, намного нельзя, например, образовать прилагательное
точнее отображает картину, очаровавшую поэта, и пр. Поэтому, несмотря на все вышесказанное,
чем результат декодирования жителем Крайне- нет смысла требовать строгого разграничения
го севера или джунглей (даже хорошо знающим понятий «информация» и «данные» в обыденной
русский язык). и даже, подчас, профессиональной речи. В конце
Вышеприведенная схема соответствует концов, потребителя интересует информация, а
схеме коммуникации «источник – передатчик – не способ ее упаковки. Однако в узко професси-
канал – получатель – потребитель». В этой ком- ональных целях (которым и посвящена насто-
муникации участвует два вида информации: ящая статья) необходимо четко соблюдать это
сначала исходная информация источника фик- разграничение.
сируется в данных, затем воспринимаемая ин- Данные – это результат фиксации любой ин-
формация извлекается из данных получателем. формации, однако, зачастую предпринимаются
Данные в этой схеме играют роль канала. попытки каким-либо образом ограничить сферу
Несколько более подробный анализ про- действия этого понятия.
цесса передачи информации показывает, что Например: «Данные суть факты, идеи, сведе-
данные могут выступать в нескольких ролях. ния, представленные в знаковой (символьной)
Весь процесс передачи информации можно раз- форме, позволяющей производить их передачу,
бить на три части, три процесса. Этапу кодирова- обработку и интерпретацию, а информация – это
ния соответствует процесс передачи информа- смысл, который человек приписывает данным

100 Вестник СПбГУКИ · № 1 (18) март · 2014


Документ как структурная единица данных

на основании известных ему правил представ- Информатика рассматривает общие зако-


ления в них фактов, идей, сообщений. Структу- номерности и процедуры обработки данных, а в
рированная информация, т. е. связанная при- конкретных областях деятельности рассматрива-
чинно-следственными и иными отношениями ются проблемы их конкретного применения. В этом
и образующая систему, составляет знания»15. смысле информатика похожа на математику.
Возникают вопросы: «А что это за факты, Например, математиками была разрабо-
идеи, сведения? Откуда они взялись? Разве в тана теория дифференциальных уравнений в
них не отражена какая-то информация? А знания частных производных, она используется для
(структурированная информация) должны как- решения многих проблем, в частности, физик
то представляться и храниться? Разве не в виде Дж. Максвелл использовал эти уравнения для
данных?». Поэтому было бы корректнее сказать: описания теории электромагнитного поля.
Аналогично: достижениями информатики
Исходная (первичная) информация (факты, являются теория реляционных баз данных (РБД)
идеи, сведения) фиксируется в виде данных. и разработка конкретных систем управления
Воспринимаемая информация – это смысл, кото- этими базами данных, а вариантам использова-
рый человек приписывает данным на основании ния РБД во всевозможных областях деятельно-
известных ему правил представления в них фак- сти несть числа.
тов, идей, сообщений. Полученная в результате
обработки вторичная структурированная ин- 4. Документ и данные
формация (связанная причинно-следственными
и иными отношениями и образующая систему), Рассмотрим теперь вопросы, связанные со
составляет знания, фиксируемые в виде данных. структурой рассматриваемых «информацион-
ных сущностей». В процессе фиксации информа-
Т. е. и более «простые» сведения, и более ции происходит занесение некоторой «порции
«сложные» (знания) – это все информация, а дан- информации» на какой-то материальный но-
ные – это результат фиксации как «простой», так и ситель в виде текста, представляющего собой
«сложной» информации. Поэтому можно говорить «порцию данных». Будем далее «порцию инфор-
о разных типах данных, играющих разную роль в мации» обозначать термином «сообщение».
процессах обработки информации. Так, например При непосредственном общении «порция
данные, используемые в языке логического про- данных» сразу же поступает в «обработку», т. е.
граммирования Пролог16, подразделяются на два реализуется передача данных в режиме «адре-
типа: факты («простые» утверждения) и правила сант – адресат». При отложенном общении «пор-
(«сложные» утверждения, знания). ция хранимых данных» поступает к получателю в
режиме поиска: «запрос – ответ». По инициативе
3. Информатика и данные получателя задается запрос, в соответствии с ко-
торым воспринимающая система выдает ответ.
В последнее время ведется много разгово- Для обеспечения этого процесса необходимо,
ров о расширении понятий о науке «информа- чтобы воспринимающая система могла найти ту
тика». Однако если говорить об информатике «порцию данных», где зафиксировано нужное
в рамках, соответствующих той науке, которую сообщение.
называют Computer Science, то предметом ее Поэтому важнейшими вопросами построе-
изучения являются именно данные: методы их ния процесса обработки информации (данных)
создания, хранения, обработки и передачи. являются вопросы о том, какова структура дан-
А сама информация, зафиксированная в ных и как сопоставляются «порция информа-
данных, ее содержательный смысл интересны ции» (сообщение) и соответствующая ей «пор-
пользователям информационных систем, явля- ция данных» (текст).
ющихся специалистами различных наук и об- Структура данных определяется, прежде
ластей деятельности: медика интересует меди- всего, структурой материального носителя,
цинская информация, геолога – геологическая, на котором находятся данные. Материальный
предпринимателя – коммерческая и т. п. (в том носитель представляется как совокупность не-
числе специалиста по информатике интересует которых «кусков», т. е. материальных объектов
информация по вопросам работы с данными). с определенными физическими свойствами.
Этим специалистам интересны также и по- В качестве материального объекта может высту-
граничные между информатикой и конкретной пать лист бумаги, сброшюрованная пачка листов
областью деятельности методы преобразования бумаги, магнитный или оптический диск, кусок
информации в данные и извлечения информа- холста и др.
ции из данных. Все пространство хранения данных – это

101
Л. А. Ходоровский

совокупность материальных объектов, на ко- Документ = Объект + Текст + Сообщение.


торых зафиксированы те или другие данные.
Таким образом, основным структурным эле- Учитывая распространенную в обиходе
ментом данных является совокупность данных, практику смешения понятий «информация» и
расположенных на одном материальном объ- «данные», можно считать, что в большинстве
екте. Такую совокупность обычно связывают с случаев вместо определений О1 и О2 можно
понятием «документ». использовать определение:
Не всякий материальный объект с зафикси- Определение О3. Документ – это идентифи-
рованными на нем данными является докумен- цируемый материальный объект, содержащий
том. Например, только что найденный в Великом информацию.
Новгороде кусочек берестяного письма не явля- Таким образом, документ представляет
ется документом, и станет им тогда, когда будет собой особый тип объектов: Документ – это
зафиксировано, где и когда он был найден, а сам объект, отличающийся от обычного объекта тем,
кусочек получит учетный номер. что он содержит информацию.
Для того чтобы выбрать объект, иденти- Определение О3 отражает две разные ипо-
фицировать его, нужно знать его характери- стаси документа, в соответствии с которыми он
стики, отличающие его от других объектов. может быть интересен потребителю: «что это
Если выбор осуществляет непосредственно за информационный объект» и «про что он».
человек, он может ориентироваться как на А именно: иногда интересно иметь сведения о
«информационные» характеристики объекта документе как объекте, о его правовом статусе
(название, автор, год издания, текстовое опи- и других характеристиках, в том числе, может
сание и пр.), так и на характеристики, воспри- быть, и об информации, отражаемой в этом до-
нимаемые чувственно (цвет, форма, размер, кументе. В других случаях потребителя интере-
вид носителя и пр.). Например: «Дедушкина сует собственно информация о чем-то, в том
толстая синяя записная книжка». Если же числе, может быть, сведения о документе (объ-
поиск осуществляется с помощью вспомо- екте), содержащем эту информацию.
гательных средств (каталоги, компьютер), то Там же, где требуется определенная точ-
объект можно идентифицировать только «ин- ность, специалисту может быть интересен и
формационно», с помощью таких характери- третий аспект – вопрос о том, как устроены
стик как шифр, инвентарный номер, и т. п. данные рассматриваемого документа: какова
С учетом вышесказанного введем следую- их структура, объем, на каком языке написан
щее определение понятия «документ». документ и пр.
Определение О1. Документ – это идентифи- В частности, так как документ – элемент дан-
цируемый материальный объект, содержащий ных, он выполняет функции, присущие данным.
данные. Т. е. документ может рассматриваться как канал
Читатель нашей статьи знает, что данные – передачи информации, он может играть роль
результат фиксации, отображения информации приемника информации, источника информа-
на материальном носителе. Однако так как бы- ции, может выполнять функции хранения ин-
тует несколько пониманий термина «данные», формации.
имеет смысл отразить нужное понимание этого Свойства материальных объектов, явля-
термина прямо в определении документа: ющихся документами, принято называть рек-
Определение О2. Документ – это идентифи- визитами документа. Это – название объекта
цируемый материальный объект, содержащий (если оно есть), вид материального носителя,
данные, отображающие некоторую информацию. его объем, местонахождение и др. Некоторые
Строго говоря, определение О2 избыточно, из реквизитов играют роль идентифицирующих
но в ряде случаев может быть более приемле- реквизитов, позволяющих отличить один доку-
мым, чем О1. мент от других.
В соответствии с определением О2 можно Подчеркнем: с помощью реквизитов можно
описать документ формулой, в которой отмече- идентифицировать документ как объект; можно
на связь между тремя составляющими докумен- идентифицировать фрагмент данных (если это
та: объект, данные, информация: позволяет структура данных). Но нельзя иден-
тифицировать информацию – смысл сообще-
Документ = Объект + Данные + Информация. ния. Однако, в стандарте ГОСТ Р 51141–98 «Де-
лопроизводство и архивное дело. Термины и
По-другому, учитывая то, что данные пред- определения» говорится: «Документированная
ставляются текстом, а содержащаяся в них ин- информация (документ) – зафиксированная на
формация есть сообщение: материальном носителе информация с рекви-

102 Вестник СПбГУКИ · № 1 (18) март · 2014


Документ как структурная единица данных

зитами, позволяющими ее идентифицировать». ходных данных самой книги, а метаданные об


Здесь непонятно, что значит «реквизиты, позво- экспонатах музея могут быть сосредоточены в
ляющие идентифицировать информацию». В со- каталогах и описях.
ответствии с приведенными выше дефинициями Приведенное выше определение доку-
следовало бы говорить: «Документированная мента (О1) носит формальный характер, опре-
информация (документ) – информация, зафик- деляет документ как структурный элемент
сированная в виде данных на материальном данных с самой общей точки зрения. Однако
объекте, с реквизитами, позволяющими иден- в социальной деятельности документ важен,
тифицировать этот объект». Интересно, что при- прежде всего, с точки зрения его участия в до-
веденное в этом ГОСТе определение приводится кументационных процессах. Так, по дефиници-
и в Федеральном законе 1995 г. «Об информа- ям Е. А. Плешкевича, «под документом в рамках
ции, информатизации и защите информации»17. общей теории документа мы понимаем инфор-
Однако в Федеральном законе 2006 г. «Об ин- мационное сообщение, зафиксированное на ма-
формации, информационных технологиях и за- териальном носителе и включенное в информа-
щите информации»18 дефиниция дается более ционно-документационную систему с помощью
(хотя, на наш взгляд, и недостаточно) аккуратно: метаинформации, содержащейся в реквизитах».
«Документированная информация – зафикси- А информационно-документационная система –
рованная на материальном носителе путем до- это «искусственно созданная сложная система
кументирования информации с реквизитами, социальной информации, в рамках которой про-
позволяющими определить такую информацию исходит информационное и документационное
или в установленных законодательством Рос- обеспечение социальной деятельности»19.
сийской Федерации случаях ее материальный Разные информационно-документационные
носитель». системы могут предъявлять разные требования
В обиходе под документом, чаще всего, к понятию «документ» и к способам его иден-
понимаются правовые (постановления, указы, тификации: к юридическим документам, про-
паспорта, договоры и т. д.) и управленческие изводственным документам, книгам и пр. В со-
(приказы, директивы, ведомости, справки) до- ответствии с этим требуется уточнить характер
кументы. Однако документом являются и книга, взаимосвязи понятий «материальный объект» и
и фильм, и картина художника, и экспонат музея. «данные», упомянутых в определении О1.
Экспонат из коллекции минералов (камень) Во-первых, документ как структурная
может сам по себе быть носителем данных, в единица может включаться в более крупные
роли которых выступают его форма, цвет, струк- структурные образования – более сложные
тура и другие признаки, несущие информацию, документы, а также в коллекции (собрания,
понятную специалисту по минералогии. Но сам совокупности) документов. Такую коллекцию,
по себе он не может быть документом. Для того имеющую идентифицирующие ее реквизиты,
чтобы рассматривать его как документ, нужно конечно, тоже следует рассматривать как доку-
приложить (или приклеить) к нему этикетку, мент. Например, документ «личное дело сотруд-
на которой он определен как объект – указан ника» включает документы «анкета», «приказ»
номер этого экспоната, его название и некото- и прочее. Однако такой документ может пред-
рые характеристики (или только номер в кол- ставлять из себя не один материальный объект,
лекции, если существует еще один текст, в кото- а совокупность материальных объектов, иден-
ром дано описание всей коллекции). тифицируемую как единый объект.
Главная суть документа – запечатленная Во-вторых, совокупность данных, зафик-
в его данных информация. Но для того, чтобы сированных на одном материальном объекте,
извлечь эту информацию, могут потребовать- может иметь сложную структуру, состоять из
ся дополнительные сведения: значения иден- таких частей, каждая из которых содержит от-
тифицирующих реквизитов документа, описа- дельное завершенное сообщение и может рас-
ние физических характеристик материального цениваться как отдельный документ в рамках
объекта, структуры данных, их особенности соответствующей информационно-документа-
(язык, объем, шрифт и пр.). Эти сведения при- ционной системы. Например: юридические акты
нято называть метаданными (иногда часть этих в сборнике юридических документов, статьи в
сведений, описывающую структуру собственно периодическом издании и пр. Т. е. в общем тек-
информации, называют метаинформацией). Ме- сте (данных) на одном материальном объекте
таданные могут располагаться как на том же ма- можно выделить тексты нескольких докумен-
териальном объекте, где и текст информацион- тов. Чтобы можно было отдельно использовать
ного сообщения, так и, частично, в другом месте. эти тексты, они должны быть оформлены как
Например, метаданные о книге печатаются в вы- отдельные фрагменты данных, идентифициру-

103
Л. А. Ходоровский

емые внутри общего текста: заголовком, адре- коловым дополнительные признаки выделены
сом в оглавлении и пр. Каждый такой фрагмент нами: «Документ – это стабильный веществен-
соотносится не со всем материальным объек- ный объект, предназначенный для использова-
том, а с некоторой его областью. Идентифика- ния в социальной смысловой коммуникации в
ция такого фрагмента включает идентификацию качестве завершенного сообщения»20.
материального объекта плюс идентификацию Иногда на понятие документа наклады-
фрагмента в общем тексте. Какие фрагменты ваются дополнительные условия. Например,
считать документами и как их идентифициро- А. В. Венгеров утверждает: «Именно такой при-
вать (например, считать ли главы и параграфы знак документа, как его юридическое значение,
в книге документами или нет) – это зависит от отличает документ от других носителей инфор-
соглашений соответствующей информационно- мации, фиксирующих объективную действитель-
документационной системы. ность и мыслительную деятельность человека».
С появлением компьютера возникло поня- И потому «документом является носитель такой
тие «электронный документ», т. е. документ, в информации, содержанию и способам фиксации
котором информация (сообщение) представле- которой действующее законодательство прида-
на в электронно-цифровой форме. ет определенное правовое значение»21.
По отношению к электронному документу С нашей точки зрения в основу понятия
применение понятия «материальный объект» «документ» следует положить определение О4,
становится достаточно условным. В роли доку- однако в каждой области деятельности долж-
мента может выступать компакт-диск («матери- ны определяться дополнительные требования
альный объект» без сомнения), или файл (т. е. к видам объектов, организации данных, инфор-
поименованный участок внешней памяти ком- мационному содержанию документов, отража-
пьютера, что можно с натяжкой назвать «матери- ющие специфику документов данной области
альным объектом»), или часть файла (что трудно деятельности.
назвать «материальным объектом»). Однако в В разных определениях на первый план вы-
любом случае под электронным документом по- ступает то объект, то информация. Например, в
нимается некоторая идентифицируемая сово- стандарте ГОСТ 16487–70 «Делопроизводство
купность данных, обособленная либо привязкой и архивное дело. Термины и определения» до-
к идентифицируемому материальному объекту, кумент определяется как «материальный объект
либо каким-либо другим способом. с информацией, закрепленной созданным чело-
Назовем идентифицируемым объектом веком способом для ее передачи во времени и
либо отдельный идентифицируемый материаль- пространстве». А в редакции того же стандарта
ный объект, либо совокупность материальных от 1998 г. (ГОСТ Р 51141–98) приводится (уже
объектов, идентифицируемую как один объект, рассмотренное нами выше) определение: «До-
либо область на идентифицируемом материаль- кументированная информация (документ) – за-
ном объекте, содержащую идентифицируемый фиксированная на материальном носителе
фрагмент данных. информация с реквизитами, позволяющими ее
Тогда определение документа можно моди- идентифицировать».
фицировать таким образом: В нашем определении документ – это ма-
Определение О4. Документ – идентифици- териальный объект. Во многих дефинициях упо-
руемый объект, содержащий данные. требляется термин «материальный носитель».
Определение О4 обобщает три предыду- Например: «Документ – это материальный
щих, но остается максимально лаконичным: в носитель с зафиксированной информацией,
нем не накладывается никаких ограничений предназначенный для ее сохранения и пере-
на данные, зафиксированные в документе, и на дачи во времени и в пространстве, пригодный
содержание информации, отражаемой в них: для использования в документационных про-
полезная или бесполезная, достоверная или цессах»22. Однако этот термин используют не
ложная, завершенная или нет – лишь бы был только в смысле «материальный объект», но и
распознаваемый объект и знаки на нем. для обозначения вида материальной среды (бу-
В практической деятельности предполага- мага, магнитная лента, полупроводник и пр.), и
ется, что документ должен содержать осмыс- для обозначения физического процесса, лежа-
ленную информацию, должен использоваться щего в основе сигнала (электромагнитное излу-
в рамках определенной информационно-доку- чение, звуковые волны и пр.). Поэтому термин
ментационной системы. Поэтому в определени- «материальный объект» предпочтительнее (в
ях документа наличествуют дополнительные (по частности, его употребление подчеркивает, что
сравнению с определением О4) признаки поня- каждый документ – это нечто, четко отделяемое
тия. Например, в определении, данном А. В. Со- от других документов). Кроме того, как будет по-

104 Вестник СПбГУКИ · № 1 (18) март · 2014


Документ как структурная единица данных

казано далее, в качестве поисковых признаков ся с ситуацией нечеткого разделения понятий


документа могут выступать именно свойства «информация», с одной стороны, и «данные»,
соответствующего объекта. «документ», с другой стороны. Исходя из текста
В дефиниции, которую дает Г. Н. Швецова- определения, более естественно было бы на-
Водка, документ определяется как единство: звать определяемое «документные ресурсы».
«Документ – это единство информации (со- Ю. Н. Столяров также приходит к выводу, что
общения) и вещественного (субстанциального) термины «информационные ресурсы» и «доку-
носителя, используемое в социальном коммуни- ментные ресурсы» фактически синонимичны25,
кационно-информационном процессе как канал т. е. они определяют одно и то же – совокупность
передачи информации»23. документов. Следовательно, между множеством
К приведенному определению можно документов («документные ресурсы») и множе-
предъявить несколько претензий: ством информационных объектов («информа-
– непонятно, каким образом «единство» ционные ресурсы») существует взаимно одно-
может быть использовано в качестве канала; значное соответствие.
– зачем в определении понятия говорить Не оспаривая пока что данных утвержде-
об эфемерном единстве вместо того, чтобы от- ний, приведем два соображения относительно
метить две конкретные составляющие этого по- различия между терминами «документные ре-
нятия: вещественный носитель и информация, сурсы» и «информационные ресурсы».
зафиксированная на этом носителе; Во-первых, термин «документные ресурсы»
– было бы невредно назвать и третью со- естественно применять тогда, когда информа-
ставляющую – данные; ционное пространство рассматривается как
– в определении указывается, что документ совокупность объектов, содержащих информа-
используется в социальном коммуникационно- цию, т. е. с точки зрения специалиста, обеспе-
информационном процессе как канал передачи чивающего деятельность по предоставлению
информации. Как было показано выше, на самом информации («какие же документы содержатся
деле каналом передачи информации являются в наших ресурсах?»). Термин же «информаци-
данные. Поэтому документ как структурный онные ресурсы» естественно применять тогда,
элемент данных, конечно же, выполняет функ- когда информационное пространство рассма-
цию канала, однако это свойство является для тривается с точки зрения потребителя информа-
документа не определяющим, а производным. ции («какая же информация содержится в наших
Как бы ни было лаконично определение О4, ресурсах?»). Исходя из этого, можно определить
из него следует, что документ характеризуется документные ресурсы как «совокупность доку-
тремя сущностями: объект, данные, информа- ментов», а информационные ресурсы – как «со-
ция. Исследование именно этих составляющих вокупность сообщений».
является важной методической основой для Во-вторых, если уж вышеупомянутые терми-
анализа свойств документов. Например, при ны синонимичны, то с точки зрения сложившей-
рассмотрении общей теории документа в выше- ся языковой практики Закон прав: предпочти-
названной работе Г. Н. Швецова-Водка отводит тельнее называть ресурсы «информационными»,
отдельные главы для обсуждения информаци- а не «документными».
онной, знаковой и материальной составляющей Однако, по нашему мнению, понятия «до-
документа. кументные ресурсы» и «информационные ре-
Если же рассматривать, например, юри- сурсы» различаются и содержательно.
дические документы, то все три составляющих Данные, которые содержит документ, могут
должны быть рассмотрены с точки зрения пра- иметь весьма сложную структуру. Некоторые
вового значения, которое им придает действу- элементы этой структуры (как обсуждалось
ющее законодательство. выше) могут в соответствии с требованиями
Совокупность документов (электронных соответствующей информационно-документа-
или неэлектронных), используемых потребите- ционной системы сами считаться документами.
лями (всем обществом или некоторой группой), Но зачастую в данных документа могут быть вы-
называется информационными ресурсами. Как делены структурные элементы (совокупности
было определено в Федеральном законе «Ин- данных) такие, что они не считаются докумен-
формационные ресурсы – отдельные докумен- тами, но информация, соответствующая этим
ты и отдельные массивы документов, документы данным, является законченным сообщением и
и массивы документов в информационных си- может представлять интерес для потребителя.
стемах (библиотеках, архивах, фондах, банках Т. е. сообщение, отображаемое в тексте докумен-
данных, других информационных системах)»24. та, само может иметь сложную структуру.
В этом определении мы опять встречаем- Например, реляционная база данных – это

105
Л. А. Ходоровский

файл (объект), содержащий данные, следова- торых является описанием некоторого объек-
тельно, база данных – документ. Данные одного та предметной области.
такого документа содержат сведения о множе- Описываемые объекты могут быть двух
стве разнообразных объектов26. Так, база дан- видов – документы и не документы, т. е. прочие
ных об оборудовании предприятия содержит (материальные, мыслимые и др.) объекты. Прин-
сведения о составе оборудования, регламен- ципиальная разница между этими видами в том,
тах ремонтов, планах ремонтов и технического что описание обычного объекта (не документа)
обслуживания, отметки о фактическом выпол- представляется как совокупность значений су-
нении этих планов и пр. Информация об одном щественных свойств этого объекта. А описание
объекте представляется данными, соответству- документа – это описание его как идентифици-
ющими одной строке одной из таблиц этой руемого объекта (т. е. совокупность значений
базы данных. Эта информация вполне может его свойств, в том числе идентифицирующих),
рассматриваться как завершенное сообщение. плюс – некоторое описание текста документа
Данные, содержащие это сообщение, образуют (в частном случае «некоторое описание» может
запись – структурный элемент базы данных, но быть и полным текстом документа).
не являются документом27. Базы данных в зависимости от вида опи-
С изложенной точки зрения понятие «ин- сываемых объектов принято подразделять на
формационные ресурсы» отличается от «до- документальные и фактографические. По ГОСТ
кументных ресурсов», так как «совокупность 7.70–9629 рекомендуются следующие определе-
сообщений» не совпадает с «совокупностью ния типов БД:
документов». В связи с этим можно было бы Документальная – БД, в которой запись
предложить следующие определения: отражает документ и содержит его библиогра-
Документные ресурсы – отдельные до- фическое описание и, возможно, иную инфор-
кументы и отдельные массивы документов, мацию о нем.
документы и массивы документов в информа- Фактографическая – БД, записи в которой
ционных системах (библиотеках, архивах, фон- содержат данные о состоянии внешнего мира,
дах, банках данных, других информационных не опосредованные ссылками на отражающие
системах). их документы.
Информационные ресурсы – сообщения, Фактографические БД подразделяются на
размещенные на документах – элементах доку- объектографические (записи которых содержат
ментных ресурсов. данные об отдельном объекте внешнего мира) и
Указанные различия между двумя типами на базы показателей (записи которых содержат
ресурсов определяют разные подходы в орга- данные о той или иной характеристике (показа-
низации информационного поиска. теле) объектов внешнего мира). Однако харак-
теристика объекта сама может рассматриваться
4. Информационный поиск как объект, поэтому и базы показателей можно
считать объектографическими. Т. е. любые факто-
Документные ресурсы хранятся как в виде графические БД являются объектографическими.
отдельных разрозненных документов, так и в Поэтому можно говорить о двух типах БД:
специально организованных хранилищах до- документальные и объектографические. Объек-
кументов – информационных системах, как не- тографические БД содержат описания обычных
автоматизированных (например, традиционных объектов, документальные – описания объек-
библиотеках и архивах), так и автоматизирован- тов-документов.
ных, содержащих данные в электронной форме. В современных объектографических БД
Основой автоматизированной информа- описание объекта представляется как совокуп-
ционной системы является база данных (БД), ность значений его свойств. Эти описания хорошо
содержащая информацию о той или иной формализованы, им соответствует четко опре-
предметной области. Эта информация пред- деленные структура данных, форматы данных
ставляется как описание некоторого множе- (поэтому объектографические БД называют еще
ства объектов и отношений (связей) между сильно структурированными). Высокий уровень
ними. К таким множествам относятся «соб- формализации позволяет применять для поиска
ственно базы данных, сайты Интернета, реги- языки запроса (например, SQL) с мощными поис-
стры, каталоги, реестры, кадастры, библиотеч- ковыми возможностями и высокой точностью.
ные и архивные фонды, электронные издания, А для того, чтобы описать документ, необхо-
электронные музеи, электронные карты и димо, во-первых, описать его как некий объект,
др.»28. Структурно база данных рассматрива- во-вторых, описать содержание текста (контент)
ется как совокупность записей, каждая из ко- этого документа.

106 Вестник СПбГУКИ · № 1 (18) март · 2014


Документ как структурная единица данных

Таким образом, в документальных БД в опи- Например: «Найди лиц, которые вступили


сании документа, исходя из его двойственной на престол России в XIX в., но не в 1825 г. и по-
природы, можно выделить два компонента: кажи их имена и даты рождения».
– объектографический, т. е. описание соб- Условие поиска в этом запросе представ-
ственно материального объекта и зафиксиро- ляет собой построенное из простых высказы-
ванных на нем данных; ваний, приведенных в скобках, составное вы-
– контентографический (или «содержатель- сказывание вида:
ный»), т. е. описание содержания информации,
ее смысла. (Страна = «Россия») И (Должность = «царь»)
В разных видах документальных БД «весо- И (Год вступления в должность > 1800) И (Год
мость» этих компонентов различна. вступления в должность < 1901) И НЕ (Год всту-
Так, библиографическая БД фактически со- пления в должность = 1825).
держит только объектографический компонент,
т. е. описание свойств документа как объекта Результат поиска будет точным и содержа-
(правда, некоторые из этих свойств – заглавие, щим сведения о четырех царях (если, конечно,
рубрикация – несут содержательную нагрузку). эти сведения имеются в БД).
В полнотекстовой же БД основной компонент – В документальной БД запрос описывается
контентографический. заданием вида: «Найди документы с такими-то
Объектографический компонент описания формальными характеристиками, содержащие
документа – это метаданные. Состав и структура такие-то слова и словосочетания».
метаданных значительно менее формализова- Например: «Найди документы XX в., издан-
ны, чем описания объектов объектографических ные издательством „Наука“, в которых говорится
БД. Метаданные весьма разнообразны: «Набор о русских царях, вступивших на престол в XIX в.,
метаданных о том или ином информационном но не в 1825 г.». В этом запросе придется просить
объекте составляет его метаописание. Объек- выдать документы, содержащие слова «Россия»,
ты метаописаний могут быть весьма различны «царь», «вступление на престол», но не содер-
по уровню: от отдельных записей, документов, жащие «1825».
статей, разделов и глав монографий и научных Условие поиска в этом запросе выглядит,
трудов до огромных сложноструктурированных например, так:
информационных массивов информации, интер-
нет-порталов, крупных архивов и библиотек. (Издательство = «Наука») И (Год издания > 1900)
Структура и состав метаописаний, очевидно, в И (Год издания < 2001) И (Документ содержит
значительной степени должны зависеть от уров- слово «Россия») И (Документ содержит слово
ня, типа и физической природы описываемых «царь») И (Документ содержит словосочетание
информационных объектов»30. «вступление на престол») И НЕ (Документ содер-
В соответствии с этим разработаны разные жит слово «1825»).
языки метаданных, используемые для описания
характеристик документов разных классов – Ду- Это условие поиска весьма приблизительно
блинское ядро, MARC и др. Поэтому при разра- описывает потребности поиска. Например, как
ботке любой информационной системы необхо- задать условие, что вступление на престол про-
димо по возможности четко определить классы изошло в XIX в. – непонятно. А условие отвергать
циркулирующих в ней объектов, определить со- документы, содержащие слово «1825», на самом
став и структуру метаописаний этих объектов и деле отсеивает все документы с этим словом, в
выбрать подходящий язык метаданных. том числе и те, где наряду с вступлением на пре-
Для описания содержания документов в стол в 1825 г. говорится и о других вступлениях
документальных БД обычно используются ин- на престол.
дексы, обеспечивающие возможность ответа Результат поиска по такому запросу будет
на запросы, содержащие высказывания вида содержать много документов, в которых, может
«Документ содержит такое-то слово или слово- быть, содержатся нужные нам сведения, но
сочетание» и их комбинации. пользователь еще сам должен извлечь эти све-
Для сравнения приведем примеры запро- дения из документов (т. е. прочесть их).
сов к объектографической и документальной На улучшение качества описания содер-
БД. В объектографической БД запрос описы- жания документа направлены идеи Semantic
вается заданием вида: «Найди объекты, такие- Web (Семантического Веба). В соответствии
то свойства которых соответствуют поисковому с этими идеями для разных предметных об-
условию, и покажи значения таких-то свойств ластей (ПО) должны разрабатываться специ-
этих объектов». альные описания (онтологии), определяющие

107
Л. А. Ходоровский

16
состав характеристик, отражающих основные Стерлинг Л., Шапиро Э. Искусство программирова-
понятия ПО, и разнообразные связи между ния на языке Пролог: пер. с англ. М.: Мир, 1990.
17
ними. Для представления онтологий разра- Об информации, информатизации и защите инфор-
батываются специальные языки, например, мации: федер. закон № 24-ФЗ от 20 февр. 1995 г. // Собр.
OWL. Понятия, входящие в онтологию, могут законодательства Рос. Федерации. 1995. № 8.
18
быть использованы для описания семантики Об информации, информационных технологиях и
(смысла) документа. Как для представления защите информации: федер. закон № 149-ФЗ от 27 июля
формальных характеристик документа, так и 2006 г. // Рос. газ.: федер. вып. 2006, 29 июля, № 4131.
19
для характеристики его семантики использу- Плешкевич Е. А. Основы обшей теории документа.
ется язык RDF. Саратов: Науч. кн, 2005. С. 95, 98.
20
Использование этих средств, а также более Соколов А. В. Социальные коммуникации: учеб.-
совершенных языков метаданных позволяет метод. пособие. М.: Профиздат, 2001. Ч. 1. С. 107.
21
создавать значительно более точный поиско- Венгеров А. В. Право и информация в условиях
вый образ документа. Повышение уровня фор- автоматизации управления. М.: Юрид. лит., 1978. С. 113.
22
мализации средств описания документа (за счет Справочник информационного работника. СПб.:
использования таких языков, как RDF) должно Профессия, 2005. (Сер. «Библиотека»).
23
привести к созданию более мощных и точных Швецова-Водка Г. Н. Указ. соч.
24
средств поиска и языков запросов, по мощности Об информации, информатизации и защите инфор-
аналогичных SQL. мации: федер. закон.
25
Ю. Н. Столяров. Указ. соч.
26
Примечания В некоторых СУБД (системах управления базами
данных) под базой данных понимается совокупность
1
Райзберг Б. А. и др. Современный экономический из нескольких файлов, при этом данные одного файла
словарь. 5-е изд., перераб. и доп. М.: Инфра-М, 2007. содержат сведения о множестве объектов одного типа.
2
ГОСТ 7. 0–99. Информационно-библиотечная дея- Можно считать документом эту совокупность файлов или
тельность. Термины и определения. М., 2000. каждый файл из этой совокупности.
3 27
Информатика как наука об информации / Р. С. Гиля- Заметим, что хотя сообщение и не документ, но
ревский и др. М., 2006. С. 9–10. оно может быть выведено в виде отчета на экран или
4
Швецова-Водка Г. Н. Общая теория документа и бумагу – и этот отчет уже является документом. Мало
книги: учеб. пособие. М.: Рыбари; Киев: Знання, 2009. того, база данных может содержать данные, которые по
5
Столяров Ю. Н. Документный ресурс: учеб. пособие сути своей являются документами, например, инструк-
для студентов высш. учеб. заведений. М.: Либерея-Бибин- ции по эксплуатации оборудования. В зависимости от
форм, 2009. способа реализации эти инструкции могут находиться в
6
См.: Ходоровский Л. А. Проектирование инфор- отдельных файлах, присоединенных к базе данных, и тогда
мационных систем: нач. этапы: учеб. пособие. М.: Нобель они выступают как отдельные документы. Но возможен
Пресс, 2013. такой способ реализации, когда тексты этих инструкций
7
Соколов А. В. Философия информации: проф.- погружены внутрь базы данных. В этом случае они могут
мировоззр. учеб. пособие. СПб.: Изд-во СПбГУКИ, 2010. превратиться в документ только после вывода их на экран
8
Глушков В. М. Мышление и кибернетика // Вопр. или на бумагу в виде отчета.
28
философии. 1963. № 1. С. 36. Антопольский А. Б. Информационные ресурсы
9
Урсул А. Д. Исследование информационных и России. М.: Либерея, 2004. С. 12.
29
глобальных процессов: междисциплинарные подходы и ГОСТ 7. 70–96. Система стандартов по информации,
связи // Проблемы о-ва и политики. 2012. № 3. С. 154–201. библиотечному и издательскому делу. Описание баз дан-
10
Там же. ных и машиночитаемых информационных массивов. Состав
11
Столяров Ю. Н. Указ. соч. и обозначение характеристик. М.: Стандартинформ, 2008.
12 30
Соколов А. В. Указ. соч. Исследование и разработка системы метаданных
13
Шрейдер Ю. А. Об одной модели семантической для электронных информационных ресурсов и сервисов в
теории информации // Проблемы кибернетики. М.: Наука, фундаментальной науке: отчет о рез. работ по гранту РФФИ
1965. Вып. 13. С. 18–28. № 04–07–90087 / А. Б. Антопольский, В. И. Ауссем, С. А. Блау,
14
Семеновкер Б. А. Эволюция информационной дея- А. И. Жежель. М., 2004 // Информрегистр: науч.-техн. центр.
тельности: бесписьм. о-во. М.: Пашков дом, 2007. С. 10–11. М., 2007–2014. URL: http: // db. inforeg. ru (дата обращения:
15
Информатика как наука об информации. С. 9–10. 30. 11. 2012).

108 Вестник СПбГУКИ · № 1 (18) март · 2014

Вам также может понравиться