Название: Организация работы с документами - Шмелев А.Г.

Жанр: Менеджмент

Рейтинг:

Просмотров: 802


Преимущество языков иерархического типа состоит в простоте индексирования и поиска. Классификация наиболее эффективна в том случае, когда классы в иерархической системе располагаются в естественном порядке и набор классов в течение времени не изменя­ется (т.е. предметы естественно находятся в жесткой иерархической соподчиненности). Например, классификация документов в органи­зации, имеющей стабильную структуру.

ИПЯ фасетного типа основаны на принципах многоаспектной классификации, в которой каждый конкретный класс строится при индексировании по определенным правилам из предварительно за­данных категориальных классов — фасетов. В системах фасетной классификации не ставится задача перечислить все сложные классы. Такие системы предлагают составные элементы, из которых по фа-сетной формуле составляется индекс.

Процедура разработки ИПЯ фасетного типа состоит из следую­щих этапов.

1. Анализ предметной области, для которой составляется клас­сификация. Выделение основных признаков классификации. Эти категории называются фасетами, которые при необходимости более детальной классификации могут делиться на субфасеты и т.д.

2. Все возможные простые классы группируются по фасетам. Каждый простой класс фасета называется фокусом.

3. Обозначение соответствующими шифрами фасетов и фокусов.

4. Установление фиксированной последовательности фасетов в поисковом образе (фасетная формула).

5. Составление алфавитного указателя фасет и фокусов.

Преимущество ИПЯ фасетного типа по сравнению с ИПЯ ие­рархического типа состоит в том, что допускается многоаспектное индексирование, так как существует возможность строить классы из разных сочетаний фокусов и получать любые сочетания заранее вы­бранных характеристик объектов классификации.

На практике иерархическая и фасетная классификация часто используются в сочетании. Например, УДК — универсальная деся­тичная классификация.

Алфавитно-предметная классификация — система классов, каж­дый из которых соответствует определенной теме или одному виду предметов, причем классы расположены в алфавитном порядке имен этих классов.

Основной словарный состав (лексика) ИПЯ состоит из упорядо­ченных по алфавиту множества слов, словосочетаний и фраз ЕЯ.

Алфавитно-предметная классификация содержит:

предметный заголовок — слово, словосочетание или фраза ЕЯ, используемое для обозначения предмета или темы, заголовок может подразделяться на подзаголовки;

предметный словник (лексический состав языка) — упорядочен­ное по алфавиту множество предметных заголовков, используемых для построения алфавитно-предметной классификации;

предметную рубрику — совокупность предметного заголовка с описанием адреса хранения документов, основная тема которых обо­значается этим предметным заголовком.

Алфавитно-предметная классификация предназначена для по­строения каталогов для узко предметного поиска. В таких каталогах под предметными заголовками даются сведения (шифр или библио­графическое описание) документов, предмет которых обозначен дан­ным заголовком.

Порядок составления алфавитно-предметной классификации.

1. Анализ предметной области и выбор тем классификации.

2. Устранение синонимии слов, словосочетаний и фраз, исполь­зуемых в качестве предметнрго заголовка. В случае синонимии мож­но использовать систему ссылок.

3. Выделение основных, ведущих слов в словосочетаниях и фра­зах, используемых в качестве предметных заголовков.

Обозначение парадигматических связей между названиями пред­метов и тем. Эти связи обозначаются с помощью ссылок.

Алфавитно-предметная классификация используется главным образом для информационного поиска по отдельным предметам и темам. И применяется в качестве предметных указателей к катало­гам документов.

Основной недостаток классификационных языков состоит в том, что они не обеспечивают возможности поиска документов по любо­му, заранее не заданному сочетанию признаков.

 

20.2.2. Дескрипторные информационно-поисковые языки

 

Дескрипторные языки семантически более сильны, чем класси­фикационные, но более сложны для формальной обработки.

Дескриптор — ключевое слово или словосочетание, служащее именем класса эквивалентных ключевых слов (синонимов). Как пра­вило, в качестве дескриптора выбирают — одно, наиболее употреби­мое ключевое слово из класса синонимичных ключевых слов.

Внешне координатное индексирование напоминает алфавитно-предметную классификацию. В обоих случаях классы обозначаются словами и словосочетаниями ЕЯ. Однако это сходство чисто внеш­нее. При отыскании документов при координатном индексировании производятся определенные логические операции над классами, обо­значенными этими ключевыми словами. Для алфавитно-предметного индексирования тоже может быть применено несколько предмет­ных заголовков. Но при информационном поиске каждый предмет­ный заголовок выступает самостоятельно без какой-либо связи с другими заголовками, т.е. можно пользоваться только заранее опи­санными классами. При координатном индексировании классы фор­мируются в процессе индексирования.

При координатном индексировании поисковое предписание формулируется в виде логических сумм (или), произведений (и) или дополнений (не) классов, соответствующих ключевым словам поис­кового предписания (чаще всего это произведение).

Для отыскания документов, отвечающих на запрос, необходимо выполнить определенные логические операции над классами, кото­рые обозначены ключевыми словами ПОД.

В простейшем случае, когда поисковое предписание сформули­ровано в виде логического произведения некоторого множества клю­чевых слов, документ считается отвечающим на информационный запрос и подлежит выдаче, если в ПОД одновременно содержатся все ключевые слова поискового предписания.


Оцените книгу: 1 2 3 4 5