Название: Проектирование экономических информационных систем - Смирнова Г. Н.

Жанр: Информатика

Рейтинг:

Просмотров: 794


4.1. основные понятия классификации экономической информации

В условиях рыночной экономики возрастает роль информа­ции как одного из наиболее важных ресурсов предприятия, необ­ходимого для принятия эффективных и своевременных управлен­ческих решений. Одним из наиболее существенных компонентов этого ресурса является экономическая информация, основные особенности которой следующие:

большие объемы ежегодно создаваемой, обрабатываемой И хранимой информации (до нескольких сотен млн. символов в год для среднего предприятия);

большая часть этой информации имеет символьное представ­ление, слабо приспособленное для логической и арифмети­ческой обработки;

высокий уровень стоимостных и трудовых затрат на поиск и ее обработку.

6*

83

 

Для того чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем фор­мализовать (закодировать) с использованием классификатора. Классификатор - это документ, с помощью которого осуществля­ется формализованное описание экономической информации в ЭИС, содержащей наименования объектов, наименования класси­фикационных группировок и их кодовые обозначения.

Экономическая информация существует в двух формах: в фор­ме экономических показателей и документов.

Экономический показатель является составнойединицей ин­формации, отражающей количественную характеристику неко­торого процесса предметной области - реквизит-основание вмес­те с однозначно определяющими его качество реквизитами-признаками [51 ]. Структура показателя представлена на рис. 4.1.

 

Показатель

Реквизиты-признаки

Реквизиты-основания

I

1

I

Справочные Группировочные

Количество   Удельный вес   Сумма \%

 

Рис. 4.1. Схема структуры экономического показателя

 

Реквизиты-основания подразделяются по типу алгоритмов их получения на количественные, стоимостные, проценты, удельные веса и др. Множество реквизитов-признаков по степени формали­зации делится на два подмножества:

справочные реквизиты-признаки, - как правило, наименования предназначены для понимания показателя пользователем-эко­номистом;

группировочные реквизиты-признаки - это закодированные ана­логи справочных признаков, предназначенные для логичес­кой обработки информации на ЭВМ.

Основными объектами классификации и кодирования являются справочные реквизиты-признаки, описывающие процессы, место, время выполнения процессов, субъекты и объекты действия, отра­жаемые в показателе. Например, к числу наименований элементов можно отнести наименования материальных, трудовых, денежных, энергетических ресурсов, основных средств, готовой продукции и услуг. К числу наименований процессов относятся наименования функций управления, деловых процессов, операций поступления сырья и материалов, отпуска их в производство, производства и выпуска готовой продукции или оказания услуг, процессов выпол­нения заказов, обслуживания клиентов, хранения, реализации го­товой продукции, расчетов с поставщиками и покупателями, по­лучения оплаты за реализованную продукцию и т.д.

К объектам классификации и кодирования относятся также наименования показателей и документов. Помимо этого к объек­там классификации и кодирования относят также наименования компонентов проекта ЭИС, в том числе файлов, задач, подсис­тем, программных модулей и др.

Целью разработки классификаторов является установление соответствия между значениями справочных или описательных признаков какого-либо элемента или процесса и значениями группировочных признаков, например между значением рекви­зита «Фамилия И.О. рабочего» и значением «Табельный номер» рабочего или между значениями «Наименование материала» и «Код материала».

Для кодирования объектов необходимо их упорядочить по некоторым признакам. Результат упорядоченного распределения объектов заданного множества носит название классификации, а совокупность правил распределения объектов множества на под­множества называется системой классификации. Процесс распре­деления объектов классификации в соответствии с принятой сис­темой классификации носит название процесса классифицирова­ния. То свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с дру­гими объектами классификации, называется признаком классифи­кации. Множество или подмножество, объединяющее часть объек­тов классификации по одному или нескольким признакам, носит название классификационной группировки.

Основанием классификации называется признак, по которому ведется разбиение множества на подмножества на определенной ступени классификации. Ступень классификации - это результат очередного распределения объектов одной классификационной группировки. Уровень классификации - это совокупность класси­фикационных группировок, расположенных на одних и тех же сту­пенях классификации. Глубина системы классификации - это коли­чество уровней классификации, допустимое в данной системе.

Каждая система классификации характеризуется следующи­ми свойствами:

гибкостью системы;

емкостью системы;

степенью заполненности системы (коэффициент заполнен­ности).

Гибкость системы - это способность допускать включение новых признаков, объектов без разрушения структуры клас­сификатора. Гибкость определяется временем жизни (Тж) сис­темы.

Емкость системы - это наибольшее количество классифика­ционных группировок, допускаемое в данной системе классифи­кации (Р).

Степень заполненности системы (Кма) определяется как част­ное от деления фактического количества группировок (<Эф) на величину емкости системы (Р):

 

к =QJP-

зал "^-ф

В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.

Характерными особенностями иерархической системы явля­ются:

наличие в системе неограниченного количества признаков классификации;

соподчиненность признаков классификации, что выражается разбиением каждой классификационной группировки, обра­зованной по одному признаку, на множество классификаци­онных группировок по нижестоящему (подчиненному) при­знаку.

При построении иерархической системы классификации сна­чала выделяется некоторое множество объектов, подлежащее классифицированию Мо, для которого определяются полное мно­жество признаков классификации G и их соподчиненность друг другу, затем производится разбиение исходного множества объек­тов на классификационные группировки на каждой ступени клас­сификации (рис. 4.2).

При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:

получающиеся на каждом уровне классификационные груп­пировки должны составлять исходное множество объектов Мо;

классификационные группировки Х.к на каждой ступени не должны пересекаться;

классификация на каждой ступени должна проводиться толь­ко по одному признаку (G).

К положительным сторонам данной системы следует отнести логичность, простоту ее построения и удобство логической и ирифметической обработки.

Мо= {х,,х2,...,х,,...,хп} - мощность классифицируемого множества, і де g,, g2,... - признаки классификации ng^G, g2e G

Однако эта система характеризуется жесткой структурой классификации, не позволяющей вносить новые признаки или изменять их последовательность. Гибкость этой системы обес­печивается только за счет ввода большой избыточности в вет-пях, что приводит к слабой заполненности структуры класси­фикатора.

Недостатки, отмеченные в иерархической системе, отсутству-|о г в других системах, которые относятся к классу многоаспект­ных систем классификации. Аспект ~ точка зрения на объект клас-i мфикации, который характеризуется одним или несколькими признаками. Многоаспектная система - это система класси­фикации, которая использует параллельно несколько независи­мых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и деск-рипторная. Фасет - это аспект классификации, который исполь­зуется для образования независимых классификационных груп­пировок. Дескриптор - ключевое слово, определяющее неко­торое понятие, которое формирует описание объекта и дает при­надлежность этого объекта к классу, группе и т.д.

Фасетная система характеризуется следующими особеннос­тями построения:

имеется Некоторое множество классифицируемых объектов (MJ;

это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или не­сколькими признаками, образующими фасет Фг;

устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач):

 

F=(0r02,...,0r,...,0R);

определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам (рис. 4.3).

Фасеты

Внутри фасета значения признаков могут просто перечислять­ся по некоторому порядку или образовывать сложную иерархи­ческую структуру, если существует соподчиненность выделенных признаков.

К преимуществам данной системы следует отнести большую емкость системы и высокую степень гибкости, поскольку при не­обходимости можно вводить дополнительные фасеты и изменять их место в формуле. К недостаткам, характерным для данной си­стемы, можно отнести сложность структуры и низкую степень заполненности системы.

Рассмотренные выше системы классификации хорошо приспо­соблены для организации поиска с целью последующей логичес­кой и арифметической обработки информации на ЭВМ и лишь частично решают проблему содержательного поиска экономичес­кой информации при принятии управленческих решений. Это объясняется далеко не полным охватом этими системами всех понятий и терминов, используемых для выражения смысла эко­номических показателей и документов. Помимо этого в этих си­стемах не решается проблема обеспечения однозначности исполь­зуемой терминологии, идентификации роли отдельных терминов в их общей последовательности при формировании наименова­ний экономических показателей. К недостаткам этих систем клас­сификации можно отнести также и то, что в них не отражаются все отношения между терминами, необходимые для формализа­ции содержания показателей и документов и установления взаи­мосвязей между показателями и документами, которые исполь­зуются на этапе принятия управленческих решений.

Для поиска показателей и документов по набору содержатель­ных признаков используется информационный язык дескриптор-ного типа, который характеризуется совокупностью терминов, дескрипторов или лексикой и набором отношений между терми­нами. Эти отношения могут быть двух типов:

постоянные логические отношения между терминами, выте­кающие из отношений между отображаемыми объектами, ко­торые называются парадигматическими отношениями;

переменные отношения между понятиями, возникающие в про­цессе построения конкретного высказывания, например по­казателя, называемые синтагматическими отношениями. Парадигматические отношения между терминами отражают

статику языка. К ним относятся, например, родовидовые отно­шения. При этом родовым называется термин или понятие, выра­жающие существенные признаки класса предметов, в состав ко­торого входят предметы, являющиеся видами этого рода. Видо­вое понятие выражает существенные признаки подкласса пред­метов, являющегося видом какого-либо другого класса предме­тов и входящего в состав этого класса. Например, понятие «машинный носитель» является родовым по отношению к поня­тиям «жесткий магнитный диск», «гибкий диск», «магнитная лен­та» и т.д. Отношения этого типа отражаются в классификаторах экономической информации.

Синтагматические отношения составляют грамматику этого языка, т.е. правила построения высказываний из набора терми­нов или понятий. Такие отношения используются в динамике при вводе данных и формулировании запросов.

В зависимости от того, на каком этапе фиксируются все воз­можные выражения, языки делятся на предкоординированные и посткоординируемые. Предкоординированными называются языки, в которых на стадии разработки выделяются все высказывания в терминах этих языков и тем самым заранее определяются посто­янные отношения между терминами. Для посткоординируемых языков характерна предварительная фиксация лишь постоянных отношений. Все высказывания образуются при использовании лексики данного языка и его грамматики. Языки предкоордини-рованного типа менее гибки при использовании, так как с их по­мощью можно описывать только те выражения, которые были заранее зафиксированы. Использование посткоординированных языков позволяет образовывать с их помощью значительно боль­шее число высказываний.

Наиболее типичным примером предкоординированных язы­ков являются классификационные языки, основанные на исполь­зовании иерархической и многоаспектной систем классифика­ции, преимущества и недостатки которых были рассмотрены ранее. К языкам классификационного типа можно отнести разработанный ныне Общесистемный классификатор технико-экономических показателей (ОКТЭП). Он содержит способ упо­рядоченного представления системы показателей и средства их взаимной увязки на основе многоаспектной классификации этих показателей, которая должна отражать наиболее суще­ственные с точки зрения народного хозяйства методологичес­кие особенности их расчета, взаимосвязи показателей, наибо­лее важные признаки группировки показателей и их поиска в ЭИС.

Общим недостатком информационных языков классификаци­онного типа являются их слабая приспособленность к новым, за­ранее не предусмотренным условиям функционирования систем, возможность составления запросов на этих языках регламенти­рованного содержания. Эти недостатки отсутствуют у языков посткоординированного типа, к которым относятся дескриптор-ные языки, основанные на применении метода координатного, или ассоциативного, индексирования.

Согласно идее координатного индексирования предполага­ется, что содержание документов или показателей можно дос­таточно полно и точно отразить с помощью списка ключевых слов - дескрипторов. Дескриптор - это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения. Например, показатель «Количество продукции, выработанное фактически цехом за смену», записанный на естественном языке, при исполь­зовании метода координатного индексирования будет иметь вид: «количество, продукция, выработка, фактический, цех, смена».

Для того чтобы обеспечить точность и однозначность поиска с помощью такого языка, необходимо предварительно опреде­лить все постоянные отношения между терминами: родовидовые, отношения синонимии, омонимии и полисемии, а также ассоци­ативные отношения. Характеристика родовидовых отношений была дана выше. Особый вид парадигматических отношений представляют отношения синонимии, омонимии и полисемии, всегда присутствующие в естественных языках.

Синонимия - это отношение между двумя и более различными ключевыми словами, когда они имеют одинаковое значение, обо­значают один и тот же предмет или понятие. Можно выделить синонимы с одним корнем, но с различным морфологическим составом (например, «производство» и «произведено»), с различ­ными корнями (например, «издержки» и «расходы»). К синони­мам относятся также термины, которые могут существовать как в полном, так и в сокращенном виде, например «научно-исследо­вательские работы» и «НИР», «кубические метры» и «куб. м».

Омонимия - это такое отношение между одинаковыми по зву­чанию и написанию ключевыми словами, когда они имеют раз­ное значение и обозначают разные предметы и понятия. Можно выделить термины, обозначающие такие разные понятия, объе­мы которых не пересекаются, и называемые полными омонима­ми. Например, термин «прокат» используется в двух различных смыслах: «прокат тонкой листовой стали» и «сдача предметов во временное пользование», поэтому он относится к числу полных омонимов. Однако встречаются термины, обозначающие разные понятия, объемы которых пересекаются. Такие термины называ­ются частичными омонимами. Явление частичной омонимии носит название полисемии.

Большое значение для построения дескрипторного языка име­ют выявление и фиксирование ассоциативных отношений между терминами, которые позволяют выдавать более точные ответы на запросы пользователей. К числу ассоциативных отношений относят такие, как отношение части к целому (например, «цех» -«участок»), причинно-следственные отношения (например, «про­гул» - «невыполнение»), связи предмета и процесса (например, «план» - «планирование») и др.

Все выделенные отношения явно описываются в системати­ческом словаре понятий - тезаурусе, который разрабатывается с целью проведения индексирования документов, показателей и информационных запросов.

В свою очередь, дескрипторные языки различаются по семан­тической силе, которая определяется тем, какой объем сведений может индексироваться с их применением. Семантическая сила языка зависит от числа типов постоянных отношений, фиксируе­мых в тезаурусе, а также от наличия средств грамматики и степе­ни их сложности. В соответствии с этим признаком дескриптор­ные языки подразделяются на языки без грамматики, языки с не­полной грамматикой и языки с развитой грамматикой. При этом языки первого вида содержат только словари используемых клю­чевых слов и тезаурусы. В языках с неполной грамматикой, по­мимо словарей и тезаурусов, имеются правила взаимосвязи только некоторых категорий терминов. Языки с развитой грамматикой позволяют описывать с помощью всех средств сложные выска­зывания.

В том случае, если объектом поиска в ЭИС является документ, для этих целей используют информационные языки дескриптор­ного типа без грамматики. При необходимости хранения и осу­ществления поиска экономических показателей проектировщи­ки отдают предпочтение языкам второго и третьего типов.


Оцените книгу: 1 2 3 4 5