Системы классификации и кодирования экономической информации ИС

Существование современного общества невозможно представить без его основополагающего ресурса – информации. Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределённости, неполноты знаний [1]. Информационная ценность того или иного сообщения заключается в новых сведениях, содержащихся в нем, то есть сообщение уменьшает незнание.

В наш век информационных технологий проблема систематизации и классификации знаний крайне актуальна. Необъятные потоки информации разного рода увеличиваются с каждым днем, и весь мир активно стремится к систематизации этой информации. Благодаря ей, любые явления объективного мира отражаются в сознании не хаотично и разобщенно, а в определенной системе, что позволяет глубже понять их взаимосвязи и правильнее использовать эти знания в практической деятельности. На протяжении всей истории люди активно систематизировали всё, что их окружает: появлялись словари, энциклопедии, своды правил, научные систематизации, такие как периодическая система элементов Менделеева или классификация растений и животных Карла Линнея, без которых уже сложно представить современную науку.

Эффективное управление любым экономическим объектом, будь то государственное учреждение или частное предприятие, возможно только при наличии полной и достоверной информации о деятельности всех его подразделений. Понимая информацию как стратегический ресурс, без которого невозможна деловая, управленческая, или любая другая социально значимая деятельность, необходимо уметь оценивать ее как с количественной, так и с качественной стороны. Естественно, неизбежны серьезные разногласия из-за нематериальной природы такого ресурса как информация и субъективности её восприятия различными индивидуумами человеческого общества. Таким образом, для эффективного информационного обеспечения предприятия, необходима единая и всеобъемлющая система хранения и поиска информации.

В России, уже в начале 70-х годов, проблема создания единого информационного пространства приобрела особое значение: в стране разрабатывалась Общегосударственная автоматизированная система сбора и обработки информации для целей планирования и управления народным хозяйством (ОГАС).

Были установлены единые требования к носителям информации, разработан единый язык формализованного описания данных, закреплены общие методические принципы организации технологического процесса обработки данных.

49 стр., 24117 слов

Корпоративная информационная система

... построения корпоративных информационных систем. 1.1.1. Понятие КИС Информация в ... анализ литературы, сбор, систематизация и обобщение ... корпоративной информационной системе. В данной главе представлен взгляд на организацию с точки зрения информационной системы ... повышается роль информации и знаний, находящихся в ... данной работы является проектирование архитектуры корпоративной информационной системы, ...

С появлением новых технологий, следующим этапом стала разработка Единой системы классификации и кодирования технико-экономической информации (ЕСКК ТЭИ) под управлением Госстандарта СССР и Всесоюзного научно-исследовательского института технической информации, классификации и кодирования (ВНИИКИ).

ЕСКК ТЭИ состоит из совокупности общероссийских классификаторов технико-экономической информации, средств их вeдeния, нормативных и методических документов по их разработке, ведению и применению. Объектами классификации и кодирования в ЕСКК ТЭИ РФ являются технико-экономические объекты и их свойства, используемые в различных областях хозяйственной деятельности. Классификатор ТЭСИ представляет собой систематизированный свод наименований и кодов классификационных группировок и (или) объектов классификации. Основной целью ЕСКК ТЭИ была стандартизация информационного обеспечения процессов управления хозяйством страны на основе применения средств вычислительной техники и новых информационных технологий при помощи создания единого языка формализованного описания данных. На сегодняшний момент актуальным является Постановление Правительства РФ от 10.11.2003 N 677 «Об общероссийских классификаторах технико-экономической и социальной информации в социально-экономической области».

Цели данной работы – рассмотрение и анализ различных методов классификации информации, варианты её применения, выявление достоинств и недостатков. Также основополагающей задачей является изучение общих понятий по данной теме, без которых невозможно понимание классификационных методов и методов кодирования информации. Все классификации должны быть рассмотрены с практической точки зрения, то есть необходимо будет выявить их реальное применение и разобрать его. Более глубокие детали, такие как нижние уровни классификации и др., будут затронуты лишь поверхностно ввиду невысокого уровня их релевантности.

Классификация

Классификация – это «разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами»[2]. Классификация определяет связи между классами объектов. Под объектом понимается тот или иной процесс, предмет, явление материальной или нематериальной природы. При помощи классификации возможно сгруппировать объекты и выделить отдельные классы, которые будут иметь некоторые общие свойства. Классификация объектов – эта процедура выделения однородных свойств, то есть группировка на качественном уровне.

Информация является объектом классификации, поэтому выделенные классы определяют как информационные объекты. Классификация информации – важнейшее средство создания систем хранения и поиска информации, без которых сегодня трудно представить эффективное и полное функционирование информационного обеспечения управления. Классификация играет роль инструмента научного познания, прогнозирования и управления. Одновременно с этим, классификация выполняет функцию объективного отражения и закрепления результатов этого познания. Глубина классификации, характер её схемы и состав признаков определяется практическими целями применения классификации, типом её объектов, а также условиями, в которых классификация будет применяться.

Потребность в классификациях вызвана необходимостью:

Система классификации – это правила распределения объектов на основании их классификационных признаков и зависимости внутри признаков.

К системам классификации объектов предъявляются следующие требования:

На основании заявленных требований, можно предположить, что любая система классификации должна иметь следующие характеристики: гибкость, емкость, глубина и заполненность (таблица 1.1).

Таблица 1.1

Характеристики систем классификации

Характеристика Свойства
Возможность обновления системы, включения в неё новых классификационных объектов и признаков без нарушения целостности
Максимально возможное количество группировок в системе классификации
Количество допускаемых ступене й (уровней) по числу признаков классификации
Отношение емкости системы к фактическому количеству классификационных группировок

Классификатор, или классификационная схема— систематизированный перечень каких-либо объектов, каждому из которых присвоен свой уникальный идентификатор. Классификация объектов производится по правилам распределения данного множества объектов на подмножества (классификационные группировки) опираясь на установленные признаки их сходства или различия.

Классификаторы разделяются на категории в зависимости от области применения. Выделяют следующие категории:

  • международные — стандартные классификаторы, используемые глобально, по всему миру, например, Международная Классификация Товаров и Услуг (МКТУ);

межгосударственные — классификаторы, используемые в рамках экономических и политических союзов и других межгосударственных объединений: например, классификаторы используемые в ЕС, СНГ и т. д, например, Европейская классификация продукции

Общегосударственные — классификаторы, используемые в пределах государства, не противоречащие международным классификаторам, например, уже упомянутый Общероссийский классификатор технико-экономической и социальной информации.

Отраслевые — классификаторы, используемые в рамках одной определенной отрасли, например Единый отраслевой классификатор печатных СМИ.

Локальные — классификаторы, используемые отдельным предприятием или организацией для применения в рамках своей системы. Они содержат информацию, необходимую для решения задач в конкретной организации и по каким-либо причинам отсутствующую в национальном или отраслевом классификаторе. К ним относятся и региональные классификаторы, — то есть классификаторы, использующиеся в каком-либо регионе.

Структура классификатора, как правило, имеет три блока:

Классификаторы могут иметь и двухблочную структуру, когда блок дополнительных признаков объектов не необходим, тогда выделяются только блок идентификации и блок наименований. В самой структуре классификаторов могут появляться и другие виды блоков. Выбор структуры построения классификаторов происходит в зависимости от характера объектов классификации, типом задач, для решения которых используется классификатор, а так же методами классификации и кодирования.

Иерархическая система классификации информации

В иерархической системе классификации объекты делятся на основе выбранного классификационного признака на классы (группировки), которые образуют I уровень. В свою очередь каждый класс I уровня делится на подклассы (II уровень) в соответствии со своим классификационным признаком. Каждый подкласс II уровня делится на группы (III уровень) и т.д., в зависимости от степени глубины классификации (рис. 1).

Рис.1 Иерархическая система классификации

Достоинства иерархической системы классификации: простота и логичность построения, возможность использования любого количества классификационных признаков во всех ветвях иерархической структуры. Недостатками иерархической системы классификации являются жесткая структура, осложняющая внедрение изменений; невозможность группировки объектов по предусмотренным признакам.

В качестве примера иерархической классификации рассмотрим план счетов бухгалтерского учета, закрепленный в Международных стандартах финансовой отчётности (МСФО) [3].

В данной классификации план счетов разбивается на следующие классы (разделы):

1 2 3 4 i n
Значения фасетов · · · · · ·
· · · · ·
· · · ·
· · · ·

В качестве примера фасетной классификации рассмотрим бухгалтерскую отчетность, также закрепленную в Международных стандартах финансовой отчётности (МСФО) [3].

(табл. 1.3).

Таблица 1.3

Пример фасетной системы классификации

Название отчетности (Ф 1 ) Тип (Ф 2 ) Форма (Ф 3 )
Общеэкономическая (составляется в соответствии с инструкциями Министерства Финансов России)

Налоговая (составляется в соответствии с инструкциями ФНС)

Квартальная

Годовая

Ф 1 – баланс

Ф2 – отчет о финансовых результатах

Ф 3 – отчет о движении капитала

Ф 4 – отчет о движении денежных средств

Налоговые декларации

Расчеты налогов

Справки

Здесь фасетами являются название отчетности (Ф 1 ), тип (Ф2 ), форма (Ф3 ), ниже в столбцах приведены их значения. Тогда классификация отчетности (Кn ) имеет вид:

К 1 = (общеэкономическая, квартальная, Ф1 );

К 2 = (налоговая, годовая, расчеты налогов), и т.д. в любых комбинациях.

Таким образом, классификация экономических объектов способствует их систематизации, более глубокому изучению объектов и их связей и созданию единых классификаторов для разных предприятий и для разных целей. Без классификации невозможно кодирование информации, поскольку она является его основой.

Система кодирования информации

Кодирование – это процесс присвоения некоторых условных обозначений объектам классификации (изделиям, материалам, видам операций, счетам и т.д.) и классификационным группировкам. Целью кодирования является представление информации в более компактной, емкой и удобной для использования в информационных системах форме; подготовка информации к обработке и передаче по каналам связи; упрощение логической обработки информации с использованием специальных методов и технологий; установление единообразия и всеобщности представления признаков.

Уникальное условное обозначение, присвоенное какому-либо конкретному объекту (например, счету), называется кодом или идентификатором. Код может состоять из одного знака или совокупности знаков, заданной по определенным правилам. В качестве знаков могут выступать буквы, цифры или буквенно-цифровые символы, но чаще всего используются только цифры.

Код характеризуется:

Совокупность правил, по которым образуется кодовое обозначение объекта, называется системой кодирования.

При кодировании элементов экономических объектов используются 2 класса систем кодирования: классификационная и регистрационная, которые в свою очередь подразделяются на позиционную (поразрядная), повторения и порядковую, серийную системы кодирования соответственно (рис.2).

Рис. 2 – системы кодирования ИС

Классификационное кодирование

Классификационное кодирование выполняется после обязательной предварительной классификации объектов и подразделяется на позиционное (поразрядное), повторения и комбинированное кодирование, то есть использование этих двух систем одновременно.

Позиционная (поразрядная) система кодирования используется для кодирования сложных объектов, элементы которых группируются по нескольким разным признакам. Данные кодируемого множества классифицируются по определенным признакам, каждому из которых отводится заданное число разрядов (позиций).

В качестве примера возьмем лицевой счет клиента банка. Структурно номер лицевого счета имеет следующий вид:

РППББВВВКООООЛЛЛЛЛЛЛ,

Где Р (одна позиция) – номер балансового раздела; П (две позиции) – номер счета первого порядка; Б (две позиции) – номер счета второго порядка; В (три позиции) – код валюты; К (одна позиция) – контрольный ключ; О (четыре позиции) – номер филиала; Л (семь позиций) – лицевая часть счета.

Таким образом, мы можем определить информацию о клиенте. Например, узнаем, в какой валюте используются деньги на данном счете:

Код валюты – 810. Обратимся к ISO 4217 — стандарту Международной организации по стандартизации, устанавливающий трёхзначные цифровые алфавитные и трёхбуквенные коды валют [4].

RUR (810) — российский рубль. Соответственно, деньги на данном счете находятся в рублях.

Ещё один пример — банковский идентификационный код (БИК).

CC CCCC CCC

Код России Код банка в пределах РКЦ Код РКЦ

Достоинства позиционной системы кодирования: логичность, простота построения, большая информативность кода, дающая возможность кодирования практически неограниченного количества классификационных признаков и их четкое выделение. Недостаток данной системы заключается в том, что при такой жесткой структуре предварительной классификации нельзя будет закодировать группировки, не установленные заранее.

Система повторения использует кодовые обозначения, которые сами являются характеристикой объекта кодирования, т.е. сохраняет уже имеющиеся обозначения признаков. То есть, если размер какого-либо инструмента 6?11, то этому инструменту присваивается код 611.

Достоинства кодирования с системой повторения: легкость запоминания и по сути отсутствие каких либо систем кодирования. Недостатки – узость применения. Обычно такая система применяется комбинированно с другими СК.

Регистрационная система кодирования

система кодирования не требует предварительной классификации объектов и используется для однозначной их идентификации. Она разделяется на порядковую и серийную системы.

Порядковая система кодирования состоит в том, что каждому объекту последовательно присваивается номенклатура номера его порядка, т.е. в кодировании информации натуральными числами. Этот порядок как случайным, так и определяемым после предварительной группировки наименований объектов по алфавиту или другим образом.

Порядковая система применяется для стабильных и достаточно простых номенклатур. Ее достоинство – это простота построения; недостаток в том, что с появлением новых объектов номенклатуры нарушается ее логическая структура, потому что новым объектам неизбежно присваиваются последние номера.

Самым простым примером данной системы является кодирование списка студентов определенное группы или целого курса (например, Рейтинг студентов в НИУ ВШЭ) где фамилии студентов, упорядоченные по алфавиту (или по успеваемости в случае Рейтинга), нумеруются цифрами из натурального ряда.

Серийная система кодирования п редполагает разбиение всех кодируемых объектов на группы по определенному признаку. Каждой группе присваивается серия кодов. В пределах этой серии каждому объекту присваивается код по порядку. Каждая серия кодовых обозначений, присваиваемая группе, в свою очередь содержит резервные коды для случая появления новых позиций номенклатуры в группе.

Преимуществами этой системы кодирования заключаются в сравнительно небольшой длине кода и возможности добавления новых объектов в группу без нарушения логичности системы. Недостатки серийной системы — трудности запоминания серий и отсутствие четкой границы между ними.

Серийная система используется в кодировании двузначных номенклатур, например, виды оплат и учреждений, структурные подразделения предприятий или организаций и т.д.

К регистрационной системе кодирования относится также и широко распространенное штриховое кодирование, которое представляет собой способ автоматической идентификации разнородных предметов, основанный на оптическом способе считывании информации.

Алгоритм данного метода таков:

В качестве идентификатора используются магнитные, графические, радиочастотные и электронные метки, применяемые в различных сферах, но наибольшей популярностью пользуется метка в виде штрихкода. Построение штрихового кода основывается на системе маркировки в виде чередования широких и узких, черных и белых полос, которыми обычно закодирована буквенно-цифровая информация. Широким линиям и широким промежуткам присвоено логическое значение 1, узким – 0. Таким образом, образуется последовательность из нулей и единиц, которая представляет собой двоичный код, в последствии считываемый специальным устройством — электронным считывателем штрихкода. В штрихкоде закодирована необходимая информация о стране-производителе, предприятии-изготовителе и самом предмете.

В современном мире существует более 50 систем штрихового кодирования. Наиболее широкое применение получили следующие системы:

Среди них в Российской Федерации наибольшее применение получили EAN- и UCC/EAN-коды.

В каждой системе существуют свои разряды кодов: EAN-8, EAN-13, EAN-14, UPC-12, UCC/EAN-128 (современная версия Code 39).

Остановимся подробнее на структуре кода EAN-13, используемого в нашей стране и получившего наибольшее распространение. Код является тринадцатиразрядным, используется для кодирования какой-либо продукции и имеет следующую структуру:

CCC CCCC CCCCC C

Первые три цифры кода — страна-производителя.

Следующие четыре цифры – код предприятия-изготовителя, которое производит или реализует его под своей торговой маркой. Список кодов стран-производителей EAN-13 приведен в табл. 2.1.

Следующие пять цифр – код продукта (товара), учитывающий такие признаки, как его потребительские свойства, размеры, оформление, упаковку, цвет и т.д.

Последняя цифра –контрольная. Она используется для проверки правильности считывания кодов специальным устройством.

Таблица 2.1

Список кодов EAN-13

Код

Страна Страна
00-09 США, Канада 690 КНР
30-37 Франция 70 Норвегия
380 Болгария 729 Израиль
383 Словения 73 Швеция
385 Хорватия 750 Мексика
400-440 Германия 759 Венесуэла
45,49 Япония 76 Швейцария
460-469 Россия, СНГ 770 Колумбия
471 Тайвань 773 Уругвай
474 Эстония 775 Перу
475 Латвия 779 Аргентина
477 Литва 780 Чили
482 Украина 786 Эквадор
484 Молдова 789 Бразилия
489 Гонконг 80-83 Италия
50 Великобритания 84 Испания
520 Греция 850 Куба
529 Кипр 858 Словакия
535 Мальта 859 Чехия
539 Ирландия 860 Югославия
54 Бельгия, Люксембург 869 Турция
560 Португалия 87 Нидерланды
569 Исландия 880 Южная Корея
57 Дания 885 Таиланд
590 Польша 888 Сингапур
599 Венгрия 890 Индия
600,601 ЮАР 893 Вьетнам
611 Марокко 90,91 Австрия
613 Алжир 93 Австралия
619 Тунис 94 Новая Зеландия
64 Финляндия 955 Малайзия