Существование современного общества невозможно представить без его основополагающего ресурса – информации. Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределённости, неполноты знаний [1]. Информационная ценность того или иного сообщения заключается в новых сведениях, содержащихся в нем, то есть сообщение уменьшает незнание.
В наш век информационных технологий проблема систематизации и классификации знаний крайне актуальна. Необъятные потоки информации разного рода увеличиваются с каждым днем, и весь мир активно стремится к систематизации этой информации. Благодаря ей, любые явления объективного мира отражаются в сознании не хаотично и разобщенно, а в определенной системе, что позволяет глубже понять их взаимосвязи и правильнее использовать эти знания в практической деятельности. На протяжении всей истории люди активно систематизировали всё, что их окружает: появлялись словари, энциклопедии, своды правил, научные систематизации, такие как периодическая система элементов Менделеева или классификация растений и животных Карла Линнея, без которых уже сложно представить современную науку.
Эффективное управление любым экономическим объектом, будь то государственное учреждение или частное предприятие, возможно только при наличии полной и достоверной информации о деятельности всех его подразделений. Понимая информацию как стратегический ресурс, без которого невозможна деловая, управленческая, или любая другая социально значимая деятельность, необходимо уметь оценивать ее как с количественной, так и с качественной стороны. Естественно, неизбежны серьезные разногласия из-за нематериальной природы такого ресурса как информация и субъективности её восприятия различными индивидуумами человеческого общества. Таким образом, для эффективного информационного обеспечения предприятия, необходима единая и всеобъемлющая система хранения и поиска информации.
В России, уже в начале 70-х годов, проблема создания единого информационного пространства приобрела особое значение: в стране разрабатывалась Общегосударственная автоматизированная система сбора и обработки информации для целей планирования и управления народным хозяйством (ОГАС).
Были установлены единые требования к носителям информации, разработан единый язык формализованного описания данных, закреплены общие методические принципы организации технологического процесса обработки данных.
Корпоративная информационная система
... построения корпоративных информационных систем. 1.1.1. Понятие КИС Информация в ... анализ литературы, сбор, систематизация и обобщение ... корпоративной информационной системе. В данной главе представлен взгляд на организацию с точки зрения информационной системы ... повышается роль информации и знаний, находящихся в ... данной работы является проектирование архитектуры корпоративной информационной системы, ...
С появлением новых технологий, следующим этапом стала разработка Единой системы классификации и кодирования технико-экономической информации (ЕСКК ТЭИ) под управлением Госстандарта СССР и Всесоюзного научно-исследовательского института технической информации, классификации и кодирования (ВНИИКИ).
ЕСКК ТЭИ состоит из совокупности общероссийских классификаторов технико-экономической информации, средств их вeдeния, нормативных и методических документов по их разработке, ведению и применению. Объектами классификации и кодирования в ЕСКК ТЭИ РФ являются технико-экономические объекты и их свойства, используемые в различных областях хозяйственной деятельности. Классификатор ТЭСИ представляет собой систематизированный свод наименований и кодов классификационных группировок и (или) объектов классификации. Основной целью ЕСКК ТЭИ была стандартизация информационного обеспечения процессов управления хозяйством страны на основе применения средств вычислительной техники и новых информационных технологий при помощи создания единого языка формализованного описания данных. На сегодняшний момент актуальным является Постановление Правительства РФ от 10.11.2003 N 677 «Об общероссийских классификаторах технико-экономической и социальной информации в социально-экономической области».
Цели данной работы – рассмотрение и анализ различных методов классификации информации, варианты её применения, выявление достоинств и недостатков. Также основополагающей задачей является изучение общих понятий по данной теме, без которых невозможно понимание классификационных методов и методов кодирования информации. Все классификации должны быть рассмотрены с практической точки зрения, то есть необходимо будет выявить их реальное применение и разобрать его. Более глубокие детали, такие как нижние уровни классификации и др., будут затронуты лишь поверхностно ввиду невысокого уровня их релевантности.
Классификация
Классификация – это «разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами»[2]. Классификация определяет связи между классами объектов. Под объектом понимается тот или иной процесс, предмет, явление материальной или нематериальной природы. При помощи классификации возможно сгруппировать объекты и выделить отдельные классы, которые будут иметь некоторые общие свойства. Классификация объектов – эта процедура выделения однородных свойств, то есть группировка на качественном уровне.
Информация является объектом классификации, поэтому выделенные классы определяют как информационные объекты. Классификация информации – важнейшее средство создания систем хранения и поиска информации, без которых сегодня трудно представить эффективное и полное функционирование информационного обеспечения управления. Классификация играет роль инструмента научного познания, прогнозирования и управления. Одновременно с этим, классификация выполняет функцию объективного отражения и закрепления результатов этого познания. Глубина классификации, характер её схемы и состав признаков определяется практическими целями применения классификации, типом её объектов, а также условиями, в которых классификация будет применяться.
Потребность в классификациях вызвана необходимостью:
Система классификации – это правила распределения объектов на основании их классификационных признаков и зависимости внутри признаков.
К системам классификации объектов предъявляются следующие требования:
На основании заявленных требований, можно предположить, что любая система классификации должна иметь следующие характеристики: гибкость, емкость, глубина и заполненность (таблица 1.1).
Таблица 1.1
Характеристики систем классификации
Характеристика | Свойства |
Возможность обновления системы, включения в неё новых классификационных объектов и признаков без нарушения целостности | |
Максимально возможное количество группировок в системе классификации | |
Количество допускаемых ступене й (уровней) по числу признаков классификации | |
Отношение емкости системы к фактическому количеству классификационных группировок |
Классификатор, или классификационная схема— систематизированный перечень каких-либо объектов, каждому из которых присвоен свой уникальный идентификатор. Классификация объектов производится по правилам распределения данного множества объектов на подмножества (классификационные группировки) опираясь на установленные признаки их сходства или различия.
Классификаторы разделяются на категории в зависимости от области применения. Выделяют следующие категории:
- международные — стандартные классификаторы, используемые глобально, по всему миру, например, Международная Классификация Товаров и Услуг (МКТУ);
межгосударственные — классификаторы, используемые в рамках экономических и политических союзов и других межгосударственных объединений: например, классификаторы используемые в ЕС, СНГ и т. д, например, Европейская классификация продукции
Общегосударственные — классификаторы, используемые в пределах государства, не противоречащие международным классификаторам, например, уже упомянутый Общероссийский классификатор технико-экономической и социальной информации.
Отраслевые — классификаторы, используемые в рамках одной определенной отрасли, например Единый отраслевой классификатор печатных СМИ.
Локальные — классификаторы, используемые отдельным предприятием или организацией для применения в рамках своей системы. Они содержат информацию, необходимую для решения задач в конкретной организации и по каким-либо причинам отсутствующую в национальном или отраслевом классификаторе. К ним относятся и региональные классификаторы, — то есть классификаторы, использующиеся в каком-либо регионе.
Структура классификатора, как правило, имеет три блока:
Классификаторы могут иметь и двухблочную структуру, когда блок дополнительных признаков объектов не необходим, тогда выделяются только блок идентификации и блок наименований. В самой структуре классификаторов могут появляться и другие виды блоков. Выбор структуры построения классификаторов происходит в зависимости от характера объектов классификации, типом задач, для решения которых используется классификатор, а так же методами классификации и кодирования.
Иерархическая система классификации информации
В иерархической системе классификации объекты делятся на основе выбранного классификационного признака на классы (группировки), которые образуют I уровень. В свою очередь каждый класс I уровня делится на подклассы (II уровень) в соответствии со своим классификационным признаком. Каждый подкласс II уровня делится на группы (III уровень) и т.д., в зависимости от степени глубины классификации (рис. 1).
Рис.1 Иерархическая система классификации
Достоинства иерархической системы классификации: простота и логичность построения, возможность использования любого количества классификационных признаков во всех ветвях иерархической структуры. Недостатками иерархической системы классификации являются жесткая структура, осложняющая внедрение изменений; невозможность группировки объектов по предусмотренным признакам.
В качестве примера иерархической классификации рассмотрим план счетов бухгалтерского учета, закрепленный в Международных стандартах финансовой отчётности (МСФО) [3].
В данной классификации план счетов разбивается на следующие классы (разделы):
1 | 2 | 3 | 4 | i | n | |
Значения фасетов | · | · | · | · | · | · |
· | · | · | · | · | ||
· | · | · | · | |||
· | · | · | · |
В качестве примера фасетной классификации рассмотрим бухгалтерскую отчетность, также закрепленную в Международных стандартах финансовой отчётности (МСФО) [3].
(табл. 1.3).
Таблица 1.3
Пример фасетной системы классификации
Название отчетности (Ф 1 ) | Тип (Ф 2 ) | Форма (Ф 3 ) |
Общеэкономическая (составляется в соответствии с инструкциями Министерства Финансов России)
Налоговая (составляется в соответствии с инструкциями ФНС) |
Квартальная
Годовая |
Ф 1 – баланс
Ф2 – отчет о финансовых результатах Ф 3 – отчет о движении капитала Ф 4 – отчет о движении денежных средств Налоговые декларации Расчеты налогов Справки |
Здесь фасетами являются название отчетности (Ф 1 ), тип (Ф2 ), форма (Ф3 ), ниже в столбцах приведены их значения. Тогда классификация отчетности (Кn ) имеет вид:
К 1 = (общеэкономическая, квартальная, Ф1 );
К 2 = (налоговая, годовая, расчеты налогов), и т.д. в любых комбинациях.
Таким образом, классификация экономических объектов способствует их систематизации, более глубокому изучению объектов и их связей и созданию единых классификаторов для разных предприятий и для разных целей. Без классификации невозможно кодирование информации, поскольку она является его основой.
Система кодирования информации
Кодирование – это процесс присвоения некоторых условных обозначений объектам классификации (изделиям, материалам, видам операций, счетам и т.д.) и классификационным группировкам. Целью кодирования является представление информации в более компактной, емкой и удобной для использования в информационных системах форме; подготовка информации к обработке и передаче по каналам связи; упрощение логической обработки информации с использованием специальных методов и технологий; установление единообразия и всеобщности представления признаков.
Уникальное условное обозначение, присвоенное какому-либо конкретному объекту (например, счету), называется кодом или идентификатором. Код может состоять из одного знака или совокупности знаков, заданной по определенным правилам. В качестве знаков могут выступать буквы, цифры или буквенно-цифровые символы, но чаще всего используются только цифры.
Код характеризуется:
Совокупность правил, по которым образуется кодовое обозначение объекта, называется системой кодирования.
При кодировании элементов экономических объектов используются 2 класса систем кодирования: классификационная и регистрационная, которые в свою очередь подразделяются на позиционную (поразрядная), повторения и порядковую, серийную системы кодирования соответственно (рис.2).
Рис. 2 – системы кодирования ИС
Классификационное кодирование
Классификационное кодирование выполняется после обязательной предварительной классификации объектов и подразделяется на позиционное (поразрядное), повторения и комбинированное кодирование, то есть использование этих двух систем одновременно.
Позиционная (поразрядная) система кодирования используется для кодирования сложных объектов, элементы которых группируются по нескольким разным признакам. Данные кодируемого множества классифицируются по определенным признакам, каждому из которых отводится заданное число разрядов (позиций).
В качестве примера возьмем лицевой счет клиента банка. Структурно номер лицевого счета имеет следующий вид:
РППББВВВКООООЛЛЛЛЛЛЛ,
Где Р (одна позиция) – номер балансового раздела; П (две позиции) – номер счета первого порядка; Б (две позиции) – номер счета второго порядка; В (три позиции) – код валюты; К (одна позиция) – контрольный ключ; О (четыре позиции) – номер филиала; Л (семь позиций) – лицевая часть счета.
Таким образом, мы можем определить информацию о клиенте. Например, узнаем, в какой валюте используются деньги на данном счете:
Код валюты – 810. Обратимся к ISO 4217 — стандарту Международной организации по стандартизации, устанавливающий трёхзначные цифровые алфавитные и трёхбуквенные коды валют [4].
RUR (810) — российский рубль. Соответственно, деньги на данном счете находятся в рублях.
Ещё один пример — банковский идентификационный код (БИК).
CC CCCC CCC
Код России Код банка в пределах РКЦ Код РКЦ
Достоинства позиционной системы кодирования: логичность, простота построения, большая информативность кода, дающая возможность кодирования практически неограниченного количества классификационных признаков и их четкое выделение. Недостаток данной системы заключается в том, что при такой жесткой структуре предварительной классификации нельзя будет закодировать группировки, не установленные заранее.
Система повторения использует кодовые обозначения, которые сами являются характеристикой объекта кодирования, т.е. сохраняет уже имеющиеся обозначения признаков. То есть, если размер какого-либо инструмента 6?11, то этому инструменту присваивается код 611.
Достоинства кодирования с системой повторения: легкость запоминания и по сути отсутствие каких либо систем кодирования. Недостатки – узость применения. Обычно такая система применяется комбинированно с другими СК.
Регистрационная система кодирования
система кодирования не требует предварительной классификации объектов и используется для однозначной их идентификации. Она разделяется на порядковую и серийную системы.
Порядковая система кодирования состоит в том, что каждому объекту последовательно присваивается номенклатура номера его порядка, т.е. в кодировании информации натуральными числами. Этот порядок как случайным, так и определяемым после предварительной группировки наименований объектов по алфавиту или другим образом.
Порядковая система применяется для стабильных и достаточно простых номенклатур. Ее достоинство – это простота построения; недостаток в том, что с появлением новых объектов номенклатуры нарушается ее логическая структура, потому что новым объектам неизбежно присваиваются последние номера.
Самым простым примером данной системы является кодирование списка студентов определенное группы или целого курса (например, Рейтинг студентов в НИУ ВШЭ) где фамилии студентов, упорядоченные по алфавиту (или по успеваемости в случае Рейтинга), нумеруются цифрами из натурального ряда.
Серийная система кодирования п редполагает разбиение всех кодируемых объектов на группы по определенному признаку. Каждой группе присваивается серия кодов. В пределах этой серии каждому объекту присваивается код по порядку. Каждая серия кодовых обозначений, присваиваемая группе, в свою очередь содержит резервные коды для случая появления новых позиций номенклатуры в группе.
Преимуществами этой системы кодирования заключаются в сравнительно небольшой длине кода и возможности добавления новых объектов в группу без нарушения логичности системы. Недостатки серийной системы — трудности запоминания серий и отсутствие четкой границы между ними.
Серийная система используется в кодировании двузначных номенклатур, например, виды оплат и учреждений, структурные подразделения предприятий или организаций и т.д.
К регистрационной системе кодирования относится также и широко распространенное штриховое кодирование, которое представляет собой способ автоматической идентификации разнородных предметов, основанный на оптическом способе считывании информации.
Алгоритм данного метода таков:
В качестве идентификатора используются магнитные, графические, радиочастотные и электронные метки, применяемые в различных сферах, но наибольшей популярностью пользуется метка в виде штрихкода. Построение штрихового кода основывается на системе маркировки в виде чередования широких и узких, черных и белых полос, которыми обычно закодирована буквенно-цифровая информация. Широким линиям и широким промежуткам присвоено логическое значение 1, узким – 0. Таким образом, образуется последовательность из нулей и единиц, которая представляет собой двоичный код, в последствии считываемый специальным устройством — электронным считывателем штрихкода. В штрихкоде закодирована необходимая информация о стране-производителе, предприятии-изготовителе и самом предмете.
В современном мире существует более 50 систем штрихового кодирования. Наиболее широкое применение получили следующие системы:
Среди них в Российской Федерации наибольшее применение получили EAN- и UCC/EAN-коды.
В каждой системе существуют свои разряды кодов: EAN-8, EAN-13, EAN-14, UPC-12, UCC/EAN-128 (современная версия Code 39).
Остановимся подробнее на структуре кода EAN-13, используемого в нашей стране и получившего наибольшее распространение. Код является тринадцатиразрядным, используется для кодирования какой-либо продукции и имеет следующую структуру:
CCC CCCC CCCCC C
Первые три цифры кода — страна-производителя.
Следующие четыре цифры – код предприятия-изготовителя, которое производит или реализует его под своей торговой маркой. Список кодов стран-производителей EAN-13 приведен в табл. 2.1.
Следующие пять цифр – код продукта (товара), учитывающий такие признаки, как его потребительские свойства, размеры, оформление, упаковку, цвет и т.д.
Последняя цифра –контрольная. Она используется для проверки правильности считывания кодов специальным устройством.
Таблица 2.1
Список кодов EAN-13
Код
Страна | Страна | ||
00-09 | США, Канада | 690 | КНР |
30-37 | Франция | 70 | Норвегия |
380 | Болгария | 729 | Израиль |
383 | Словения | 73 | Швеция |
385 | Хорватия | 750 | Мексика |
400-440 | Германия | 759 | Венесуэла |
45,49 | Япония | 76 | Швейцария |
460-469 | Россия, СНГ | 770 | Колумбия |
471 | Тайвань | 773 | Уругвай |
474 | Эстония | 775 | Перу |
475 | Латвия | 779 | Аргентина |
477 | Литва | 780 | Чили |
482 | Украина | 786 | Эквадор |
484 | Молдова | 789 | Бразилия |
489 | Гонконг | 80-83 | Италия |
50 | Великобритания | 84 | Испания |
520 | Греция | 850 | Куба |
529 | Кипр | 858 | Словакия |
535 | Мальта | 859 | Чехия |
539 | Ирландия | 860 | Югославия |
54 | Бельгия, Люксембург | 869 | Турция |
560 | Португалия | 87 | Нидерланды |
569 | Исландия | 880 | Южная Корея |
57 | Дания | 885 | Таиланд |
590 | Польша | 888 | Сингапур |
599 | Венгрия | 890 | Индия |
600,601 | ЮАР | 893 | Вьетнам |
611 | Марокко | 90,91 | Австрия |
613 | Алжир | 93 | Австралия |
619 | Тунис | 94 | Новая Зеландия |
64 | Финляндия | 955 | Малайзия |