Предметная область

На сегодняшний день большинство текстовой информации с которой работает человек хранится в цифровом формате - в формате электронного документа. Так же разработан целый спектр программных продуктов, позволяющих быстро и удобно получать доступ к их содержимому, но стремительное развитие технологии постоянно  увеличивает количество информации с которой оперирует человек и требует её чёткой организации.

Общепринятыми методами по улучшению восприятия текста человеком, являются методы его разделения на логические единицы и акцентирование в нем ключевой информации. Обобщённо, улучшенное и более удобное представление цифрового документа в таком виде можно назвать: электронный справочник.

Электронный справочник, это компьютерная программа имеющая набор средств для удобной навигации и поиска по своему содержимому.

            Анализ опыта накопленного в процессе разработки университетских учебных пособий и автоматизированных справочных систем, позволил выделить основные этапы процесса создания электронного справочника:

            Первый этап:

Сбор и подготовка исходного материала. В качестве основы может выступать любой тип представления знаний: документ, книга, пособие, реферат и т.д. Качество исходной информации полностью зависят от специалиста подготавливающего материал.

 

            Второй этап:

            Подготовка содержания справочника:

      ·Стандартизация внутреннего содержания

      ·Разделение на логические единицы

      ·Организация составных единиц в логическую структуру

      ·Создание и подбор интерфейса

      ·Распространение

            Третий этап:

            Доработка и изменение имеющейся информации

 

Итоговый результат первого этапа полностью зависит от качества работы специалиста, существует ряд средств призванных упростить создание первоначальной основы электронного справочника, такие средства как: текстовые процессоры, системы распознавания образов, специализированные математические системы, графические редакторы и это далеко не полный список программного обеспечения используемого при подготовке исходных данных. В целом, по этому направлению, отрасль располагает значительными наработками, имеет большую историю и устоявшиеся методики. Не достаточно или слабо автоматизированы второй и третий этапы. До сегодняшнего дня не существовало средств создания электронных справочников с высокой степенью автоматизации и приемлемым качеством генерируемого материала.

Все системы позволяющие создавать справочники можно разделить на две категории:

            1. Полностью ручная обработка данных:

- Копирование и вставка частей текста из исходного документа

- Отсутствие автоматической организации содержания

- Невозможность синхронизации с исходными данными

                        2. Системы с чёткой логикой:

                                   - Необходимость разработки документа специально под систему

            Основная работа по подготовке данных для загрузки в электронный справочник ложиться на человека и имеющиеся средства работы с документами показывают свою низкую эффективность.