Предметная область
На сегодняшний день большинство текстовой информации с которой работает человек хранится в цифровом формате - в формате электронного документа. Так же разработан целый спектр программных продуктов, позволяющих быстро и удобно получать доступ к их содержимому, но стремительное развитие технологии постоянно увеличивает количество информации с которой оперирует человек и требует её чёткой организации.
Общепринятыми методами по улучшению восприятия текста человеком, являются методы его разделения на логические единицы и акцентирование в нем ключевой информации. Обобщённо, улучшенное и более удобное представление цифрового документа в таком виде можно назвать: электронный справочник.
Электронный справочник, это компьютерная программа имеющая набор средств для удобной навигации и поиска по своему содержимому.
Анализ опыта накопленного в процессе разработки университетских учебных пособий и автоматизированных справочных систем, позволил выделить основные этапы процесса создания электронного справочника:
Первый этап:
Сбор и подготовка исходного материала. В качестве основы может выступать любой тип представления знаний: документ, книга, пособие, реферат и т.д. Качество исходной информации полностью зависят от специалиста подготавливающего материал.
Второй этап:
Подготовка содержания справочника:
·Стандартизация внутреннего содержания
·Разделение на логические единицы
·Организация составных единиц в логическую структуру
·Создание и подбор интерфейса
·Распространение
Третий этап:
Доработка и изменение имеющейся информации
Итоговый результат первого этапа полностью зависит от качества работы специалиста, существует ряд средств призванных упростить создание первоначальной основы электронного справочника, такие средства как: текстовые процессоры, системы распознавания образов, специализированные математические системы, графические редакторы и это далеко не полный список программного обеспечения используемого при подготовке исходных данных. В целом, по этому направлению, отрасль располагает значительными наработками, имеет большую историю и устоявшиеся методики. Не достаточно или слабо автоматизированы второй и третий этапы. До сегодняшнего дня не существовало средств создания электронных справочников с высокой степенью автоматизации и приемлемым качеством генерируемого материала.
Все системы позволяющие создавать справочники можно разделить на две категории:
1. Полностью ручная обработка данных:
- Копирование и вставка частей текста из исходного документа
- Отсутствие автоматической организации содержания
- Невозможность синхронизации с исходными данными
2. Системы с чёткой логикой:
- Необходимость разработки документа специально под систему
Основная работа по подготовке данных для загрузки в электронный справочник ложиться на человека и имеющиеся средства работы с документами показывают свою низкую эффективность.