[an error occurred while processing this directive]
Электронные архивы могут строиться с привлечением FTP-архивов, средств поиска для Web, а также за счет предоставления Web-интерфейса к традиционным системам управления документами. При этом основной задачей остается организация эффективного контекстного поиска информации.
5.3.1. Применение FTP-архивов
FTP-архивы являются одним из основных информационных ресурсов Internet. Фактически, это огромное распределенное хранилище всевозможной информации (программы, музыка, фильмы, текстовые файлы), доступ к этим архивам осуществляется специальной программой FTP, которая обращается к специальному серверу, управляющему файловым архивом на удаленной машине. FTP-архив - это часть файловой системы, которая доступна для удаленного пользователя FTP-сервера. Важным свойством FTP-архивов является возможность так называемого анонимного доступа.
Любой пользователь может воспользоваться услугами анонимного доступа к хранилищу и скопировать интересующие его материалы. Для того, чтобы получить доступ к архиву, следует отправить сообщение по адресу. Далее робот попытается установить анонимное соединение с FTP-сервером. В результате будет получен список файлов корневой директории сервера, робот прервет работу с сервером и вернет результаты пользователю.
Важным моментом, ради чего осуществляется доступ к FTP-серверу, является запрос на передачу файлов. Передавать можно текстовые и двоичные файлы. В течение одной сессии можно открывать и закрывать FTP-соединения с разными FTP-серверами, заказывать кодировку двоичных файлов, получать подсказку о своем месте в файловой системе сервера и т.д. Можно получить список FTP-архивов.
Практически любой архив строится как иерархия директорий. Многие архивы дублируют информацию из других архивов (так называемые "зеркала"). Для того чтобы получить нужную информацию, вовсе не обязательно ждать, когда информация будет передана издалека, можно поискать "зеркало" где-нибудь ближе. Для этой цели существует специальная программа Archie, которая позволяет просканировать FTP-архивы и найти тот, который устраивает пользователя по составу программного обеспечения и коммуникационным условиям.
Информация в FTP-архивах разделена на три категории:
Из выше перечисленных ресурсов наиболее интересными, по понятным причинам, являются две последних категории, которые, как правило, оформлены в виде FTP-архивов.
Технология FTP была разработана в рамках проекта ARPA и предназначена для обмена большими объемами информации между машинами с различной архитектурой. Главным в проекте было обеспечение надежной передачи, и поэтому с современной точки зрения FTP кажется перегруженным излишними редко используемыми возможностями. Стержень технологии составляет FTP-протокол.
FTP (FileTransferProtocol, или "Протокол Передачи Файлов") - один из старейших протоколов Internet и входит в его стандарты. Обмен данными в FTP проходит по TCP-каналу. Построен обмен по технологии "клиент-сервер".
FTP - это интерфейс пользователя при обмене файлами по одноименному протоколу. Программа устанавливает канал управления с удаленным сервером и ожидает команд пользователя. Идентификатор удаленного сервера указывается либо аргументом программы, либо в команде интерфейса open.
В настоящее время доступ по FTP-протоколу осуществляется из множества мультипротокольных интерфейсов (например, Netscape) или графических ftp-оболочек типа ftp-tool для X-Window. Все они гораздо удобнее и проще в использовании, но и потребляют гораздо больше ресурсов. FTP-сервер есть даже для MS-DOS, не говоря о многозадачных средах. Однако поиск нужного FTP-сервера в Internet - задача сложная и трудоемкая. Для ее облегчения существует специальное средство - Archie. Задача Archie - сканировать FTP-архивы на предмет наличия в них требуемых файлов. Работать с Archie можно через telnet-сессию, через локального клиента или по электронной почте.
В заключение хотелось бы отметить, что FTP-архивов очень много, и каждый может выбирать тот, что ему больше нравится.
5.3.2. Системы управления документами на основе Web-технологий
Сегодня на корпоративных Web-узлах скопились гигантские объемы информации, а в интрасетях, созданных для облегчения взаимодействия между отделениями организаций и предприятий, хранится громадное количество электронных документов. Возникла серьезная проблема управления этими документами. Стали необходимы системы, обеспечивающие совместное использование документов сотрудниками и обеспечивающие возможность публикации документов на Web-узлах.
Одно из решений - превратить все бумажные документы в электронные и сосредоточить их в базе данных главного офиса/отделения, обеспечив к ним доступ по интрасети всем своим сотрудникам, а по Internet - "внешним" пользователям. Это позволит снизить затраты на распространение бумажной документации за счет публикации необходимой информации в Internet и интрасети и повысить эффективность работы с документами.
Основные функции системы управления документами - классификация информации, размещение ее в библиотеках баз данных и предоставление пользователям интерактивного доступа к документам. Право на работу с документами определяется с помощью идентификатора пользователя и входного пароля, а возможность обработки информации обеспечивается программными средствами, которые позволяют редактировать документы, коллективно работать с ними, а также обмениваться ими по каналам электронной почты.
В качестве клиентской части системы управления документами на основе Web-технологий используют стандартный броузер. С помощью этих систем можно мгновенно получить любые изменения, внесенные руководством в документы, подключившись к корпоративному серверу посредством модема и броузера, и найдя необходимый отчет в библиотеке базы данных.
В традиционных системах управления документами на пользовательском компьютере требовалось установить клиентскую часть приложения, а для каждого пользователя, принимающего участие в коллективной работе с документами, было необходимо приобрести лицензию, что приводило к значительным материальным затратам. Системы управления документами на базе Web не требуют расходов на клиентское ПО.
Чтобы установить систему управления документами, не обязательно иметь интрасеть на базе протокола IP. Необходимо только наличие Web-сервера и выделенного сервера для самой системы управления документами. Однако, если в сети не поддерживается этот протокол, можно подключить Web-сервер к корпоративной сети посредством любого шлюза типа IPX-to-IP.
Планируется, что Web-системы управления документами будут выполнять функции автоматизации деловых процедур, осуществляя не только разделение документов на категории и взаимодействие с библиотеками баз данных, но и маршрутизацию документов. Еще одна функция заключается в предоставлении доступа к корпоративным информационным библиотекам.
Наиболее сложной является проблема защиты информации. Если доступ к информации односторонний, обеспечить надежную защиту легко: достаточно предоставить внешним пользователям, обращающимся к библиотекам документов через Web, право только искать и читать данные, что значительно снижает опасность внесения несанкционированных изменений в ответственную информацию. В данном случае пользователь с помощью Web-броузера может только ознакомиться с данными, размещенными на Web-сервере, который установлен между ним и внутренней сетью корпорации. Когда же система управления документами применяется для двустороннего доступа к информации (а именно этот способ совместного использования документов особенно привлекателен), проблема защиты осложняется. Теперь для обеспечения безопасности корпоративной базы данных требуется специальное ПО, регламентирующее права доступа. Кроме того, на клиентском компьютере должно быть установлено специальное приложение, поддерживающее связь с сервером и позволяющее регистрировать документы и изменения. Большинство систем, предназначенных для управления документами в системе Web, включают развитое серверное ПО и небольшую клиентскую часть, рассчитанную на так называемого "слабого" клиента, т.е. устройство, не имеющее мощного процессора и способное обеспечить только просмотр информации с помощью Web-броузера. Эти системы не позволяют полностью контролировать доступ пользователей к информации.
Некоторые пользователи устанавливают собственные средства обеспечения безопасности информации. Например, средством защиты информации может служить брандмауэр, расположенный между интрасетью и Internet. Для проверки прав пользователей вводятся идентификационные карточки с кодированием, а также идентификаторы и пароли. Когда удаленный пользователь обращается к серверу, система автоматически генерирует уникальный пароль и при помощи идентификационной карты сверяет его с тем, который вводит пользователь. Пересылать документы через брандмауэр на внешние Web-узлы разрешено ограниченному кругу лиц. Все эти меры плюс средства защиты серверов и полный запрет на доступ к сети из внешних Web-узлов создают условия для безопасной и удобной работы персонала.
Одной из практических реализаций системы управления документами на основе Internet-технологий является программный продукт DOCSOpen компании PCDOCS, который позволяет организовать электронный архив на предприятии. Система предназначена для хранения, поиска и обработки информации, хранящейся в распределенной гетерогенной среде на накопителях различной природы.
DOCSOpen хранит документы в файлах, которые размещаются в файловой системе сервера, каждый документ содержится в исходном виде (в виде одного или нескольких файлов). DOCSOpen имеет средства миграции документов по различным типам носителей данных. Миграция документов осуществляется автоматически в соответствии с частотой обращения к документам. Система DOCSOpen интегрирована с внешними процессорами обработки информации. Для обработки любого документа вызывается внешний процессор. Документы редактируются непосредственно по месту хранения (т.е. прямо на серверах документов). Если доступ к документам медленный, есть возможность предварительного создания локальной копии документа. Каждый документ в системе DOCSOpen снабжается учетной карточкой. В карточке документа содержится обязательная информация, необходимая для нормального функционирования самой системы DOCSOpen, и дополнительная информация, состав которой определяет пользователь системы. DOCSOpen снабжен подсистемой полнотекстовой индексации. Эта система позволяет находить документы не по учетной информации, а по содержанию документа.
DOCSOpen строит поиск на основе интерфейса QBE (QueryByExample). Для того, чтобы не вводить наиболее часто используемые запросы, DOCSOpen позволяет сохранить типовые поисковые запросы. Можно объединять документы в папки, которые могут быть связаны между собой произвольным образом. Это дает возможность построить целую систему сетевой классификации документов произвольного вида.
Наиболее сильной стороной DOCSOpen является возможность ведения распределенных и удаленных архивов информации. Организация может иметь несколько территориально распределенных архивов информации. Карточки документов и сами документы хранятся непосредственно в той библиотеке, куда они были первоначально положены (однако, можно явно откопировать документ в другую библиотеку). Администратор системы записывает в локальную библиотеку адреса всех доступных библиотек. В начале работы указывается, где искать информацию. После этого система автоматически организует поиск в распределенной системе.
В новой, третьей версии DOCSOpen осуществлена многоплатформная поддержка клиентов и серверов, гибкая конфигурация, возможности защиты информации (модуль DocumentSentryAgent). Усовершенствована работа с мобильными системами. Существенно продвинуто ядро полного поиска.
В DOCSOpen 3.0 усовершенствованы возможности индексации и поиска, благодаря замене ядра Infolink, которое выпускалось с версиями 2.x и более ранними, на ядро компании Verity, позволяющее создавать полный индекс текста. Ядро Verity предлагает возможность осуществлять нечеткий или концептуальный поиск и создавать разбитые на соответствующие категории отсортированные списки наиболее популярных вариантов поиска и многоуровневых запросов.
DOCSUnplugged - это готовый вариант DOCSMobile - популярного модуля версии 2.5. Помимо обеспечения мобильной взаимосвязи, Unplugged позволяет работать в автономном режиме при возникновении сбоя сети.
DOCSOpen предлагает функцию MobileTeam, при помощи которой удаленные рабочие группы, не связанные с корпоративной сетью, могут получить доступ к библиотекам DOCSOpen.
DOCSInterchange для MicrosoftExchange совершенствует рабочий процесс и совместное использование информации, давая возможность публиковать содержимое документов и варианты настройки, хранящиеся в библиотеке.
РС DOCS разработал технологию управления документами в Internet, совместимую с Web-технологией. С ее помощью обеспечивается доступ к DOCS-хранилищу из любого Web-броузера, публикация документов на Web-сервере и шифрование информации. Для этого служат ниже перечисленные продукты.
DOCSLinks - средство построения сложных связей между документами. Этот компонент позволяет строить связи между документами, не помещая их в папки. При этом поддерживаются два типа связей: направленные вертикальные связи (типа "главный - подчиненный") и ненаправленные горизонтальные связи (типа "родственные документы"). Данная система позволяет строить сложную сеть документов, типичную для таких сфер применения, как архивы нормативно-справочных или юридических документов.
DOCSBrowser - компонент, позволяющий отобразить содержание архива в структурном виде (в формате Explorer). Причем пользователь может выбрать формат представления информации, критерии сортировки и группировки документов. Данная компонента упрощает доступ неподготовленных пользователей архивной системы к документам, объединяет различные разрозненные компоненты в одном.
WorkRouteII- компонент маршрутизации документов. После установки система становится частью рабочего места DOCSOpen. Она обеспечивает маршрутизацию работ и связанных с ней документов, а также контроль исполнения и автоматическое напоминание о просроченных работах. Можно отметить следующие особенности данного компонента:
PCDOCS работает над тремя отдельными проектами, связанными с Internet, которые помогут связать глобальных пользователей DOCSOpen. Первый продукт, называемый CyberDOCS 1.1 (псевдоним Mercury) предоставит пользователям возможность поиска и получения документов, хранящихся в библиотеке DOCSOpen, через программу просмотра Web. В процессе разработки находится и Venus, который расширяет эту идею, используя Internet в качестве глобальной сети, а продукт Jupiter предоставит пользователям DOCSOpen доступ к серверам документов через Internet в многоуровневых окружениях клиент-сервер.
Продукт CyberDOCS 1.1 реализован на базе HTML-технологий. Схема работы близка к работе со стандартным клиентом базового пакета. После набора имени и пароля, а также успешного подсоединения к системе пользователь видит на экране страницу, где он может обратиться к списку документов. Можно воспользоваться и панелью кнопок вверху экрана, получить доступ к карточке поиска по образцу, списку проектов, к выбору другой библиотеки. Форма поиска по образцу близка к стандартной запросной карточке базовой системы. Пользователю доступны все справочники, с помощью которых могут быть заполнены поля карточки, а также поиск по содержанию документа.
Кроме того, компания Infodata объявила о выходе продукта VFC - VirtualFileCabinet. Основное назначение - обеспечение унифицированного доступа к разнообразным хранилищам документов, начиная от LotusNotes и заканчивая DOCSOpen. Этот доступ осуществляется через стандартный Web-броузер. В задачу Infodata входит создание шлюзов для разных систем и различным коллекциям документов.
Несмотря на некоторые недостатки Web-систем управления документами, их широкие возможности при использовании в Internet и интрасетях для публикации и интерактивной работы с документами в ближайшее время приведут к массовому использованию этих систем широким кругом пользователей.
Назад | Содержание | Вперед
[an error occurred while processing this directive]