ТЕХНИЧЕСКОЕ ЗАДАНИЕ

ДЛЯ АРХИВА РАБОЧИХ ДОКУМЕНТОВ ПО ЭКОНОМИКЕ И СОЦИОЛОГИИ

Для реализации этого пункта проекта предполагается создать:

  1. Возможность принимать на хранение файлы документов (отвечающие требованиям данного архива) как по электронной почте, так и через прямой Интернет доступ к соответствующему сервису архива.
  2. Чисто российскую и международную системы регистрации материалов (рабочих документов). Второе предполагается сделать на основе уже существующих международных архивов (Working Papers Archive). Пользователь будет иметь выбор: регистрировать свой документ только в одной из них, или в обоих. Если документ регистрируется только в российской части архива, то он не будет попадать в область поиска пользователей международных архивов рабочих документов.
  3. Два интерфейса, рассчитанных, как на пользователей имеющих только электронную почту, так и на тех, кто имеет прямое подключение к сети Интернет. В первом случае, будет использовано программное обеспечение типа listserv и стандартный набор команд, позволяющий пользователю через электронную почту (в режиме офлайн) помещать документы в архив и делать поиск в архиве. Во втором, пользователи будут работать с архивом в диалоговом режиме (онлайн) через WWW интерфейс.
  4. Две формы для поиска нужной информации в архиве: 1)по ключевым словам; 2)сортировкой содержимого архива по определенным полям (например, в алфавитном порядке по фамилии автора, или просмотр содержимого по разделам рубрикатора и т.п.).

При выполнении первого этапа работ (до 1 октября 1997 г.) предполагается выполнить следующие работы:

  1. Договориться с администрацией одного из основных международных Working Paper Archive по социальным наукам (предлагаю взять за основу один из наиболее известных западных аналогов - WoPEc, который установлен на нескольких серверах в мире http://netec.wustl.edu/WoPEc.html или зеркало в Англии на http://netec.mcc.ac.uk/WoPEc.html или в Японии на http://netec.ier.hit-u.ac.jp/WoPEc.html) об автоматическом включении результатов регистрации по нашей международной форме в их базу данных (в принципе, можно просто переадресовать пользователей прямо к их форме регистрации, тогда нет необходимости о чем-то с ними договариваться). Исполнители - гр. Паринова.
  2. Разработать и реализовать техническую и организационную систему хранения файлов документов в архиве и базу данных регистрации документов. Второе должно быть прозрачно для сквозной индексации, выполняемой системой Информационной Ориентации нашего сервера (пример этой системы можно посмотреть на http://rvles.ieie.nsc.ru/htdig/search.html). Вероятно, можно использовать результаты этой индексации для поиска по ключевым словам в архиве и поэтому не создавать для архива аналогичной самостоятельной системы. Кроме этого, способ хранения должен допускать два вида доступа к хранимой информации: средствами листсерва и хтмл-сервера. Исполнители - гр. Марчука.
  3. Сделать формы регистрации документов, в качестве прототипа которых могут быть использованы соответствующие формы международного архива (см. пример формы на http://netec.mcc.ac.uk/%7eadnetec/local/WoPEc_Input.html, или другой пример, который ближе к нашему случаю - http://wuecon.wustl.edu/wpasubmit.html). Пример аналогичного интерфейса (включая формы и другие аспекты) для пользователей архивов см. на http://wuecon.wustl.edu/. Отличие нашей формы от международной будет: - в использовании российского рубрикатора (например, по типу экономических разделов в рубрикаторе на http://ftp.elvisti.kiev.ua/elv-sci/), - в возможности пользователей сдать свой документ на хранение на наш сервер, - в возможности делать регистрацию по электронной почте (в режиме офлайн). Исполнители: а)перевод прототипов на русский - гр. Паринова; б)подготовка российского рубрикатора - гр. Боброва; в)"хтмл" и "листсерв" интерфейсы для регистрации - гр. Марчука.
  4. Сделать процедуры поиска по ключевым словам, а также по полям регистрационной формы и рубрикатора. Первая процедура может быть унаследована от общей для сервера системы Информационной Ориентации. Исполнители: а)процедура поиска по ключевым словам - гр. Паринова; б)процедура сортировки и просмотра (поиска) содержания архива по полям формы регистрации и рубрикатора - гр. Марчука.
  5. Формы запросов по ключевым словам и полям в виде "хтмл" и "листсерв" интерфейсов (в качестве примера формы с интерфейсом первого вида, см. http://netec.mcc.ac.uk/%7eadnetec/local/WoPEcSearch.html). Исполнители - гр. Марчука.
  6. Создание процедуры показа количества уникальных хостов, обратившихся на для просмотра к отдельным документам архива (по типу - http://netec.mcc.ac.uk/%7eadnetec/WoPEc/data/Exposure.html). Возможно, создание автоматической таблицы содержания архива по разделам рубрикаторов (например, как это сделано на http://wuecon.wustl.edu/). Исполнители - гр. Марчука.

Дополнительные вопросы:

1)способ хранения файлов с документами (нужна ли СУБД, можно ли ограничиться Юниксовой файловой системой);

2)перечень разрешенных форматов документов (должны включать случаи с формулами и рисунками), достаточно ли следующих форматов: чистый текст (в какой кодировке), хтмл, винворд.док (как быть с возможными вирусами в макросах);

3)тематические ограничения на прием документов (начальная тематическая структура архива);

4)использование СУБД, видимо, не является жизненноважным, т.к. количество документов не будет слишком большим (в мировом архиве - только 4000).