Создание библиографической базы данных по ядерному топливу

ООО НПФ «Сосны» всегда позиционировала себя как научно-производственную фирму, предлагающую свои услуги в сфере такой высокотехнологичной и наукоемкой отрасли, как ядерная энергетика. Важнейшей составляющей научного процесса всегда является изучение опыта предшественников и анализ достижений в изучаемой проблеме. Предметом изучения и анализа для научных сотрудников фирмы являются свойства материалов и характеристики конструкций, особенности технологий по обращению с ядерным топливом, применяемые методы испытания и исследования материалов и конструкций. Современные способы предоставления информации в науке чрезвычайно разнообразны, и, не в последнюю очередь, основаны на использовании Интернета. Хорошо развиты инструменты доступа к полнотекстовым научным документам у англоязычных научных журналов и международных издательств, выпускающих труды научных конференций. В этом случае нет необходимости создавать специальные инструменты обеспечения научных сотрудников и инженеров первоисточниками в виде статей, докладов, отчетов, монографий и т.д. Однако если мы попытаемся найти нужные первоисточники на русском языке, то обнаружим, что доступ к этим документам невозможен не только в интернете. Большинство российских научных журналов вообще не предоставляет тексты статей в электронном виде.

Это обстоятельство приводило к тому, что каждый научный сотрудник фирмы создавал свою собственную библиотеку и свой собственный способ доступа к документам. Как правило, это были электронные версии первоисточников в форматах .PDF, .DOC, .JPG и др., аккуратно разложенные по каталогам в соответствии с собственными представлениями научного сотрудника о структуре предметной области. Понятно, что в этой структуре мог ориентироваться только сотрудник, создавший эту библиотеку. Такой подход к информационному обеспечению сотрудников фирмы нельзя было считать удовлетворительным. Корпоративный подход требовал создания единой библиотеки документов и единого инструмента доступа к ним. Поэтому два года назад руководство фирмы приняло решение создать библиографическую базу данных (ББД) документов, содержащих сведения, в первую очередь, по свойствам ядерного топлива (ЯТ) и материалов, используемых в ядерной энергетике. При этом ставились следующие задачи:

  • Сохранение накопленного к настоящему времени научного багажа по свойствам ядерного топлива для существующих реакторов ВВЭР, РБМК и РБН (в основном, оксидного ядерного топлива).
  • Сбор и аккумуляция знаний по свойствам ядерного топлива для реакторов РБН нового поколения (в основном, нитридного ядерного топлива).
  • Сбор и аккумуляция знаний по технологиям обращения с ядерным топливом (изготовление, эксплуатация, хранение, транспортирование, переработка).
  • Предоставление пользователю (научным сотрудникам, технологам, конструкторам) инструмента для выборки нужных документов на основе заданных критериев поиска.
  • Предоставление пользователю инструмента для пополнения и развития ББД по ядерному топливу.

Перед создаваемой базой данных были сформулированы следующие достаточно противоречивые требования:

  • Локальность размещения документов (никаких «облаков»!) и многопользовательский доступ.
  • Удаленный доступ к документам и защита документов от несанкционированного использования.
  • Отечественная разработка программных продуктов.
  • Совместимость с КОМПАС 3D, как основным инструментом работы сотрудников фирмы.
  • Дружественный интерфейс.
  • Приемлемая цена.

В качестве платформы для создания ББД была выбрана программа Лоцман:ПГС российского производителя РЦ АСКОН-Волга, который разработал специализированный модуль для занесения и поиска документов, а также для построения отчетов о поиске. На этапе обследования были выявлены основные виды научно-технических документов и их атрибутов. Полученная информация легла в основу технического задания на разработку модуля, где были описаны принципы его работы, приведены эскизы интерфейсов, структура хранения документов в ЛОЦМАН:ПГС.

Наиболее болезненным вопросом при создании ББД по ЯТ был вопрос об индексировании документов, под которым понимается создание метаданных, описывающих формальные и содержательные атрибуты документа. Как указывалось выше, большая часть русскоязычных документов не имеет электронных версий, и потому приходилось прибегать к самому примитивному сканированию бумажных версий журналов и книг, изданных в те годы, когда слово «компьютер» было уделом избранных. Это означало, что значительная часть документов будет представлена в графическом формате PDF, для распознавания текста которых необходимо использовать специальные программные средства. Автоматизация процесса индексирования таких документов (наподобие поисковых систем Яндекс и Google) значительно усложняла задачу, делая ее сравнимой с задачами распознавания образов и анализа семантики текстов. Поэтому было принято решение о «ручном» индексировании документов.

Таким образом, элементарной единицей ББД по ЯТ является документ в формате PDF. Каждый документ имеет «карточку», в которую заносится набор формальных и содержательных атрибутов. Формальные атрибуты описывают «внешние» характеристики документа (название, автор, источник и т.п.). Содержательные атрибуты (объект исследования, параметры исследования, метод исследования и т.п.) с помощью ключевых слов отражают содержание документа. Каждый документ ББД по ЯТ имеет следующие формальные атрибуты:

  • номер документа в БД,
  • тип документа (статья, доклад, книга, справочник и т.д.),
  • название документа,
  • авторы документа,
  • предприятия, представляющие документ,
  • источник документа (журнал, конференция, издательство),
  • краткая аннотация.

Ключевые слова, определяющие содержательные атрибуты, отражают следующие сведения о документе:

  • объект испытания или исследования (топливная композиция, конструкционный материал, технологическое оборудование и т.д.),
  • методы испытания (облучение, нагрев, испытание давлением, коррозионные испытания и т.д.),
  • параметры испытания,
  • методы исследования,
  • исследуемые параметры (плотность, теплопроводность, распухание, механические свойства и т.д.),
  • область применения результатов (переработка ОЯТ, хранение ОЯТ, методы измерений и т.д.),
  • география применения результатов (типы реакторов).

От качества индексирования, т.е. от подбора ключевых слов, в значительной степени зависит результат поиска документов. Карточку можно просмотреть, изменить или дополнить, вызвав окно «Свойства документа». Возможности модуля позволяют (в случае обнаружения ошибок и неточностей индексирования) вносить изменения и дополнения в поля, отвечающие как за формальные, так и за содержательные атрибуты. Наиболее часто встречающиеся ключевые слова занесены в подключаемые справочники полей.

Право создавать и редактировать карточки атрибутов документов, а также пользоваться результатами поиска имеет любой пользователь, обладающий необходимыми правами. Права на использование ресурсов «Библиографической базы данных по ЯТ» выдает администратор БД с согласия научного руководителя фирмы.

Поиск нужного документа осуществляется с помощью ключевых слов, задаваемых в соответствующих полях карточки поиска. Например, нужно найти все документы, одновременно содержащие ключевые слова «нитридное топливо»+«теплопроводность». Или: найти все документы определенного автора, например, «Канашов». Последняя опция имеет значение для соискателей, которые заинтересованы в поддержании списка своих трудов. Результаты поиска представляются в виде списка документов, доступ к текстам которых осуществляется одним «кликом». Любой нужный документ может быть сохранен на компьютере пользователя для использования в дальнейшей работе.

По состоянию на август 2015 года библиографическая база данных по ядерному топливу ООО НПФ «Сосны» содержит около 1000 полнотекстовых документов на русском и английском языках, представляющих информацию о свойствах материалов, положенных в основу компонентов как существующих ядерных реакторов, так и реакторов нового поколения. Сама ББД и программный модуль прошли этап опытно-промышленной эксплуатации, который позволил уточнить требования пользователей к ней и определить дальнейшие шаги по усовершенствованию механизмов поиска и интерфейса. Реализация этих предложений позволит приступить к разработке новых модулей, поддерживающих библиографические БД по ядерным технологиям, методам испытаний и измерений, контейнерам для перевозки ядерных материалов и радиоактивных веществ, поставщикам материалов и оборудования.

Пример заполнения карточки атрибутов документа ББД по ЯТ

Количество просмотров: 380

Перезвоните мне
Спасибо! Ваша сообщение отправлено, в ближайшее время мы свяжемся с Вами!