SMITH - Лабораторная информационная система с конвейерной обработкой данных высокопроизводительного секвенирования

Тип разработки: 
Программа
Регистрационный номер в ФАП: 
PR17005
Дата регистрации в ФАП: 
2017-05-19
Тематическая направленность: 
Биоинформатика. Лабораторные информационные системы. Анализ данных высокопроизводительного секвенирования
Разработчики программы (базы данных): 
Аннотация: 

SMITH является лабораторной информационной системой со встроенными конвейерами обработки биологических данных. Программа поддерживает деятельность биологической лаборатории начиная с процесса заказа на обработку биологического образца и заканчивая предоставлением готовых к интерпретации данных.

Назначение: управление пользователям, биологическими образцами, конвейерами обработки данных в лаборатории высокопроизводительного секвенирования.  

Область применения: АСУ, АСУ ТП, лабораторная информационная система (ЛИС), обработка данных ChIP-Seq, RNA-Seq, DNA-Seq.

Используемый алгоритм: Пользователь взаимодействует с SMITH для заказа секвенирования, для выбора типа и настроек секвенирования, для добавления описания образцов (в виде ключ-значение) для последующего анализа мета-данных и для отслеживания образцов через интерфейс SMITH. Пользователи также могут собрать образцы в проекты и назначить сотрудникам уровень допуска. Технический персонал взаимодействует с SMITH для сборки проточных ячеек, для ввода идентификаторов реагентов и для отслеживания уровня реагентов.

SMITH помогает в сборке проточных ячеек путем подбора образцов с совместимыми баркодами, для того, чтобы не возникало коллизий баркодов на стадии демультиплексирования. С точки зрения пользователя, наиболее важные функции – загрузка образов и отслеживание образов. Загруженные образцы имеют статус «заказан». Перед запуском секвенатора, генерируется виртуальная проточная ячейка, которую подтверждают лидеры групп. После запуска секвенирования по собранной проточной ячейке автоматически генерируется таблица, необходимая для мультиплексирования. По завершению секвенирования, SMITH автоматически отслеживает новые данные, генерируются и исполняются скрипты, которые производят файлы FASTQ, копируют их в нужные директории на сервере, запускают конвейеры обработки, запускают FastQC и отправляют уведомления пользователям, что их данные доступны для анализа. После этого, образец получает статус «проанализирован».

Функциональные возможности: 

  • Загрузка образцов
  • Аннотирование образцов
  • Анализ образцов
  • Отслеживание образцов
  • Разделение на проекты
  • Отслеживание директорий с данными
  • Контроль качества
  • Политика безопасности
  • Хранилище реагентов
  • Доступ по ролям
  • Виртуальные проточные ячейки
  • Совместимость индексов
  • Уведомления по email

Програма расчитана на нагрузки в 2-3 эксперимента высокопроизводительного секвенирования. Объем данных одного эксперимента - 40 Гб. Время обработки одного эксперимента 20-36 часов.

Инструментальные средства создания - SMITH была разработана с использованием технологии Java Enterprise и среды разработки NetBeans 7.3. SMITH запускается на сервере приложений Java EE (например, Glassfish). Apache Maven используется как инструмент управления зависимостями.

Архитектура SMITH подразделяется на веб-уровень, срединный уровень и системно-информационный уровень, следуя парадигме Model-View-Controller (MVC). Веб-интерфейс предоставляется средствами Java Server Faces (JSF) и PrimeFaces. Сервлет Faces, который является частью технологии JSF, играет роль контроллера и координирует информационный обмен между пользователем и моделью через набор представлений. Модель основана на технологии JSF Managed Beans – взаимодействующие модули, которые связаны с информационной системой, которая основана на Hibernate с базой MySQL. Отображаемые сообщения выделены в отдельный ресурс для простой интернационализации.

Публикация:

Venco F, Vaskin Y, Ceol A, Muller H.  SMITH: a LIMS for handling next-generation sequencing workflows. BMC Bioinformatics. 2014;15 Suppl 14:S3. doi: 10.1186/1471-2105-15-S14-S3.

Версия регистрируемой программы (базы данных): 
1.0
Название составного произведения: 
-
Использованные при разработке материалы: 
-
Регистрационный номер в Роспатенте: 
-
Признак доступности программы (базы данных): 
полностью свободный доступ
Требования к аппаратным и программным средствам: 

-

Контактная информация: 
https://bitbucket.org/yuriy_vaskin/smith - открытый код программы. vaskin90@gmail.com - адрес автора для вопросов