Data science в биологии

Статистические методы позволяют обучить машину выискивать в огромных таблицах биологических параметров важные закономерности. После лабораторной проверки эти закономерности могут использоваться для диагностики, назначения лекарств или планирования экспериментов.

Основная проблема работы с биологическими данными - это повышенная склонность математических алгоритмов к переобучению (ложным предсказаниям на практике при благоприятных теоретических прогнозах). Причиной тому служит огромная размерность пространства параметров и, как правило, маленькая обучающая выборка. Мы хорошо осознаем и успешно боремся с подобными эффектами.

Математические методы работают только в купе со знаниями механики внутриклеточных взаимодействий, позволяющими доопределить задачу. Наша команда обладает знаниями предметной области (биологии), которые критически необходимы при анализе данных.

Результаты наших предсказаний многократно проверяются и корректируются в лабораторных условиях и обладают высокой степенью достоверности.

 

Назад