Ниже описаны новые проекты, которые мы хотим развивать:
- Разработка и тестирование новых методов оценки генетического потенциала животных в качестве альтернативы gBLUP. Первый этап проекта включает в себя поиск новых методов оценки племенной ценности, в частности, байесовских методов, и их применение к имеющимся данным. На втором этапе предлагается разработка и тестирование собственных методов
- Разработка системы автоматической обработки и анализа генотипических данных животных, полученных из лабораторий технологией SNP, и фенотипических данных животных, поставляемых российскими животноводческими хозяйствами в виде базы данных Firebird. Стэк: python, apache nifi, firebird, postgresql, биоинформатические пакеты
- Генерация генотипа потомка с учетом генотипов его родителей. Построение и имплементация математической модели генетического потенциала животного от скрещивания двух животных с известными генотипами. Сравнение качества модели с стандартными подходами оценки потомков.
- Анализ породного состава баранов и коров. Задача предполагает построения классификаторов, определяющих породную принадлежность животного по его генотипу. Предполагается использование различных методов машинного обучения. Особенность задачи: метод должен хорошо работать для животных - гибридов двух различных пород. Один из возможных путей решения — генерация генотипов гибридов и обучение классификатора на таких "виртуальных" гибридах.
- Обзор и имплементация современных подходов к параллельному расчету моделей семейства Linear Mixed Model (в частности ssGBLUP) на большом объеме генотипических данных. Так, большое количество генотипов не позволяет хранить в памяти матрицу родства между животными, необходима оптимизация применяемого сейчас алгоритма. Анализ производительности и её сравнение с мировыми baseline реализациями ssGBLUP на примере фенотипических и генетических даных российских животноводческих хозяйств. Задача предполагает применение современных библиотек для линейной алгебры.