Поиск, парсинг и анализ данных с NCBI
Необходимо выполнить поиск по базам данных NCBI и найти генетические вариации, которые могут быть ассоциированы с определёнными фенотипическими признаками. Предпочтительно использование Biopython (https://biopython.org/), в таком случае смогу предоставить часть готового кода для выполнения работы.
Примерная схема выполнения работы:
1. Поиск по базам данных NCBI (сформулированные запросы предоставлю)
2. Получение ассоциированных записей (с помощью Entrez API)
3. Сохранение общего перечня найденных генетических вариаций
4. Отсев генетических вариаций по ряду признаков
Ожидаемый результат: таблица с перечнем вариаций и их свойствами (локализация, встречаемость, SNPID и проч.)
Пример данных, с которыми необходимо работать, на приложенном изображении.
Примерная схема выполнения работы:
1. Поиск по базам данных NCBI (сформулированные запросы предоставлю)
2. Получение ассоциированных записей (с помощью Entrez API)
3. Сохранение общего перечня найденных генетических вариаций
4. Отсев генетических вариаций по ряду признаков
Ожидаемый результат: таблица с перечнем вариаций и их свойствами (локализация, встречаемость, SNPID и проч.)
Пример данных, с которыми необходимо работать, на приложенном изображении.