FUNCTIONAL SITE PREDICTION BY EXPLOITING
CORRELATIONS BETWEEN LABELS OF
INTERACTING RESIDUES
Андрей  Белобородов
Предсказание  функциональных  участков  белков  
по  зависимостям  в  типах  взаимосвязи              
аминокислотных  остатков
17
ЗАЧЕМ?
 Белки  важны
 Белков  много
 Структура  определяет
функциональность
…но  нетривиально
Задача:  предсказать  по  структуре  
белка    какие  аминокислотные  остатки  
будут  функциональны  в  нём. 2
ЧТО?
Белок  состоит  из  соединённых  в  цепочку  
аминокислот.  Каждая  аминокислота-кирпичик  может  
быть  
функциональной  – участвовать  в  реакциях  с  другими  
веществами
или  нефункциональной  – служить  каркасом  белка.
При  построении  модели  учитываются  всевозможные  
параметры  остатков.
 Положение  в  группе  остатков  
 Физико-химические  свойства
 Электростатические  свойства
3
ПОДХОДЫ
 Шаблоны  - поиск  3D паттернов  в  структуре  
белка.  Паттерны  строятся  экспертом.
 Остатки  – обучение  компьютерных  моделей  
распознавать  функциональные  остатки,  на  
основе  тренировочных  выборок.
 Предложенный  способ  относится  ко  2ой  
категории  с  элементами  первой
 Нигде  не  учитывается   взаимодействие  между  аминокислотными   остатками
4
СЕТЬ ВЗАИМОДЕЙСТВИЙ ОСТАТКОВ
Residue Interaction Network (RIN)
 Белок,  содержащий  n аминокислотных  остатков
 Информация  о  контакте  остатков
 Признак  функциональности  остатка
 Информация  о  взаимосвязи  (схожести)  остатков
5
6
1
2
3
4 5
6
8
12
11
10
7
E 1 2 3 4 5 6 7 8 9 10 11 12
1 1 1 0 0 0 0 0 0 0 0 0 0
2 1 1 1 0 0 0 0 0 1 1 0 0
3 0 1 1 1 0 0 0 0 1 1 0 0
4 0 0 1 1 1 0 0 0 0 0 0 0
5 0 0 0 1 1 1 0 0 0 0 0 0
6 0 0 0 0 1 1 1 0 0 0 0 0
7 0 0 0 0 0 1 1 1 0 0 0 0
8 0 0 0 0 0 0 1 1 1 0 0 0
9 0 1 1 0 0 0 0 1 1 1 0 0
10 0 1 1 0 0 0 0 0 1 1 1 0
11 0 0 0 0 0 0 0 0 0 1 1 1
12 0 0 0 0 0 0 0 0 0 0 1 1
9
Y -1 -1 -1 -1 -1 -1 -1 1 1 1 1 -1
W 1 2 3 4 5 6 7 8 9 10 11 12
1 1 1 0 0 0 0 0 0 0 0 0 0
2 1 1 1 0 0 0 0 0 -1 -1 0 0
3 0 1 1 1 0 0 0 0 -1 -1 0 0
4 0 0 1 1 1 0 0 0 0 0 0 0
5 0 0 0 1 1 1 0 0 0 0 0 0
6 0 0 0 0 1 1 1 0 0 0 0 0
7 0 0 0 0 0 1 1 -1 0 0 0 0
8 0 0 0 0 0 0 -1 1 1 0 0 0
9 0 -1 -1 0 0 0 0 1 1 1 0 0
10 0 -1 -1 0 0 0 0 0 1 1 1 0
11 0 0 0 0 0 0 0 0 0 1 1 -1
12 0 0 0 0 0 0 0 0 0 0 -1 1
ПЛАН ДЕЙСТВИЙ
7
РЕГУЛЯРИЗОВАННАЯ L1 ЛОГИСТИЧЕСКАЯ
РЕГРЕССИЯ
𝑥 = 𝑎 + 𝑥′
𝑎 – параметр,  склоняющий  
классификатор  в  ту  или  
иную  сторону
8
ЛОКАЛЬНЫЙ КЛАССИФИКАТОР
Local classifier
 𝑥 - вектор  (набор) известных  параметров  остатка  𝑎
 Вероятность  того,  что  остаток  окажется  
функциональным  на  основе  его  параметров
 Порог  после  которого  считать,  что  остаток  
функционален
9
КЛАССИФИКАТОР ТИПОВ ВЗАИМОСВЯЗЕЙ
Interaction Polarity Classifier
 Конкатенация  параметров  остатков
 Вероятность  того,  что  два  остатка  окажутся  
одинаковыми  на  основе  их  параметров
 Порог  после  которого  считать,  что  связь  есть
10
ПОСЛЕДНИЙ РЫВОК
11
ИТЕРАТИВНАЯ НАХОЖДЕНИЕ КОНСЕНСУСА
Iterative collective inference scheme
 Степень  подтверждения  статуса  остатка  от  соседей
 Порог,  после  которого  принимается  решение  
переобозначить вектор
12
13
1
2
3
4 5
6
8
12
11
10
7
E 1 2 3 4 5 6 7 8 9 10 11 12
1 1 1 0 0 0 0 0 0 0 0 0 0
2 1 1 1 0 0 0 0 0 1 1 0 0
3 0 1 1 1 0 0 0 0 1 1 0 0
4 0 0 1 1 1 0 0 0 0 0 0 0
5 0 0 0 1 1 1 0 0 0 0 0 0
6 0 0 0 0 1 1 1 0 0 0 0 0
7 0 0 0 0 0 1 1 1 0 0 0 0
8 0 0 0 0 0 0 1 1 1 0 0 0
9 0 1 1 0 0 0 0 1 1 1 0 0
10 0 1 1 0 0 0 0 0 1 1 1 0
11 0 0 0 0 0 0 0 0 0 1 1 1
12 0 0 0 0 0 0 0 0 0 0 1 1
9
Y -1 -1 1 1 -1 -1 -1 1 -1 1 1 -1
W 1 2 3 4 5 6 7 8 9 10 11 12
1 1 1 0 0 0 0 0 0 0 0 0 0
2 1 1 1 0 0 0 0 0 -1 -1 0 0
3 0 1 1 1 0 0 0 0 -1 -1 0 0
4 0 0 1 1 1 0 0 0 0 0 0 0
5 0 0 0 1 1 1 0 0 0 0 0 0
6 0 0 0 0 1 1 1 0 0 0 0 0
7 0 0 0 0 0 1 1 -1 0 0 0 0
8 0 0 0 0 0 0 -1 1 -1 0 0 0
9 0 -1 -1 0 0 0 0 -1 1 1 0 0
10 0 -1 -1 0 0 0 0 0 1 1 -1 0
11 0 0 0 0 0 0 0 0 0 -1 1 -1
12 0 0 0 0 0 0 0 0 0 0 -1 1
Q 0 1 1 0 0 0 0 1 1 1 1 0
Q 0 1 1 0 0 0 0 1.75.75 1 0
PR, НО НЕ РЕКЛАМА
Precision=
        
=
Recall = =
14
РЕЗУЛЬТАТЫ
15
СРАВНЕНИЕ С ДРУГИМИ МЕТОДАМИ
16
СПАСИБО ЗА ВНИМАНИЕ
Подходящий  момент,  чтобы  задать  вопрос
17

More Related Content

PDF
Рейтинг коттеджных посёлков Новосибирска, итоги 2015 года
PDF
Рейтинг коттеджных посёлков Новосибирска, итоги 2015 года
PDF
Bioalgo 2013-07-alignment-2
PPT
No3 biohimiya makromolekuly
PDF
Bioinformatics 2012-02
PPT
No 1 vvedenie_v_himiyu
PPT
No7 reparaciya dnk
Рейтинг коттеджных посёлков Новосибирска, итоги 2015 года
Рейтинг коттеджных посёлков Новосибирска, итоги 2015 года
Bioalgo 2013-07-alignment-2
No3 biohimiya makromolekuly
Bioinformatics 2012-02
No 1 vvedenie_v_himiyu
No7 reparaciya dnk

Viewers also liked (12)

PDF
Bioalgo 2013-09-phylogenetics 0
PPT
Biodb 2011-everything
PPT
PDF
Bioalgo 2013-08-alignment-3
PDF
Slides -n._sitdykova_0
PDF
Ch09 combinatorialpatternmatching
PPT
No4 metabolizm
PDF
Bioalgo 2013-09-phylogenetics 0
Biodb 2011-everything
Bioalgo 2013-08-alignment-3
Slides -n._sitdykova_0
Ch09 combinatorialpatternmatching
No4 metabolizm
Ad

More from BioinformaticsInstitute (20)

PPTX
PDF
Nanopores sequencing
PDF
A superglue for string comparison
PDF
Comparative Genomics and de Bruijn graphs
PDF
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
PPTX
Вперед в прошлое. Методы генетической диагностики древней днк
PDF
Knime & bioinformatics
PDF
"Зачем биологам суперкомпьютеры", Александр Предеус
PDF
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
PDF
Рак 101 (Мария Шутова, ИоГЕН РАН)
PDF
Плюрипотентность 101
PDF
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
PPTX
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
PPT
PPT
PPT
PPT
Nanopores sequencing
A superglue for string comparison
Comparative Genomics and de Bruijn graphs
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Вперед в прошлое. Методы генетической диагностики древней днк
Knime & bioinformatics
"Зачем биологам суперкомпьютеры", Александр Предеус
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Рак 101 (Мария Шутова, ИоГЕН РАН)
Плюрипотентность 101
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Ad

Slides -a._beloborodov

  • 1. FUNCTIONAL SITE PREDICTION BY EXPLOITING CORRELATIONS BETWEEN LABELS OF INTERACTING RESIDUES Андрей  Белобородов Предсказание  функциональных  участков  белков   по  зависимостям  в  типах  взаимосвязи               аминокислотных  остатков 17
  • 2. ЗАЧЕМ?  Белки  важны  Белков  много  Структура  определяет функциональность …но  нетривиально Задача:  предсказать  по  структуре   белка    какие  аминокислотные  остатки   будут  функциональны  в  нём. 2
  • 3. ЧТО? Белок  состоит  из  соединённых  в  цепочку   аминокислот.  Каждая  аминокислота-кирпичик  может   быть   функциональной  – участвовать  в  реакциях  с  другими   веществами или  нефункциональной  – служить  каркасом  белка. При  построении  модели  учитываются  всевозможные   параметры  остатков.  Положение  в  группе  остатков    Физико-химические  свойства  Электростатические  свойства 3
  • 4. ПОДХОДЫ  Шаблоны  - поиск  3D паттернов  в  структуре   белка.  Паттерны  строятся  экспертом.  Остатки  – обучение  компьютерных  моделей   распознавать  функциональные  остатки,  на   основе  тренировочных  выборок.  Предложенный  способ  относится  ко  2ой   категории  с  элементами  первой  Нигде  не  учитывается   взаимодействие  между  аминокислотными   остатками 4
  • 5. СЕТЬ ВЗАИМОДЕЙСТВИЙ ОСТАТКОВ Residue Interaction Network (RIN)  Белок,  содержащий  n аминокислотных  остатков  Информация  о  контакте  остатков  Признак  функциональности  остатка  Информация  о  взаимосвязи  (схожести)  остатков 5
  • 6. 6 1 2 3 4 5 6 8 12 11 10 7 E 1 2 3 4 5 6 7 8 9 10 11 12 1 1 1 0 0 0 0 0 0 0 0 0 0 2 1 1 1 0 0 0 0 0 1 1 0 0 3 0 1 1 1 0 0 0 0 1 1 0 0 4 0 0 1 1 1 0 0 0 0 0 0 0 5 0 0 0 1 1 1 0 0 0 0 0 0 6 0 0 0 0 1 1 1 0 0 0 0 0 7 0 0 0 0 0 1 1 1 0 0 0 0 8 0 0 0 0 0 0 1 1 1 0 0 0 9 0 1 1 0 0 0 0 1 1 1 0 0 10 0 1 1 0 0 0 0 0 1 1 1 0 11 0 0 0 0 0 0 0 0 0 1 1 1 12 0 0 0 0 0 0 0 0 0 0 1 1 9 Y -1 -1 -1 -1 -1 -1 -1 1 1 1 1 -1 W 1 2 3 4 5 6 7 8 9 10 11 12 1 1 1 0 0 0 0 0 0 0 0 0 0 2 1 1 1 0 0 0 0 0 -1 -1 0 0 3 0 1 1 1 0 0 0 0 -1 -1 0 0 4 0 0 1 1 1 0 0 0 0 0 0 0 5 0 0 0 1 1 1 0 0 0 0 0 0 6 0 0 0 0 1 1 1 0 0 0 0 0 7 0 0 0 0 0 1 1 -1 0 0 0 0 8 0 0 0 0 0 0 -1 1 1 0 0 0 9 0 -1 -1 0 0 0 0 1 1 1 0 0 10 0 -1 -1 0 0 0 0 0 1 1 1 0 11 0 0 0 0 0 0 0 0 0 1 1 -1 12 0 0 0 0 0 0 0 0 0 0 -1 1
  • 8. РЕГУЛЯРИЗОВАННАЯ L1 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ 𝑥 = 𝑎 + 𝑥′ 𝑎 – параметр,  склоняющий   классификатор  в  ту  или   иную  сторону 8
  • 9. ЛОКАЛЬНЫЙ КЛАССИФИКАТОР Local classifier  𝑥 - вектор  (набор) известных  параметров  остатка  𝑎  Вероятность  того,  что  остаток  окажется   функциональным  на  основе  его  параметров  Порог  после  которого  считать,  что  остаток   функционален 9
  • 10. КЛАССИФИКАТОР ТИПОВ ВЗАИМОСВЯЗЕЙ Interaction Polarity Classifier  Конкатенация  параметров  остатков  Вероятность  того,  что  два  остатка  окажутся   одинаковыми  на  основе  их  параметров  Порог  после  которого  считать,  что  связь  есть 10
  • 12. ИТЕРАТИВНАЯ НАХОЖДЕНИЕ КОНСЕНСУСА Iterative collective inference scheme  Степень  подтверждения  статуса  остатка  от  соседей  Порог,  после  которого  принимается  решение   переобозначить вектор 12
  • 13. 13 1 2 3 4 5 6 8 12 11 10 7 E 1 2 3 4 5 6 7 8 9 10 11 12 1 1 1 0 0 0 0 0 0 0 0 0 0 2 1 1 1 0 0 0 0 0 1 1 0 0 3 0 1 1 1 0 0 0 0 1 1 0 0 4 0 0 1 1 1 0 0 0 0 0 0 0 5 0 0 0 1 1 1 0 0 0 0 0 0 6 0 0 0 0 1 1 1 0 0 0 0 0 7 0 0 0 0 0 1 1 1 0 0 0 0 8 0 0 0 0 0 0 1 1 1 0 0 0 9 0 1 1 0 0 0 0 1 1 1 0 0 10 0 1 1 0 0 0 0 0 1 1 1 0 11 0 0 0 0 0 0 0 0 0 1 1 1 12 0 0 0 0 0 0 0 0 0 0 1 1 9 Y -1 -1 1 1 -1 -1 -1 1 -1 1 1 -1 W 1 2 3 4 5 6 7 8 9 10 11 12 1 1 1 0 0 0 0 0 0 0 0 0 0 2 1 1 1 0 0 0 0 0 -1 -1 0 0 3 0 1 1 1 0 0 0 0 -1 -1 0 0 4 0 0 1 1 1 0 0 0 0 0 0 0 5 0 0 0 1 1 1 0 0 0 0 0 0 6 0 0 0 0 1 1 1 0 0 0 0 0 7 0 0 0 0 0 1 1 -1 0 0 0 0 8 0 0 0 0 0 0 -1 1 -1 0 0 0 9 0 -1 -1 0 0 0 0 -1 1 1 0 0 10 0 -1 -1 0 0 0 0 0 1 1 -1 0 11 0 0 0 0 0 0 0 0 0 -1 1 -1 12 0 0 0 0 0 0 0 0 0 0 -1 1 Q 0 1 1 0 0 0 0 1 1 1 1 0 Q 0 1 1 0 0 0 0 1.75.75 1 0
  • 14. PR, НО НЕ РЕКЛАМА Precision=         = Recall = = 14
  • 17. СПАСИБО ЗА ВНИМАНИЕ Подходящий  момент,  чтобы  задать  вопрос 17