CATH база на податоци

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето
CATH
CATH - Protein Structure Classification Database.png
Содржина
ОписКласификација на белковински структури
Контакт
Истражувачки центарЛондонски универзитетски колеџ
ЛабораторијаИнститут за структурна и молекуларна биологија
Објавена на1997
Пристап
Мреж. местоcathdb.info
URL за преземањеcathdb.info/download
Алатки
Разно
Честота на објавувањеCATH-B се објавува дневно. Официјалните објавувања се еднаш годишно.
Верзија4.1

CATH базата на податоци за структурна класификација на белковините е бесплатен, јавно достапен онлајн ресурс кој дава информации за еволутивните односи на белковинските домени. Оваа база на податоци била создадена во средината на 1990-тите години од страна на професор Кристин Орегно и соработниците, вклучувајќи ги Џенет Торнтон и Дејвид Џоунс,[1] а продолжува да биде развивана од страна на групата на Орегно при Лондонскиот универзитетски колеџ. CATH има многу сличности со SCOP базата на податоци, сепак постојат многу области во кои деталната класификација драстично се разликува меѓу нив.[2][3][4][5]

Хиерархиска организација[уреди | уреди извор]

Експериментално-добиените тродимензионални структури на белковините (протеините) се земаат од PDB (Protein Data Bank). Потоа се идентификуваат белковинските домени во рамките на еден полипептиден синџир со користење на комбинација од автоматизирани методи и мануелна инспекција.

Домените потоа се класифицираат во рамките на CATH структурната хиерархија: на нивото на класа (C), домените се класифицираат според нивната содржина на елементите на секундарната структура во групите исклучиво-алфа, исклучиво-бета, мешавина од алфа и бета и мала содржина на секундарна структура; на нивото на архитектурата (A), домените се класифицираат според аранжманот на секундарните структури во тридимензионален простор; на нивото на топологија/склоп (T), се користат информациите за тоа како елементите на секундарната структура се поврзани и организирани; на нивото на хомологна суперфамилија (H), домените се класифицираат ако постои добар доказ дека се еволутивно сродни,[1] т.е. хомологни.

Четирите главни нивоа на CATH хиерархијата:
# Ниво Опис
1 Класа Севкупната содржина на секундарни структури на доменот (Еквивалентно на нивото Класа во SCOP)
2 Архитектура Голема структурна сличност, но нема докази за хомологија (Еквивалентно на нивото Склоп во SCOP)
3 Топологија/склоп Групирање на топологии кои споделуваат одредени структурни карактеристики
4 Хомологна суперфамилија Поседуваат докажана еволутивна сродност (Еквивалентно на нивото Суперфамилија во SCOP)

Објавувања[уреди | уреди извор]

Тимот на CATH има за цел да обезбеди официјални објавувања на CATH класификацијата на секои 12 месеци.

Најновата верзија на CATH-Gene3D (v4.1), била објавена во јули 2016 година и се состои од:

  • 308,999 структурни белковински домени[6]
  • 53,479,436 не-структурни белковински домени[6]
  • 2,737 хомологни суперфамилии[6]
  • 92,882 функционални фамилии[6]

Наводи[уреди | уреди извор]

  1. 1,0 1,1 Orengo, CA; Michie, AD; Jones, S; Jones, DT; Swindells, MB; Thornton, JM. CATH – a hierarchic classification of protein domain structures. „Structure“ том  5 (8): 1093–1109. doi:10.1016/S0969-2126(97)00260-8. ISSN 0969-2126. PMID 9309224. 
  2. „CATH: Protein Structure Classification Database at UCL“. Cathdb.info. конс. 2017-03-09. 
  3. „CATH“. Cathdb.info. конс. 2017-03-09. 
  4. „CATH Database (@CATHDatabase)“. Twitter. конс. 2017-03-09. 
  5. Pearl, F. M. G.. The CATH database: an extended protein family resource for structural and functional genomics. „Nucleic Acids Research“ том  31 (1): 452–455. doi:10.1093/nar/gkg062. ISSN 1362-4962. 
  6. 6,0 6,1 6,2 6,3 Dawson, Natalie L.; Lewis, Tony E.; Das, Sayoni; Lees, Jonathan G.; Lee, David; Ashford, Paul; Orengo, Christine A.; Sillitoe, Ian (4 јануари 2017 г). CATH: an expanded resource to predict protein function through structure and sequence. „Nucleic Acids Research“ том  45 (Database issue): D289–D295. doi:10.1093/nar/gkw1098. ISSN 0305-1048. PMID 27899584. PMC: PMC5210570. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5210570/.