Вы находитесь на странице: 1из 69

14.

Estructura de
protenas, 1

Niveles estructurales en las protenas

Estructura primaria: Secuencia de aminocidos


Estructura secundaria: Plegamiento bsico de la cadena
debido a enlaces de hidrgeno entre grupos -CO- y -NHde la unin peptdica: hlices, lminas y giros
Estructura terciaria: Estructura tridimensional de la protena

Estructura cuaternaria: Asociacin de distintas subunidades,


siendo cada una un polipptido.

Estructura primaria
5-AAGGGTACCCAACATTTAGTT-3
3-TTCCCATGGGTTGTAAATCAA-5

DNA

5-AAGGGUACCCAACAUUUAGUU-3

RNA

Lys.Gly.Ser.Gln.His.Leu.Val C

Protena

Estructura primaria de la insulina


S

GIVEQCCASVCSLYQLENYCN
S

FVNQHLCGSHLVEALYLVCGERGFFYTPKA

Oxidacin de puentes disulfuro


H
H

N H C
C

N H C
C

CH2

CH2
S

SO3H
HCO3H

S
SO3H

CH2
C
N H C
H

CH2
C
N H C
H

Reduccin y alquilacin de puentes disulfuro

N H C
C
H

N H C
C

N H C
C

CH2

CH2

CH2
COOCOO-

SH

CH2

CH2

C
N H C

C
N H C

ICH2 COOH

SH

DTT

CH2

CH2
S
CH2
C
N H C
H

Determinacin del N-trmino por la reaccin de Sanger


O
O2N

H 2N

C
R1

NO2

O
HN

O2N

NO2

O2N

HN

C
R1

R1

R2

N
R3

N
R3

R2

COOH
+

NO2

R2

H 2N

COOH

+
H 2N

COOH

R3

Tripsina
---.---.---.Lys.---.---.---

---.---.---.Arg.---.---.---

---.---.---.Phe.---.---.-----.---.---.Tyr.---.---.-----.---.---.Trp.---.---.-----.---.---.Leu.---.---.---

Quimotripsina

Rotura enzimtica
de polipptidos

Rotura de un pptido por bromuro de ciangeno

C
R

R
N

C
CH2

R
N

C
R

R
N

C
R

CH2
BrCN

S
CH3

C
R

N
O

H2N

C
O

C
R

R
N

C
R

Degradacin secuencial de Edman


O
N C S

H 2N

C
R1

Feniltioisocianato

R2
N

C
R3

R4
N

Pptido (n)
S H

N C N

C
R1

PTC-pptido

R2
N

C
R3

R4
N

cido diludo
R2

S
NH
N

PTH-aminocido

+
R1

H 2N

C
O

C
R3

R4
N

Pptido (n-1)

Hoy da, la mayor parte de estructuras primarias de protenas


se determina a partir de la secuencia de nucletidos en el genoma.
Tcnicamente la secuenciacin de cidos nucleicos (en particular,
la de DNA) es mucho ms sencilla y barata que la de protenas,
estando al alcance de cualquier laboratorio.

10

20

30

40

50

60

|
|
|
|
|
|
PYQYPALTPE QKKELSDIAH RIVAPGKGIL AADESTGSIA KRLQSIGTEN TEENRRFYRQ
70
80
90
100
110
120
|
|
|
|
|
|
LLLTADDRVN PCIGGVILFH ETLYQKADDG RPFPQVIKSK GGVVGIKVDK GVVPLAGTNG
130
140
150
160
170
180
|
|
|
|
|
|
ETTTQGLDGL SERCAQYKKD GADFAKWRCV LKIGEHTPSA LAIMENANVL ARYASICQQN
190
200
210
220
230
240
|
|
|
|
|
|
GIVPIVEPEI LPDGDHDLKR CQYVTEKVLA AVYKALSDHH IYLEGTLLKP NMVTPGHACT
250
260
270
280
290
300
|
|
|
|
|
|
QKFSHEEIAM ATVTALRRTV PPAVTGITFL SGGQSEEEAS INLNAINKCP LLKPWALTFS
310
320
330
340
350
360
|
|
|
|
|
|
YGRALQASAL KAWGGKKENL KAAQEEYVKR ALANSLACQG KYTPSGQAGA AASESLFVSN

HAY

Estructura primaria de la aldolasa A humana


SWISS-PROT http://www.expasy.ch

Clculos a partir de estructura primaria


- Nmero, porcentaje y fraccin molar de aminocidos
- Frmula molecular y peso molecular

- pI (punto isoelctrico) terico


- Absorbancia molar terica

- Vida media terica


- ndices de inestabilidad e hidrofobicidad

Amino acid composition:


Ala
Arg
Asn
Asp
Cys
Gln
Glu
Gly
His
Ile
Leu
Lys
Met
Phe
Pro
Ser
Thr
Trp
Tyr
Val

(A)
(R)
(N)
(D)
(C)
(Q)
(E)
(G)
(H)
(I)
(L)
(K)
(M)
(F)
(P)
(S)
(T)
(W)
(Y)
(V)

42
15
14
14
8
17
24
30
9
20
34
26
3
8
19
20
22
3
13
22

11.6%
4.1%
3.9%
3.9%
2.2%
4.7%
6.6%
8.3%
2.5%
5.5%
9.4%
7.2%
0.8%
2.2%
5.2%
5.5%
6.1%
0.8%
3.6%
6.1%

Asx (B)
Glx (Z)
Xaa (X)

0
0
0

0.0%
0.0%
0.0%

Atomic composition:
Carbon
Hydrogen
Nitrogen
Oxygen
Sulfur

C
H
N
O
S

1741
2780
486
526
11

Formula: C1741H2780N486O526S11
Total number of atoms: 5544
Molecular weight: 39288.8

ProtParam, 1
http://www.expasy.ch

Total number of negatively charged residues (Asp + Glu): 38


Total number of positively charged residues (Arg + Lys): 41
Theoretical pI: 8.39

Extinction coefficients:
Conditions: 6.0 M guanidium hydrochloride
0.02 M phosphate buffer
pH 6.5
Extinction coefficients are in units of

M-1 cm-1 .

The first table lists values computed assuming ALL Cys


residues appear as half cystines, whereas the second table
assumes that NONE do.

Ext. coefficient
Abs 0.1% (=1 g/l)

276
nm
35630
0.907

278
nm
35508
0.904

279
nm
34945
0.889

280
nm
34190
0.870

282
nm
32880
0.837

Ext. coefficient
Abs 0.1% (=1 g/l)

276
nm
35050
0.892

278
nm
35000
0.891

279
nm
34465
0.877

280
nm
33710
0.858

282
nm
32400
0.825

ProtParam, 2
http://www.expasy.ch

Estimated half-life:
The N-terminal of the sequence considered is P (Pro).
The estimated half-life is: >20 hours (mammalian reticulocytes, in vitro).
>20 hours (yeast, in vivo).
? (Escherichia coli, in vivo).
Instability index:
The instability index (II) is computed to be 34.82
This classifies the protein as stable.

Aliphatic index: 87.16


Grand average of hydropathicity (GRAVY): -0.268

ProtParam, 3
http://www.expasy.ch

Predicciones a partir de estructura primaria, 1


- Hidrofobicidad
- Estructura secundaria

- Retencin cromatogrfica en HPLC


- Residuos accesibles y ocultos

- Mutabilidad

Ala:
Arg:
Asn:
Asp:
Cys:
Gln:
Glu:
Gly:
His:
Ile:
Leu:
Lys:
Met:
Phe:
Pro:
Ser:
Thr:
Trp:
Tyr:
Val:

1.800
-4.500
-3.500
-3.500
2.500
-3.500
-3.500
-0.400
-3.200
4.500
3.800
-3.900
1.900
2.800
-1.600
-0.800
-0.700
-0.900
-1.300
4.200

PYQYPALTPEQKKELSDIAH
Valor de hidrofobicidad para la
posicin n (en este caso, 8):
n+4

S bi

= -10.5

i = n-4

Escala de hidrofobicidad
(segn Kyte y Doolittle)

Clculo predictivo de hidrofobicidad (Kyte & Doolittle)

Predicciones a partir de estructura primaria, 2: Homologas

(CG5432)CG5432 PROTEIN. [Drosophila melanogaster]


376 AA
Score = 398 bits (1011), Expect = e-110
Identities = 197/355 (55%), Positives = 245/355 (68%), Gaps = 2/355 (0%)
Query: 2
YQYPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQL 61
+ YP
E ++EL I+ +VAPGKGILAADES+ + KR Q IG ENTEENRR YRQ+
Sbjct: 5
FYYP--NKELQEELICISKALVAPGKGILAADESSAVMGKRFQLIGVENTEENRRLYRQM 62
Query: 62
Sbjct: 63

LLTADDRVNPCIGGVILFHETLYQKADDGRPFPQXXXXXXXXXXXXXXXXXXPLAGTNGE 121
L T D ++
I GVI +HETL+Q+ DDG PF +
PL G+ E
LFTTDPKIAENISGVIFYHETLHQRTDDGLPFVEALRKKGILTGIKVDKHFSPLFGSEDE 122

Query: 122 TTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNG 181


TTQGLD L+ RCAQYKK+G FAKWRC+LKI ++TPS AI+ENANV+ARYA+ICQ
Sbjct: 123 FTTQGLDDLANRCAQYKKEGCSFAKWRCILKITKNTPSPQAILENANVMARYAAICQSQR 182
Query: 182 IVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQ 241
+VPI+ PE+L GDHDL RCQ V E +LA VYKALSDHH++LEGTLL+P+MV PG
+
Sbjct: 183 LVPIISPEVLATGDHDLDRCQKVNEILLAGVYKALSDHHVFLEGTLLQPSMVMPGLQSNK 242
Query: 242 KFSHEEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSY 301
+I +ATV A+RR+VPPAV G+ F G QSEEEA+++LNAIN PL KPWA+TF++
Sbjct: 243 NHPPADIGVATVLAIRRSVPPAVMGVLFCGGAQSEEEATVHLNAINNVPLCKPWAMTFAF 302
Query: 302 GRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESL 356
RALQ S L+ WGGKKE + AQ E +KR AN LA GKY
+AA+E L
Sbjct: 303 DRALQTSILRTWGGKKEQISHAQNELIKRCRANGLASIGKYVIGSVESSAATERL 357

Dependiendo del grado de homologa en su estructura


primaria, las protenas se agrupan en:

- Superfamilias: homologa en torno a 30 %


- Familias: homologa superior a un 50 % y
la misma funcin, por lo general.
Adems, hay pequeos tractos de secuencias comunes
a protenas muy diversas, y que corresponden a ciertos
aspectos funcionales (como p.e. modificacin
postraduccional): son los motivos secuenciales

Algunos motivos secuenciales en las protenas

N-Glicosilacin
Unin a glicosaminoglicano
Fosforilacin dependiente de cAMP
Fosforilacin, protein kinasa C
Fosforilacin, tirosin kinasa
N-miristilacin
Amidacin C-terminal
-carboxilacin de cido glutmico
Prenilacin

N-{P}-[ST]-{P}
S-G-x-G
[RK]-(2)-[ST]
[ST]-x(2)-[RK]
[RK]-x(2)-[DE]-x(3)-Y
G- {EDRKHPFYW}-x(2)-[STAGCN]-{P}
x-G- [RK]-[RK]
x(12)-E-x(3)-E-x-C-x(6)-[DEN]-x-[LIVMFY]
C-{DENQ}-[LIVM]

Predicciones a partir de estructura


primaria, 3: Filogenia y Taxonoma
-8
1
10
___.___.___.___.___.___.___.___.Gly.___.___.___.___.Gly.___.___.___.Phe.
20
___.___.___.Cys.___.___.Cys.His.___.___.___.___.___.___.___.___.Lys.___.
30
40
Gly.Pro.___.Leu.___.Gly.___.___.___.Arg.___.___.Gly.___.___.___.Gly.___.
50
60
___.Tyr.___.___.Ala.Asn.___.___.___.___.___.___.Trp.___.___.___.___.___.
70
80
___.___.Tyr.Leu.___.Asn.Pro.Lys.Lys.Tyr.Ile.Pro.Gly.Thr.Lys.Met.___.Phe.
90
100
___.Gly.___.___.Lys.___.___.___.Arg.___.___.___.___.___.___.___.___.___.
104
___.___.___.___.

Invariantes en citocromo c

Sustituciones conservadoras en citocromo c


Posicin

Aminocidos

13

Arg, Lys

40

Ser, Thr

46

Phe, Tyr

49

Ser, Thr

81

Val, Leu, Ile

85

Leu, Ile

90

Asp, Glu

94

Leu, Ile

95

Ile, Val

97

Phe, Tyr

Sustituciones radicales en citocromo c


Posicin

Aminocidos

33

His, Ser, Trp, Tyr, Asn

44

Ala, Pro, Asp, Gln, Val, Glu

54

Asn, Ala, Ser, Gln, Arg, Lys

60

Glu, Gly, Asp, Ala, Gln, Lys, Asn

65

Tyr, Phe, Ser, Met, Arg

83

Pro, Ala, Val, Gly, Thr

88

Pro, Ala, Asp, Glu, Lys, Thr

89

Gln, Lys, Asn, Glu, Thr, Gly, Asp, Ala, Ser

92

Ana, Asn, Asp, Gly, Glu, Val, Thr, Lys, Gln

Distancias filogenticas en citocromo c


1
2
3
4
5
6
7
8
9
__________________________________________________________________________
1. Homo sapiens

2. Maccaca mulata

3. Sus scrofa

10

4. Gallus domesticus

13

12

5. Rana pipiens

18

17

11

11

6. Musca domestica

27

26

22

23

22

7. Bombyx mori

31

30

27

28

29

14

8. Triticum vulgare

43

43

45

46

48

45

45

9. Neurospora crassa

48

47

46

47

49

41

47

54

Y
ngulos de
conformacin

Representacin de Ramachandran

a-Hlice
F = -57
Y= -47

Paso de rosca: 0.54 nm


Traslacin por residuo: 0.15 nm
Residuos por vuelta: 3.6
Enlaces H: n a n+3

Hlice 310
F = -49
Y = -26

Paso de rosca: 0.59 nm


Traslacin por residuo: 0.19
Residuos por vuelta: 3

Mioglobina

Protena globular con


alto contenido en
a-hlice
N

Fibringeno

Protena fibrosa
con alto contenido
en a-hlice

Propensin estructural hacia a-hlices (Chou y Fasman)

Estabilizan

Indiferentes

Desestabilizan

Ala:
Gln:
Glu:
Leu:
Lys:
Met:
Phe:

Arg: 0.980
Asp:1.010
His: 1.000
Ile: 1.080
Trp: 1.080
Val: 1.060

Asn: 0.670
Cys: 0.700
Gly: 0.570
Pro: 0.570
Ser: 0.770
Thr: 0.830
Tyr: 0.690

1.420
1.110
1.510
1.210
1.160
1.450
1.130

Prolina y
a-hlices

Hlice de poliprolina

Colgeno

Estructura b
F = -119
Y = 113

Lmina b paralela

O
C

O
H

C
H

O
C

O
H

H
N

N
H

O
C

O
H

H
N

O
C

N
H

H
N

O
C

H
N

Lmina b paralela

Barril b paralelo

N
C

H
N

C
N
C
O

Lmina b antiparalela

N
C
N
H

Lmina b antiparalela

Lmina antiparalela

Propensin estructural hacia estructuras b (Chou y Fasman)

Estabilizan

Indiferentes

Desestabilizan

Ile: 1.600
Cys: 1.190
Gln: 1.100
Leu: 1.300
Phe: 1.380
Thr: 1.190
Trp: 1.370
Tyr: 1.470
Val: 1.700

Arg: 0.930
Met: 1.050

Ala: 0.830
Asn: 0.890
Asp: 0.540
Glu: 0.370
Gly: 0.750
His: 0.870
Lys: 0.740
Pro: 0.550
Ser: 0.750

Protena fibrosa con


estructura b: Fibrona

Protena globular
con estructura b:
Concanavalina A

Giro b

Propensin estructural hacia giros b

Estabilizan

Indiferentes

Desestabilizan

Asn: 1.560
Asp: 1.460
Cys: 1.190
Gly: 1.560
Pro: 1.520
Ser: 1.430

Arg:
Gln:
His:
Lys:
Thr:
Trp:
Tyr:

Ala: 0.660
Glu: 0.740
Ile: 0.470
Leu: 0.590
Met: 0.600
Phe: 0.600
Val: 0.500

0.950
0.980
0.950
1.010
0.960
0.960
1.140

1ntr
Protena
regulatoria

Estructuras suprasecundarias

- Hlice-vuelta-hlice
- Siete hlices transmembrana y hlice anfiptica
- Cremallera de leucina
- Unidad bab
- Meandro b
- Dedo de Zn
- Mano EF

Hlice-vuelta-hlice

Siete hlices transmembrana


(bacteriorrodopsina)

a-hlice
anfiptica

Lado
hidrofbico

Lado polar

Cremallera de leucina

Motivo bab

Meandro b

Dedo de Zn

Mano EF

Determinacin experimental de la estructura secundaria

1. Mtodos fsicos:
Cristalografa Rayos X, Resonancia Magntica Nuclear
(RMN, NMR) en tanto en cuanto resuelven la estructura
terciaria
Otras tcnicas: dicrosmo circular
2. Mtodos predictivos a partir de la estructura primaria

Propensin de un aminocido hacia una estructura dada

1. A partir de un conjunto de protenas de estructura 3D conocida,


se forma la siguiente tabla:
Total
Glutamato
Aminocidos

282
5507

a-hlice
132
1715

Estr. b

Giro b

29
1555

43
1121

(Se ha puesto el Glutamato como ejemplo; esta tabla se prepara


para todos los aminocidos)

2. A partir de la tabla anterior, se calculan las frecuencias relativas


de aparicin de dicho aminocido en las tres estructuras:
a-hlice Estr. b
Glutamato
Aminocidos

0.470
0.311

0.104
0.282

Giro b
0.151
0.204

3. Se calcula entonces la propensin de cada aminocido hacia una


estructura dada por el cociente de dividir la frecuencia relativa de
cada estructura por la frecuencia relativa media de todos los aminocidos. En el caso del glutamato,
Pa = 0.470/0.311 = 1.511
Pb = 0.104/0.282 = 0.370
Pg = 0.151/0.202 = 0.748

Ala:
Arg:
Asn:
Asp:
Cys:
Gln:
Glu:
Gly:
His:
Ile:
Leu:
Lys:
Met:
Phe:
Pro:
Ser:
Thr:
Trp:
Tyr:
Val:

1.420
0.980
0.670
1.010
0.700
1.110
1.510
0.570
1.000
1.080
1.210
1.160
1.450
1.130
0.570
0.770
0.830
1.080
0.690
1.060

PYQYPALTPEQKKELSDIAH
Valor de propensin hacia
a-hlice para la posicin n
(en este caso, 8):
n+4

S bi

= 9.07

i = n-4

Escala de propensiones hacia a-hlice


(segn Chou y Fasman)

Ala:
Arg:
Asn:
Asp:
Cys:
Gln:
Glu:
Gly:
His:
Ile:
Leu:
Lys:
Met:
Phe:
Pro:
Ser:
Thr:
Trp:
Tyr:
Val:

0.830
0.930
0.890
0.540
1.190
1.100
0.370
0.750
0.870
1.600
1.300
0.740
1.050
1.380
0.550
0.750
1.190
1.370
1.470
1.700

PYQYPALTPEQKKELSDIAH
Valor de propensin hacia
estructura b para la posicin n
(en este caso, 8):
n+4

S bi

= 8.1

i = n-4

Escala de propensiones hacia estructura b


(segn Chou y Fasman)

Ala:
Arg:
Asn:
Asp:
Cys:
Gln:
Glu:
Gly:
His:
Ile:
Leu:
Lys:
Met:
Phe:
Pro:
Ser:
Thr:
Trp:
Tyr:
Val:

0.660
0.950
1.560
1.460
1.190
0.980
0.740
1.560
0.950
0.470
0.590
1.010
0.600
0.600
1.520
1.430
0.960
0.960
1.140
0.500

PYQYPALTPEQKKELSDIAH
Valor de propensin hacia
giro b para la posicin n
(en este caso, 8):
n+4

S bi

= 9.12

i = n-4

Escala de propensiones hacia giro b


(segn Chou y Fasman)

Вам также может понравиться