TØ 15 – AI og modellering

1 Opgave 1. AlphaFold vs. Eksperimentel struktur - Confidence og fleksibilitet

I denne opgave skal I lave en AlphaFold-forudsigelse selv og sammenligne den med en eksperimentel krystalstruktur af det samme protein.

Protein: Humant Parkin er et 465 residue protein med 5 domæner:

Ubl (Ubiquitin-like) domain: residues 1-76

RING0 domain: residues 142-237

RING1 domain: residues 238-293

IBR (In-Between-RING) domain: residues 294-378

RING2 domain: residues 389-449

Strukturforudsigelse med Alphafold 3

1.1 Åbn AlphaFold3-serveren

Gå til AlphaFold3 serveren: https://alphafoldserver.com/

1.2 Opret bruger og log ind

Opret en bruger eller log ind

1.3 Indsæt Parkin-sekvensen

Indsæt sekvensen for humant Parkin (UniProt: O60260)

1.4 Kør AlphaFold-forudsigelse

Kør forudsigelsen, det tager et par minutter (hold vinduet åbent og start på næste del)

Hent krystalstruktur af Parkin (1.8Å opløsning)

Åben krystalstrukturen af Parkin i PyMOL: PDB-kode 5C1Z (fetch 5c1z, type=pdb1 for at hente den biologiske enhed). Farv strukturen efter B-factor.

Brug: spectrum b, blue_cyan_green_yellow_orange_red, 5c1z, minimum=20, maximum=100

1.5 Analysér B-faktorerne i strukturen

Hvad siger B-faktoren om strukturen? Hvilke regioner af strukturen have lav versus høj B-faktor? Giver det mening? (Hint: klik på enkelte atomer i PyMOL for at se B-faktoren, eller load .cif filen i en tekst editor og find søjlen med B-faktorer)

Nu skulle AF modellen være klar, download, pak ud og load den første ud af de 5 AF modeller i PyMOL (XXX_model_0.cif).

Align AF modelen og den experimentelle struktur.

1.6 Beregn RMSD og analysér alignment

Hvad er RMSD? Er der regioner af proteinet der aligner bedre end andre?

Farv AF-modellen efter pLDDT (som ligger i B-faktor kolonnen i PDB/CIF filen): spectrum b, orange_yellow_green_cyan_blue, model_0, minimum=50, maximum=90

(udskift model_0 med jeres objekt navn)

1.7 Fortolk pLDDT-værdier

Hvad siger pLDDT om den forudsagte struktur? Hvilket områder af strukturen har høj pLDDT og hvilke har lave værdier? Hvad betyder en pLDDT<50?

1.8 Sammenlign B-factor og pLDDT

Sammenlign nu B-factor for krystalstrukturen og pLDDT for AF-modellen. Er der en korrelation mellem B-factor og pLDDT?

Load de andre fire AF-modeller af Parkin (*_model_1.cif til *_model_4.cif) og align dem alle til model_0. Fokusér på det lange fleksible loop (residues 84-143).

1.9 Sammenlign loopkonformationer

Har loopet samme konformation i alle 5 modeller? Hvad fortæller det om AlphaFolds sikkerhed på denne regions struktur? Passer det med pLDDT værdierne I kiggede på i spørgsmål 3?

1.10 Forklar fjernelse af flexibelt loop

Bemærk at det flexible loop er fjernet i kontruktet brugt til krystalstrukturen (hvor residue 83 og 144 er forbundet). Hvorfor mon krystallograferne har gjort det?

2 Opgave 2. Hvad fortæller PAE (Predicted Aligned Error) om domæne-orientering

2.1 Fortolk PAE-plottet

Fortolk PAE-plottet for jeres Parkin model:

Se på PAE-plottet i AlphaFold browser vinduet (findes også i jeres downloaded mappe som JSON-fil til databehandling).

  • Hvad betyder en mørk grøn firkant? (lav PAE = ~0-5 Å)

  • Hvad betyder en lys/hvid firkant? (høj PAE = ~20-30 Å)

  • Hvorfor er hele diagonalen mørk grøn?

2.2 Identificér domæner i PAE

Identificér domæne-grænser i PAE-plottet. Find de 5 domæner i plottet (se domæne-residue numre fra Opgave 1). Hvilke domæner har lav PAE (grøn) mellem hinanden, og hvilke har høj PAE (lys/hvid)? Hint: Find Ubl-domænet (residues 1-76) i PAE-plottet. Kig på firkanten fra (1,1) til (76,76) - altså Ubl mod sig selv. Hvilken farve har denne firkant?**

2.3 Analysér Parkins domænestruktur

Hvad fortæller PAE om Parkins struktur? Baseret på PAE-plottet - hvilke dele af Parkin har en veldefineret relativ orientering, og hvilke dele er fleksibelt forbundet? Relaterer dette til pLDDT-værdierne I så i Opgave 1?

2.4 Identificér det fleksible loop

Identificér det lange fleksible loop i Parkin strukturen. Er positionen af dette loop veldefineret i forhold til resten af Parkin strukturen ifølge PAE-plottet?

3 Opgave 3. Modellering af et protein-kompleks med ligand og ioner

I denne opgave skal I bruge AlphaFold-serveren til at forudsige strukturen af en hetero-dimer mellem HsIFT25 (UniProt ID: Q9Y547) og HsIFT27 (UniProt ID: Q9BW83-1). IFT25 er et calcium-bindende protein, og IFT27 er en lille GTPase. Tilføj begge proteiner samt relevante ligander/ioner til en strukturforudsigelse på AlphaFold-serveren. Download den resulterende model.

3.1 Fortolk pTM- og iPTM-værdier

Hvad fortæller henholdsvis pTM- og iPTM-værdierne om kvaliteten af den forudsagte model?

3.2 Analysér pLDDT og PAE i kompleks

Analyser pLDDT- og PAE-værdierne for jeres model. Baseret på disse metrics, kan man have tillid til kvaliteten af den forudsagte struktur af protein-komplekset? Er orienteringen af IFT25 og IFT27 veldefineret? Begrund jeres svar.

3.3 Find og sammenlign nukleotidbinding

Hvor er nukleotidet placeret i strukturen? Find en GTPase struktur i PDB med nukleotid bundet, og align denne med IFT27. Binder nukleotidet på samme måde i begge strukturer?

3.4 Analysér calciumions koordination

Hvor binder calcium-ionen, og hvordan er den koordineret? (Beskriv hvilke aminosyrerester der deltager i koordinationen)

4 Opgave 4. Protein-interaktion med Alphafold

Et affinity pull-down MS eksperiment med tagged UniProt: Q3Y8L7 (ODA16, bait protein) gav følgende to hits: UniProt: A2T2X4 (IFT46) og UniProt: A8JA42 (IFT56).

4.1 Kortlæg interaktioner med AlphaFold

Brug AlphaFold til at dissekere hvordan de 3 proteiner interagerer. Binder begge hits direkte til ODA16?

4.2 Beskriv kompleksets arkitektur

Hvad er arkitekturen af komplekset og hvilke residues af IFT46 interagerer med ODA16 og IFT56? Hvilke dele er velforudsagte? Kan I stole på de forudsagte strukturelle modeller for interaktionerne mellem proteinerne?

4.3 Fortolk pTM og iPTM-scorer

Hvad er pTM og iPTM værdierne? Hvorfor er de mon lavere end for IFT25/27 i opgave 3?

4.4 Design eksperiment med trunkerede konstrukter

Baseret på pLDDT-værdierne for IFT46, design et eksperiment for at teste om de lave pTM/iPTM værdier skyldes IFT46’s disordered regioner eller om de lokale interfaces faktisk er dårligt forudsagte. Beskriv hvilke AlphaFold kørsler I ville lave og hvad I ville forvente at se hvis problemet primært er disordered regioner. Hvis der er tid så kør gerne AlphaFold forudsigelserne.