Tema8.pdf

Tema 8 Mapas físicos Genómica estructural Genoma Genómica Genómica estructural Mapas genéticos Mapas físicos Genómic

Views 66 Downloads 55 File size 8MB

Report DMCA / Copyright

DOWNLOAD FILE

Citation preview

Tema 8 Mapas físicos Genómica estructural

Genoma Genómica

Genómica estructural Mapas genéticos Mapas físicos

Genómica funcional

EXPRESIÓN Transcriptoma Proteoma Interactoma

FUNCIÓN Genética inversa

Secuenciacion (metodo de los dideoxinucleotidos)

Secuenciadores automaticos

S. de capilar

S. de gel

información obtenida por los secuenciadores. La tecnología que existe hoy en día permite secuenciar hasta El principal problema con el que se encuentra la secuenciación de los genomas es la ordenación de la información obtenida por los La tecnología que existe hoy en día permite secuenciar hasta 700 pb en una sola reacción de secuenciación. Con el desarrollo de secuenciaciones múltiples se han el desarrollo de secuenciaciones múltiples se han abaratado los precios y se aumenta la velocidad de procesamiento de las muestras

El tamaño de los genomas 1 volumen = 2320 pg

4 Mb (1 vol)

12 Mb

125 Mb

(3 vol)

(31 vol)

3000 Mb (750 vol)

Estrategias para la secuenciación de genomas Secuenciación al azar

Estrategias para la secuenciación de genomas Secuenciación ordenada

2 10 1 1 3 3 6

1

2

3

4

5

….. 10

1

1

2

2

Secuenciación al azar

Genoteca de plásmidos

Secuenciación al azar

Ensamblaje

Mapa físico

Secuenciación ordenada

Genoteca de BAC/YAC

Mapa

Genoteca de BAC/YAC Mapa 1500 kb BAC/YAC

Secuenciación ordenada

Genoteca de cósmidos Mapa

40 Kb

Cósmido Genoteca de plásmidos

Secuenciación al azar Ensamblaje del cósmido

Paseo cromosómico (Chromosome walking)

Hibridación Hibridar con el clon A1

Genoteca de BAC/YAC

E

D

C

B

1 2 3 4 5 6 7 8

A

A1 A2

•Hibridación •PCR

C6

Hibridar con el clon C6

E

D

C

B

A

1 2 3 4 5 6 7 8

A1 A2

E8 C6

Paseo cromosómico (Chromosome walking)

Genoteca de BAC/YAC

PCR

A1

E

D

C

A 12345678

B

A

1 2 3 4 5 6 7 8

PCR

B 12345678

C 12345678

D 12345678

A1 A4

Secuenciador 1 capilar 300 n/hora 7200 n !/día 50400 n/semana Secuenciador 100 capilares 30.000 n/hora 720.000 n !/día 5.040.000 n/semana

Evolución proyectos secuenciación genomas Genoma secuenciado

Año

Tamaño Genoma

Comentario

  Bacteriófago _X174

1977

5,38 kb

1er genoma secuenciado

Plásmido pBR322

1979

4,3 kb

1er plásmido secuenciado

Bacteriófago _

1982

48,5 kb

Cromosoma III levadura

1992

315 kb

1er cromosoma

Haemophilus influenzae

1995

1,8 Mb

1er genoma organismo celular

Saccharomyces cerevisiae

1996

12 Mb

1er organismo eucariota

Caenorhabditis elegans

1998

97 Mb

1er organismo multicelular

Drosophila melanogaster

2000

165 Mb

Arabidopsis thaliana

2000

125 Mb

1ª planta secuenciada

Homo sapiens

2001

3000 Mb

1er genoma mamífero

Arroz (Oryza sativa)

2002

430 Mb

1ª planta cultivo

Pez cebra (Fugu rubripes)

2002

400 Mb

Genoma vertebrado menor tamaño

A. gambiae

2002

280 Mb

Ratón (Mus musculus)

2003

2700 Mb

Organismo modelo cercano hombre

Evolución proyectos secuenciación genomas

Servidor GOLD (Genomes OnLine Database) wit.integratedgenomics.com/GOLD/

La Bioinformática

El principal problema con el que se encuentra la secuenciación de los genomas es la ordenación de la información obtenida por losinformación obtenida por los secuenciadores. La tecnología que existe hoy en día permite secuenciar hasta 700 pb en una sóla reacción de secuenciación. Con el desarrollo de secuenciaciones múltiples se han abaratado los precios y se aumenta la velocidad de procesamiento de las muestras

Genoma Genes y secuencias relacionadas

DNAcodificante

DNA extragénico

DNAno codificante

DNA repetitivo DNA bajo nº copias

Intrones Pseudogenes Fragmentos de genes Repeticiones en tandem

Satélites Microsatélites Minisatélites

Repeticiones dispersas

Transposones Retrotransposones Retrovirus Secuencias de inserción

I. Análisis funcional: detección Identificacion de ORFs (secuencias génicas transcritas)

Codón de parada

ATG

RNAm

ATG

Proteína 500 Frame 1

1000

500

1000

1500

1500

Frame 1 Frame 2

2000

X

2000

Frame 2 Frame 3

Frame 3

2500

Frame 4 2500 Frame 4 Frame 5

Frame 5 Frame 6

Frame 6

2000

2000

X

1500

1500

1000

1000

500

500

25

250

I. Análisis funcional: detección Lista de ORFs (secuencias génicas transcritas)

Procariotas

Eucariotas

II. Asignación función: búsquedas de homología

BLAST / FASTA Query= sp|P03005|DNAB_ECOLI REPLICATIVE DNA HELICASE (EC3.6.1.-) - Escherichia coli. (471 letters) > Identities = 358/450 (79%), Positives = 407/450 (89%)

Frame = +2 Query: 20

QVAGLKVPPHSIEAEQSVLGGLMLDNERWDDVAERVVADDFYTRPHRHIFTEMARLQESG 79 Q+ LK+PPHS+EAEQSVLGGLMLDNE+WD V+E VVADDF+++PHR IF EM +L + G Sbjct: 234608 QINRLKIPPHSLEAEQSVLGGLMLDNEQWDSVSEHVVADDFFSKPHRLIFQEMQKLLDLG 234787 Query: 80

SPIDLITLAESLERQGQLDSVGGFAYLAELSKNTPSAANISAYADIVRERAVVREMISVA 139 PIDLITL+ESLE++G+L+SVG F+YLAELSKNTPS ANI+AYADIVRERA+VREMI VA Sbjct: 234788 YPIDLITLSESLEQKGKLESVGRFSYLAELSKNTPSTANITAYADIVRERAIVREMILVA 234967 Query: 140

NEIAEAGFDPQGRTSEDLLDLAESRVFKIAESRANKDEGPKNIADVLDATVARIEQLFQQ 199 N+IA AG+D QGR SE+LLD AES VFKIAE R KD GPKN+ +LD TVA IE+LF Sbjct: 234968 NKIANAGYDTQGRKSEELLDYAESSVFKIAEKRFKKDSGPKNVEQILDETVASIEKLFLS 235147 Query: 200

PHDGVTGVNTGYDDLNKKTAGLQPSDLIIVAARPSMGKTTFAMNLVENAAMLQDKPVLIF 259 PHDGVTG+NTGY DLNKKT+GLQ S+LII+AARPSMGKTTFAMNL ENAAML DKPVLIF Sbjct: 235148 PHDGVTGINTGYQDLNKKTSGLQRSELIIIAARPSMGKTTFAMNLCENAAMLYDKPVLIF 235327 Query: 260

SLEMPSEQIMMRSLASLSRVDQTKIRTGQLDDEDWARISGTMGILLEKRNIYIDDSSGLT 319 SLEMP EQIMMR LASLSRV+Q +IRTGQL++EDWARISGT+ ILL+K+NIYIDDSS LT Sbjct: 235328 SLEMPGEQIMMRMLASLSRVNQARIRTGQLNNEDWARISGTINILLKKKNIYIDDSSALT 235507 Query: 320

PTEVRSRARRIAREHGGIGLIMIDYLQLMRVPALSDNRTLEIAEISRSLKALAKELNVPV 379 P+EVRSRARRI RE+ G+ LIM+DYLQLMRVP+LS+NRTLEIAEISR+LKALAKEL VPV Sbjct: 235508 PSEVRSRARRIYRENNGLTLIMVDYLQLMRVPSLSENRTLEIAEISRTLKALAKELQVPV 235687

SISTEMAS DE ANÁLISIS DE GENOMAS

Sin homología Homología sin función Posible función

Homólogo con función encontrado

Identificados anteriormente