Tema 8 Mapas físicos Genómica estructural Genoma Genómica Genómica estructural Mapas genéticos Mapas físicos Genómic
Views 66 Downloads 55 File size 8MB
Tema 8 Mapas físicos Genómica estructural
Genoma Genómica
Genómica estructural Mapas genéticos Mapas físicos
Genómica funcional
EXPRESIÓN Transcriptoma Proteoma Interactoma
FUNCIÓN Genética inversa
Secuenciacion (metodo de los dideoxinucleotidos)
Secuenciadores automaticos
S. de capilar
S. de gel
información obtenida por los secuenciadores. La tecnología que existe hoy en día permite secuenciar hasta El principal problema con el que se encuentra la secuenciación de los genomas es la ordenación de la información obtenida por los La tecnología que existe hoy en día permite secuenciar hasta 700 pb en una sola reacción de secuenciación. Con el desarrollo de secuenciaciones múltiples se han el desarrollo de secuenciaciones múltiples se han abaratado los precios y se aumenta la velocidad de procesamiento de las muestras
El tamaño de los genomas 1 volumen = 2320 pg
4 Mb (1 vol)
12 Mb
125 Mb
(3 vol)
(31 vol)
3000 Mb (750 vol)
Estrategias para la secuenciación de genomas Secuenciación al azar
Estrategias para la secuenciación de genomas Secuenciación ordenada
2 10 1 1 3 3 6
1
2
3
4
5
….. 10
1
1
2
2
Secuenciación al azar
Genoteca de plásmidos
Secuenciación al azar
Ensamblaje
Mapa físico
Secuenciación ordenada
Genoteca de BAC/YAC
Mapa
Genoteca de BAC/YAC Mapa 1500 kb BAC/YAC
Secuenciación ordenada
Genoteca de cósmidos Mapa
40 Kb
Cósmido Genoteca de plásmidos
Secuenciación al azar Ensamblaje del cósmido
Paseo cromosómico (Chromosome walking)
Hibridación Hibridar con el clon A1
Genoteca de BAC/YAC
E
D
C
B
1 2 3 4 5 6 7 8
A
A1 A2
•Hibridación •PCR
C6
Hibridar con el clon C6
E
D
C
B
A
1 2 3 4 5 6 7 8
A1 A2
E8 C6
Paseo cromosómico (Chromosome walking)
Genoteca de BAC/YAC
PCR
A1
E
D
C
A 12345678
B
A
1 2 3 4 5 6 7 8
PCR
B 12345678
C 12345678
D 12345678
A1 A4
Secuenciador 1 capilar 300 n/hora 7200 n !/día 50400 n/semana Secuenciador 100 capilares 30.000 n/hora 720.000 n !/día 5.040.000 n/semana
Evolución proyectos secuenciación genomas Genoma secuenciado
Año
Tamaño Genoma
Comentario
Bacteriófago _X174
1977
5,38 kb
1er genoma secuenciado
Plásmido pBR322
1979
4,3 kb
1er plásmido secuenciado
Bacteriófago _
1982
48,5 kb
Cromosoma III levadura
1992
315 kb
1er cromosoma
Haemophilus influenzae
1995
1,8 Mb
1er genoma organismo celular
Saccharomyces cerevisiae
1996
12 Mb
1er organismo eucariota
Caenorhabditis elegans
1998
97 Mb
1er organismo multicelular
Drosophila melanogaster
2000
165 Mb
Arabidopsis thaliana
2000
125 Mb
1ª planta secuenciada
Homo sapiens
2001
3000 Mb
1er genoma mamífero
Arroz (Oryza sativa)
2002
430 Mb
1ª planta cultivo
Pez cebra (Fugu rubripes)
2002
400 Mb
Genoma vertebrado menor tamaño
A. gambiae
2002
280 Mb
Ratón (Mus musculus)
2003
2700 Mb
Organismo modelo cercano hombre
Evolución proyectos secuenciación genomas
Servidor GOLD (Genomes OnLine Database) wit.integratedgenomics.com/GOLD/
La Bioinformática
El principal problema con el que se encuentra la secuenciación de los genomas es la ordenación de la información obtenida por losinformación obtenida por los secuenciadores. La tecnología que existe hoy en día permite secuenciar hasta 700 pb en una sóla reacción de secuenciación. Con el desarrollo de secuenciaciones múltiples se han abaratado los precios y se aumenta la velocidad de procesamiento de las muestras
Genoma Genes y secuencias relacionadas
DNAcodificante
DNA extragénico
DNAno codificante
DNA repetitivo DNA bajo nº copias
Intrones Pseudogenes Fragmentos de genes Repeticiones en tandem
Satélites Microsatélites Minisatélites
Repeticiones dispersas
Transposones Retrotransposones Retrovirus Secuencias de inserción
I. Análisis funcional: detección Identificacion de ORFs (secuencias génicas transcritas)
Codón de parada
ATG
RNAm
ATG
Proteína 500 Frame 1
1000
500
1000
1500
1500
Frame 1 Frame 2
2000
X
2000
Frame 2 Frame 3
Frame 3
2500
Frame 4 2500 Frame 4 Frame 5
Frame 5 Frame 6
Frame 6
2000
2000
X
1500
1500
1000
1000
500
500
25
250
I. Análisis funcional: detección Lista de ORFs (secuencias génicas transcritas)
Procariotas
Eucariotas
II. Asignación función: búsquedas de homología
BLAST / FASTA Query= sp|P03005|DNAB_ECOLI REPLICATIVE DNA HELICASE (EC3.6.1.-) - Escherichia coli. (471 letters) > Identities = 358/450 (79%), Positives = 407/450 (89%)
Frame = +2 Query: 20
QVAGLKVPPHSIEAEQSVLGGLMLDNERWDDVAERVVADDFYTRPHRHIFTEMARLQESG 79 Q+ LK+PPHS+EAEQSVLGGLMLDNE+WD V+E VVADDF+++PHR IF EM +L + G Sbjct: 234608 QINRLKIPPHSLEAEQSVLGGLMLDNEQWDSVSEHVVADDFFSKPHRLIFQEMQKLLDLG 234787 Query: 80
SPIDLITLAESLERQGQLDSVGGFAYLAELSKNTPSAANISAYADIVRERAVVREMISVA 139 PIDLITL+ESLE++G+L+SVG F+YLAELSKNTPS ANI+AYADIVRERA+VREMI VA Sbjct: 234788 YPIDLITLSESLEQKGKLESVGRFSYLAELSKNTPSTANITAYADIVRERAIVREMILVA 234967 Query: 140
NEIAEAGFDPQGRTSEDLLDLAESRVFKIAESRANKDEGPKNIADVLDATVARIEQLFQQ 199 N+IA AG+D QGR SE+LLD AES VFKIAE R KD GPKN+ +LD TVA IE+LF Sbjct: 234968 NKIANAGYDTQGRKSEELLDYAESSVFKIAEKRFKKDSGPKNVEQILDETVASIEKLFLS 235147 Query: 200
PHDGVTGVNTGYDDLNKKTAGLQPSDLIIVAARPSMGKTTFAMNLVENAAMLQDKPVLIF 259 PHDGVTG+NTGY DLNKKT+GLQ S+LII+AARPSMGKTTFAMNL ENAAML DKPVLIF Sbjct: 235148 PHDGVTGINTGYQDLNKKTSGLQRSELIIIAARPSMGKTTFAMNLCENAAMLYDKPVLIF 235327 Query: 260
SLEMPSEQIMMRSLASLSRVDQTKIRTGQLDDEDWARISGTMGILLEKRNIYIDDSSGLT 319 SLEMP EQIMMR LASLSRV+Q +IRTGQL++EDWARISGT+ ILL+K+NIYIDDSS LT Sbjct: 235328 SLEMPGEQIMMRMLASLSRVNQARIRTGQLNNEDWARISGTINILLKKKNIYIDDSSALT 235507 Query: 320
PTEVRSRARRIAREHGGIGLIMIDYLQLMRVPALSDNRTLEIAEISRSLKALAKELNVPV 379 P+EVRSRARRI RE+ G+ LIM+DYLQLMRVP+LS+NRTLEIAEISR+LKALAKEL VPV Sbjct: 235508 PSEVRSRARRIYRENNGLTLIMVDYLQLMRVPSLSENRTLEIAEISRTLKALAKELQVPV 235687
SISTEMAS DE ANÁLISIS DE GENOMAS
Sin homología Homología sin función Posible función
Homólogo con función encontrado
Identificados anteriormente