Download Bioinformatica

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
Tópicos en Bioinformática
Elmer A. Fernández (PhD, Bioing)
CONICET-UCC
[email protected]
http://www.uccor.edu.ar/modelo.php?param=3.8.5.15
Fac. de Ingeniería – UNC - 2010
Pregunta?
Bioinformatics is the application of information technology to the field of
molecular biology. Bioinformatics entails the creation and advancement of
databases, algorithms, computational and statistical techniques, and theory
to solve formal and practical problems arising from the management and
analysis
 of biological data. …. It is the name given to these mathematical and
computing approaches used to glean understanding of biological processes.
Common activities in Bioinformatics include mapping and analyzing DNA and
protein sequences, aligning different DNA and protein sequences to compare
them and creating and viewing 3-D models of protein structures.
Qué es Bioinformática
Bioinformatics is that branch of life science,which deals with the study of
application of information technology to the field of molecular biology.
The primary goal of bioinformatics is to increase our understanding of
biological processes. What sets it apart from other approaches, however, is
its focus on developing and applying computationally intensive techniques
(e.g., data mining, and machine learning algorithms) to achieve this goal.
Major research efforts in the field include sequence alignment, gene finding,
genome assembly, protein structure alignment, protein structure prediction,
prediction of gene expression and protein-protein interactions, and the
modeling of evolution.
Qué es para mi?
Medicina
….
Biología
Bases de
datos
Estadística
Informática
Apnredizaje
Sistemas de
Automático
Información
Agronomia
Biología
Molecular
Bioingeniero
….
Bioinformático
Modelos
Equipamiento
Tecnología
…..
Un mejor modelo
Medicina
….
Biología
Agronomia
Biología
Molecular
….
Bases de
datos
Estadística
Informática
Apnredizaje
Automático
Sistemas de
Información
Modelos
Equipamiento
Tecnología
…..
Con qué objetivo?
Bioinformático-Bioingeniero
No son antagónicos sino
complementarios
 Capacidades diferenciadas
 Deben actuar como nexo entre las
necesidades en el ámbito de la Biología
y las tecnologías asistentes.

Porqué surge la bioinformática







Las planillas de MS Excel ya no alcanzan.
Globalización de la información y de los
recursos.
Necesidades de cálculo intensivo
Necesidades de modelado intensivo
Contrastar por modelos lo observado en la
realidad
Tecnologías de alto rendimiento, un nuevo
paradigma
….
Dato
Datum
Resumiendo…
congreso
Laboratorio
Dato
Calculo
Data
DATOS
Data
Archivo
Imagen
Planilla excel
E  mC
Base de datos
datito
Variables
DATOS
Perfil
Servidor
Proteinas
DATITITO
2
reporte
DATO
Datos
presentación
Expresión génica
Atributos
ATRIBUTOS
Cuál es el rol fundamental del
BioIn…loquesea
Instaurar un lenguaje común entre el
mundo de la biología y el de la
tecnología.
 Ejemplos

IA-Estadística
 Proyecto Bélgica.
 Diseño stent
 US-Latin American Cancer Research
Network

Cómo es el entorno de trabajo
Multidisciplinar
Biólogos
Médicos
Bioingenieros
Estadísticos
Físicos
Matemáticos
Técnicos
Informáticos
Etc.
Algunos títulos
LIMS
 Chemometrics
 Biometrics
 Genomics
 Proteomics
 Technology
 BD
 Data Mining

LIMS

Laboratory Information Management Systems







Administrar la información Biotecnológica
Proveer herramientas de comunicación
Proveer herramientas de análisis y búsqueda
Conectar los distintos sistemas y equipos.
Proveer capacidades de seguimiento
Importante para las facilities
¿Capacidades?
Chemometrics
Modelado molecular
 Interacción de moléculas con el medio
 Modelos moleculares
 LIMS
 NIR
 Desarrollo de Drogas

Biometrics
Diseño de experimentos
 Modelos estadísticos en biología
 Inferencia
 Técnicas estadísticas para resumen y
visualización de datos.
 ¿Capacidades?

Genomics
Secuenciamiento (Biosidus)
 Microarreglos de ADN (Biosidus, INTA,
Leloir, UBA) (ETC international, Agilent)
 Ontologías
 Curado de bases de datos
 TextMining
 Cáncer, etc..
 ¿Capacidades?

Tecnologías asociadas:
Microarreglos de ADN
Proteomics










Folding, predicción estructural
Secuenciamiento
Interacción con el agua
Modelado 3D (Homologías)
Ontologías
Curado de bases de datos
Vías Metabólicas
M/Z
Geles bidimensionales
¿Capacidades?
Tecnologías asociadas:
MALDI-TOF
LIMS?
Tecnologías asociadas:
Expresión diferencial de proteínas
Tecnologías asociadas:
Modelado de moléculas
• Modelado
Bases de Datos







No existen en Argentina bases de datos
preparadas para ámbitos de biología
Las bases de datos solo están pensadas con
el propósito de almacenar
No hay consenso en Argentina
Flexibilidad insuficiente (sharing)
Estructuras inadecuadas (Data Mining)
Curado
¿Capacidades?
Data Mining

Knowledge Discovery in Databases es el
proceso no trivial de identificación de
patrones sobre los datos. Estos
deberán resultar ser válidos,
novedosos, potencialmente útiles y
entendibles.
Data Mining

Knowledge Discovery
Estadística
Inteligencia
Artificial
Computación
avanzada
Sistemas de
adquisición y
Monitorización
Reconocimiento
de patrones
Tecnologías
de Bases de
datos
Visualización
Y casi al final…Ontologías
La estrella del momento
Secuenciadores de “próxima” generación
• 454 Roche: Pirosecuenciador (Arg)
•
•
De novo sequencing
Metagenomica
• Solexa ILLUMINA
• Solid ABI
Next? Generation Sequencing
Nuestro grupo
Grupo de Minería de Bio-Datos
(BioData Mining)
Dr. Elmer Fernández, Bioing. Cristobal Fresno
Universidad Católica de Córdoba
CONICET
Campus-Camino Alta Gracia km 7 ½
5000 – Cba.
Con quien trabajamos?
Dra.Mónica Balzarini (Dpto. BiometriaUNC)
Dr. Osvaldo Podhajcer (Terapia Celular y
Molecular- Inst. Leloir)
Dra. Andrea Llera (Terapia Celular y
Molecular- Inst. Leloir)
Adivisor: Dr. Terence Speed (WHEIAustralia & UC Berkeley-USA)
Nuestro grupo en la UCC
http://sites.google.com/site/biologicaldatamininggroup/Home/
Historia en la UCC
• Comienzos en 2004
• 2006 post-doc visitante @ islab,
Antwerp, Belgica
• 2006-2008 Master en App. Stat.
• 2009 candidato Doctorado
Líneas de interés en investigación
• KDD en ciencias biomédicas a través de
técnicas estadístico-computacionales
• Aprendizaje Maquinal
– Artificial Neural Networks
– Support Vector Machines
– Clustering
• Estadística
– Generalized Linear Mixed Models
– Partial Least Squares
– Clustering
Líneas de interés en investigación
• Proceso Unificado de Análisis para DM en
Bio-ciencias (PUA-DMB)
– Administración de datos biológicos
– Desarrollo de técnicas basadas en aprendizaje
computacional para Clustering and Classificación
– Desarrollo de estrategias estadísticas para análisis
de datos bajo diferentes supuestos distribucionales
con efectos aleatorios y estructuras de correlación
– Procesamiento de señales/datos Biomédicos
Historia en la UCC
• Comienzos en 2004
• 2006 post-doc visitante @ islab,
Antwerp, Belgica
• 2006-2008 Master en App. Stat.
• 2009 candidato Doctorado
Líneas de interés en investigación
• KDD en ciencias biomédicas a través de
técnicas estadístico-computacionales
• Aprendizaje Maquinal
– Artificial Neural Networks
– Support Vector Machines
– Clustering
• Estadística
– Generalized Linear Mixed Models
– Partial Least Squares
– Clustering
Líneas de interés en investigación
• Proceso Unificado de Análisis para DM en
Bio-ciencias (PUA-DMB)
– Administración de datos biológicos
– Desarrollo de técnicas basadas en aprendizaje
computacional para Clustering and Classificación
– Desarrollo de estrategias estadísticas para análisis
de datos bajo diferentes supuestos distribucionales
con efectos aleatorios y estructuras de correlación
– Procesamiento de señales/datos Biomédicos
Líneas de interés en investigación
• Proceso Unificado de Análisis para
DM en Bio-ciencias (PUA-DMB)
– PUA-DMB es un entorno ordenado para el
análisis de estudios biológicos
Hemodialisis
Control
Cardiovascular
Genómica y Proteómica
……
Funcional
PUA-DMB
Líneas de interés en investigación
• PUA-DMB en Hemodialisis
– Desarrollo de técnicas analíticas para
monitoreo molecular-antropométrico en
pacientes en tratamiento:
• Diagnóstico de la eficiencia
• Evaluación de biomarcadores
• Caracterización de pacientes en pos de
tratamientos sujeto-específico
Líneas de interés en investigación
• PUA-DMB en Control Cardiovascular
– Abordaje estadístico del control
Cardiovascular mediante supuestos nonormales
– Estudios del balance en el sistema nervioso
central
– Análisis del ECG para detección de apnea
– Desórdenes eléctricos y Mechano-Electrical
Feedback.
Líneas de interés en investigación
• PUA-DMB en Genómica y Proteómica
Funcaional
– Métodos estadísticos y de Aprendizaje
maquinal para análisis patrones de genes y
proeínas
• DNA Microarray data analysis (INSPECTOR,SOM)
– Agriculture, cancer, etc.
• Gel based protein analysis (2D-DIGE
technology)
• Modelos estadísticos para análisis de invación
celular.
Líneas de interés en investigación
• Optimización y diagnóstico de
clasificadores y regresores noparamétricos (aprendizaje maquinal)
–
–
–
–
Selección de características
Validación, evaluación y selección de modelos
Aprendizaje Maquinal en contextos estadísticos:
Comportamiento de técnicas computacionales de
reconocimiento de patrones bajo hipótesis
distribucionales conocidas.
El mapa de colaboraciones
M. Balzarini (PhD)
Biometrics Dept. UNC
BDMG
UCC
J. Lopez del Olmo (PhD)
laCNIC - Spain
Estudios moleculares y funcionales de
transición epitelio mesenquimal y su
impacto en el aumento de la agresividad
tumoral. PICT-2008
Statistical Models for protein pattern
analysis. MinCyt –cba 2008
A. Llera (PhD)
Moll. And Cell therapy Lab.
Leloir Inst. - Argentina
Somewhere in the world:
Terry Speed
Functional Genomics and Proteomics
El mapa de colaboraciones
M. Balzarini (PhD)
Biometrics Dept. UNC
P. Willshaw (PhD)
School of Health Sciences
Swansea Univ. - UK
BDMG
UCC
R. Valtuille (Phys)
Fresenius Medical Care
Arg.
Hemodialysis
El mapa de colaboraciones
M. Balzarini (PhD)
Biometrics Dept. UNC
BDMG
UCC
P. Abry (PhD)
Ecole Normal Superieur
de Lyon - France
Cardiovascular Control and Signal Processing
Experiencias en empresas/centros
de I+D
•
•
•
•
•
•
•
GALIX (Holter de ECG)
Fresenius Medical Care
Aeromedical (Stent Coronario)
INTA
INTI
UBA
Ledesma
Hasta la próxima
Make everything as simple as possible, but not
simpler (A. Enstain)
Si uno hace lo que todo el mundo hace, obtiene
lo que todo el mundo obtiene. (¿?)
El atroz encanto de ser argentinos, M. Aguinis
Muchas Gracias