Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC [email protected] http://www.uccor.edu.ar/modelo.php?param=3.8.5.15 Fac. de Ingeniería – UNC - 2010 Pregunta? Bioinformatics is the application of information technology to the field of molecular biology. Bioinformatics entails the creation and advancement of databases, algorithms, computational and statistical techniques, and theory to solve formal and practical problems arising from the management and analysis of biological data. …. It is the name given to these mathematical and computing approaches used to glean understanding of biological processes. Common activities in Bioinformatics include mapping and analyzing DNA and protein sequences, aligning different DNA and protein sequences to compare them and creating and viewing 3-D models of protein structures. Qué es Bioinformática Bioinformatics is that branch of life science,which deals with the study of application of information technology to the field of molecular biology. The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution. Qué es para mi? Medicina …. Biología Bases de datos Estadística Informática Apnredizaje Sistemas de Automático Información Agronomia Biología Molecular Bioingeniero …. Bioinformático Modelos Equipamiento Tecnología ….. Un mejor modelo Medicina …. Biología Agronomia Biología Molecular …. Bases de datos Estadística Informática Apnredizaje Automático Sistemas de Información Modelos Equipamiento Tecnología ….. Con qué objetivo? Bioinformático-Bioingeniero No son antagónicos sino complementarios Capacidades diferenciadas Deben actuar como nexo entre las necesidades en el ámbito de la Biología y las tecnologías asistentes. Porqué surge la bioinformática Las planillas de MS Excel ya no alcanzan. Globalización de la información y de los recursos. Necesidades de cálculo intensivo Necesidades de modelado intensivo Contrastar por modelos lo observado en la realidad Tecnologías de alto rendimiento, un nuevo paradigma …. Dato Datum Resumiendo… congreso Laboratorio Dato Calculo Data DATOS Data Archivo Imagen Planilla excel E mC Base de datos datito Variables DATOS Perfil Servidor Proteinas DATITITO 2 reporte DATO Datos presentación Expresión génica Atributos ATRIBUTOS Cuál es el rol fundamental del BioIn…loquesea Instaurar un lenguaje común entre el mundo de la biología y el de la tecnología. Ejemplos IA-Estadística Proyecto Bélgica. Diseño stent US-Latin American Cancer Research Network Cómo es el entorno de trabajo Multidisciplinar Biólogos Médicos Bioingenieros Estadísticos Físicos Matemáticos Técnicos Informáticos Etc. Algunos títulos LIMS Chemometrics Biometrics Genomics Proteomics Technology BD Data Mining LIMS Laboratory Information Management Systems Administrar la información Biotecnológica Proveer herramientas de comunicación Proveer herramientas de análisis y búsqueda Conectar los distintos sistemas y equipos. Proveer capacidades de seguimiento Importante para las facilities ¿Capacidades? Chemometrics Modelado molecular Interacción de moléculas con el medio Modelos moleculares LIMS NIR Desarrollo de Drogas Biometrics Diseño de experimentos Modelos estadísticos en biología Inferencia Técnicas estadísticas para resumen y visualización de datos. ¿Capacidades? Genomics Secuenciamiento (Biosidus) Microarreglos de ADN (Biosidus, INTA, Leloir, UBA) (ETC international, Agilent) Ontologías Curado de bases de datos TextMining Cáncer, etc.. ¿Capacidades? Tecnologías asociadas: Microarreglos de ADN Proteomics Folding, predicción estructural Secuenciamiento Interacción con el agua Modelado 3D (Homologías) Ontologías Curado de bases de datos Vías Metabólicas M/Z Geles bidimensionales ¿Capacidades? Tecnologías asociadas: MALDI-TOF LIMS? Tecnologías asociadas: Expresión diferencial de proteínas Tecnologías asociadas: Modelado de moléculas • Modelado Bases de Datos No existen en Argentina bases de datos preparadas para ámbitos de biología Las bases de datos solo están pensadas con el propósito de almacenar No hay consenso en Argentina Flexibilidad insuficiente (sharing) Estructuras inadecuadas (Data Mining) Curado ¿Capacidades? Data Mining Knowledge Discovery in Databases es el proceso no trivial de identificación de patrones sobre los datos. Estos deberán resultar ser válidos, novedosos, potencialmente útiles y entendibles. Data Mining Knowledge Discovery Estadística Inteligencia Artificial Computación avanzada Sistemas de adquisición y Monitorización Reconocimiento de patrones Tecnologías de Bases de datos Visualización Y casi al final…Ontologías La estrella del momento Secuenciadores de “próxima” generación • 454 Roche: Pirosecuenciador (Arg) • • De novo sequencing Metagenomica • Solexa ILLUMINA • Solid ABI Next? Generation Sequencing Nuestro grupo Grupo de Minería de Bio-Datos (BioData Mining) Dr. Elmer Fernández, Bioing. Cristobal Fresno Universidad Católica de Córdoba CONICET Campus-Camino Alta Gracia km 7 ½ 5000 – Cba. Con quien trabajamos? Dra.Mónica Balzarini (Dpto. BiometriaUNC) Dr. Osvaldo Podhajcer (Terapia Celular y Molecular- Inst. Leloir) Dra. Andrea Llera (Terapia Celular y Molecular- Inst. Leloir) Adivisor: Dr. Terence Speed (WHEIAustralia & UC Berkeley-USA) Nuestro grupo en la UCC http://sites.google.com/site/biologicaldatamininggroup/Home/ Historia en la UCC • Comienzos en 2004 • 2006 post-doc visitante @ islab, Antwerp, Belgica • 2006-2008 Master en App. Stat. • 2009 candidato Doctorado Líneas de interés en investigación • KDD en ciencias biomédicas a través de técnicas estadístico-computacionales • Aprendizaje Maquinal – Artificial Neural Networks – Support Vector Machines – Clustering • Estadística – Generalized Linear Mixed Models – Partial Least Squares – Clustering Líneas de interés en investigación • Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) – Administración de datos biológicos – Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación – Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación – Procesamiento de señales/datos Biomédicos Historia en la UCC • Comienzos en 2004 • 2006 post-doc visitante @ islab, Antwerp, Belgica • 2006-2008 Master en App. Stat. • 2009 candidato Doctorado Líneas de interés en investigación • KDD en ciencias biomédicas a través de técnicas estadístico-computacionales • Aprendizaje Maquinal – Artificial Neural Networks – Support Vector Machines – Clustering • Estadística – Generalized Linear Mixed Models – Partial Least Squares – Clustering Líneas de interés en investigación • Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) – Administración de datos biológicos – Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación – Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación – Procesamiento de señales/datos Biomédicos Líneas de interés en investigación • Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) – PUA-DMB es un entorno ordenado para el análisis de estudios biológicos Hemodialisis Control Cardiovascular Genómica y Proteómica …… Funcional PUA-DMB Líneas de interés en investigación • PUA-DMB en Hemodialisis – Desarrollo de técnicas analíticas para monitoreo molecular-antropométrico en pacientes en tratamiento: • Diagnóstico de la eficiencia • Evaluación de biomarcadores • Caracterización de pacientes en pos de tratamientos sujeto-específico Líneas de interés en investigación • PUA-DMB en Control Cardiovascular – Abordaje estadístico del control Cardiovascular mediante supuestos nonormales – Estudios del balance en el sistema nervioso central – Análisis del ECG para detección de apnea – Desórdenes eléctricos y Mechano-Electrical Feedback. Líneas de interés en investigación • PUA-DMB en Genómica y Proteómica Funcaional – Métodos estadísticos y de Aprendizaje maquinal para análisis patrones de genes y proeínas • DNA Microarray data analysis (INSPECTOR,SOM) – Agriculture, cancer, etc. • Gel based protein analysis (2D-DIGE technology) • Modelos estadísticos para análisis de invación celular. Líneas de interés en investigación • Optimización y diagnóstico de clasificadores y regresores noparamétricos (aprendizaje maquinal) – – – – Selección de características Validación, evaluación y selección de modelos Aprendizaje Maquinal en contextos estadísticos: Comportamiento de técnicas computacionales de reconocimiento de patrones bajo hipótesis distribucionales conocidas. El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC BDMG UCC J. Lopez del Olmo (PhD) laCNIC - Spain Estudios moleculares y funcionales de transición epitelio mesenquimal y su impacto en el aumento de la agresividad tumoral. PICT-2008 Statistical Models for protein pattern analysis. MinCyt –cba 2008 A. Llera (PhD) Moll. And Cell therapy Lab. Leloir Inst. - Argentina Somewhere in the world: Terry Speed Functional Genomics and Proteomics El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC P. Willshaw (PhD) School of Health Sciences Swansea Univ. - UK BDMG UCC R. Valtuille (Phys) Fresenius Medical Care Arg. Hemodialysis El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC BDMG UCC P. Abry (PhD) Ecole Normal Superieur de Lyon - France Cardiovascular Control and Signal Processing Experiencias en empresas/centros de I+D • • • • • • • GALIX (Holter de ECG) Fresenius Medical Care Aeromedical (Stent Coronario) INTA INTI UBA Ledesma Hasta la próxima Make everything as simple as possible, but not simpler (A. Enstain) Si uno hace lo que todo el mundo hace, obtiene lo que todo el mundo obtiene. (¿?) El atroz encanto de ser argentinos, M. Aguinis Muchas Gracias