Data Science: applications to biology and medicine with Phyton and R

Date:
03/05/2018 08:00 - 31/07/2018 18:00
Institution:
University of Barcelona
Venue:
Facultat de Biologia - Universitat de Barcelona (Avda. Diagonal 645, Barcelona)
Type of Event:
Course
Language:
Spanish
Website:
Programa y profesorado del curso
Document:
Download
Poster:
Download Poster

Abstract

Data Scientist: The Sexiest Job of the 21st Century!


With biomedical research developing at a rapid pace, biologists and doctors have proved the necessity of adopting concepts and tools from other areas including machine learning, computational chemistry, engineering, mathematics, and physics. The shift of paradigm drives many initiatives in the health and data space, such as precision medicine, value-based healthcare and genomics (based on Ivan Zheng, Data Scientist: "a Profession for Quantitative Biologists")

Description / Information

150 h (90 h presenciales + trabajos): 3 Mayo - Julio 2018 (3 meses -> 20h mes, 8h semana + seminarios)

Programa del curso
1- Lenguajes de programación y datos

  • Sistema operativo Linux
  • Administración en Linux
  • Lenguaje Python
  • Bases de datos relacionales y no relacionales
  • Lenguaje R
  • Servidores de datos y super-computación (HPC)
  • Data management, Markdown, latex, notebooks
  • Aplicaciones a medida web (Shiny)

2-Análisis estadístico con R

  • Estadística descriptiva y exploratoria
  • Diseño de experimentos
  • Análisis multivariante
  • Análisis bayesiano

3-Machine Learning (ML)

  • Conceptos básicos de Machine-learning (ML)
  • Aprendizaje no supervisado (Unsupervised learning)
    • Clustering (k-means y hierarchical clustering)
    • Reducción de la dimensión (Principal Component Analysis)
  • Aprendizaje supervisado (Supervised Learning) / Clasificación
    • Generative vs discriminative modelos
    • Validación de modelos (bias variance trade-off and learning curves)
    • Clasificadores (Naive Bayes, KNN, Linear SVM)
  • Ensemble methods (Boosting, Bagging, y Random Forests)
  • Neural nets y Deep learning
  • Introduction to Feature Selection Methods: Sequential Searches and Genetic Algorithms

Seminarios (a confirmar)

  • Análisis de datos ómicos: metagenómica, metatranscriptomics (RNAseq). (A. Paytuví. Sequentia-Biotech)
  • Arquitectura de datos: High-performance computing en las biociencias. (P. Puigdomènech, HPCNow!)
  • Statistical techniques to assess association of novels genetics variants and complex diseases: CNVassoc R package ". (Isaac Subirana, IMIM)
  • Introduction to preprocessing chromatography / mass spectrometry data for metabolomics (Santiago Marco. Facultat de Física UB)
  • Deep Learning aplicado al campo biomédico (Petia Radeva, Dept. Mathematics and Computer Science. Facultad de Matemáticas e Informática. UB.)
  • Análisis de datos ómicos (metabarcoding y metagenome skimming) en biomonitorización. Cesc Múrria. Secció d'Ecologia, Departament de Biologia Evolutiva, Ecologia i Ciències Ambientals. Fac Biologia. UB
  • Big data con ciencia cituadana (estadística espacial): Proyecto Mosquito Alert. Proyecto Ríu-Net. Proyectos sensores metereológicos colaborativos (varios)

Trabajo final aplicado: resolución de problema real de ciencia de los datos en el campo biomédico

Objectives

Introducirse en el ámbito de la ciencia de datos y estudiar las técnicas computacionales más avanzadas para convertirse en un científico de datos.

La función central de un científico de datos es extraer información de conjuntos de datos complejos que pueda ser útil para la estrategia de investigación en las ciencias biológicas (biología, biotecnología, bioquímica, etc.) y en medicina, así como para la toma de decisiones empresariales. A medida que la ciencia entra en la era digital y continúa uniéndose a la industria de la tecnología más amplia, el alcance de las necesidades de la ciencia de datos es cada vez más extenso.

Los científicos de datos de este espacio emergente se encargan con regularidad de abordar problemas sofisticados, tales como reducir la carga de tareas repetitivas en biólogos, biotecnólogos, bioquímicos o médicos, desarrollar plataformas de análisis genómico de alto rendimiento, identificar nuevos objetivos moleculares para el descubrimiento de fármacos, optimizar los procedimientos de ensayos clínicos, analizar datos médicos electrónicos para mejorar la atención al paciente o prever la progresión de la enfermedad para reducir las tasas de mortalidad.

Debido al rápido desarrollo de la investigación biomédica, los biocientíficos han demostrado la necesidad de adoptar conceptos y herramientas de otras áreas, como el aprendizaje automático, la química computacional, la ingeniería, las matemáticas, la física o la biodiversidad. El cambio de paradigma impulsa muchas iniciativas en el ámbito de la vida, la salud y la información; entre otros, la medicina de precisión, la asistencia sanitaria basada en el valor, la genómica o la biomonitorización. Por otra parte, las diferencias en la industria de la vida, la salud y la tecnología tienden a favorecer a los científicos de datos que comprenden su dominio y sus retos.

Target group

Profesionales en el campo de las biociencias i/o medicina (biólogos, médicos, biotecnólogos, bioquímicos, farmacéuticos, bioingenieros, etc).
 

Faculty

  • Antonio Monleón Getino (Coordinación). Biost3, GRBIO. Sección Estadística. Dep GME-UB
  • Biel Stela Ballester. Bioinformático. Pharmacoinformatics Group. UPF
  • Hansel Gómez Martínez. Investigador postdoctoral en IRB-BCN. Lab. de Modelación Molecular y Bioinformática (https://www.irbbarcelona.org/en/profile/hansel-gomez)
  • Pere Puigdomènech, HPCNow!
  • Moisés Burset. Biost3, Sección Estadística. Dep GME-UB
  • Pere López. Biost3, Sección Estadística. Dep GME-UB
  • Xavier de Pedro. Ajuntament de Barcelona.
  • Carlos Crespo. Biost3, Sección Estadística. Dep GME-UB
  • Andreu Paytuví. Bioinformático. Sequentia-Biotech
  • David Jorquera. Informático.
  • Cesc Múrria. Secció d'Ecologia, Departament de Biologia Evolutiva, Ecologia i Ciències Ambientals. Fac Biologia. UB
  • Santiago Marco, Departamento de Ingeniería Electrónica y Biomédica. Facultad de Física. UB
  • Petia Radeva. Dept. Mathematics and Computer Science. Facultad de Matemáticas e Informática. UB.

Fees

Inscripciones abiertas hasta el 25 de abril.

3 descuentos especiales (10% de la matrícula, a parte de la tasas del curso) a miembros de la Asociación Bioinformatics Barcelona - BIB. El alumno deberá realizar el pago completo de la matrícula y se le retornará posteriormente el 10% de la misma. Los interesados consultar a Antonio Monleon: amonleong(ELIMINAR)@ub.edu

Requirements

  • Es recomendable que los estudiantes traigan su propio portatil (laptop) a clase.
  • Es recomendable conocimientos de estadística, matemáticas e informática a nivel de usuario.

Contact

Para más información contacta con: amonleong(ELIMINAR)@ub.edu // eballester(ELIMINAR)@ub.edu telf: 34.93.402.15.60

Más información: http://www.ub.edu/web/ub/es/estudis/oferta_formativa/masters_propis/fitxa/C/201711279/index.html