La Inteligencia Computacional (IC) se refiere comúnmente a una variedad de técnicas bioinspiradas y/o similares a las humanas que pueden aplicarse en problemas de optimización, aprendizaje y modelización. En términos generales, la IC comprende las redes neuronales artificiales, los conjuntos difusos y la lógica difusa y la computación evolutiva. En la era de los grandes datos, se espera que la IC, junto con las técnicas de minería de datos, ayuden a descubrir conocimientos útiles a partir de los grandes datos, ya que son muy adecuadas para tratar la veracidad y variedad intrínsecas de los grandes datos; sin embargo, se enfrentan al reto del volumen y la velocidad de los grandes datos, que suelen limitar su aplicación en este contexto.
En esta charla, comenzaré con una introducción al aprendizaje automático y a los grandes datos, y hablaré de cómo paralelizar eficazmente el cálculo en varios nodos de computación utilizando PySpark. A continuación, presentaré algunos ejemplos de la aplicación de la IC a escenarios de big data, incluyendo la Ciencia Ciudadana y la Detección de Puntos Calientes en Tiempo Real. Discutiré un enfoque para manejar la incertidumbre en los datos de la Ciencia Ciudadana con un caso de estudio en la clasificación de imágenes Galaxy, y un enfoque dinámico bio-inspirado para detectar puntos calientes en flujos de big data y su aplicación para identificar incidentes en las carreteras causados por vehículos pesados como caso de estudio.