UNIVERSIDAD DE GRANADA

Minería de algoritmos y altos vuelos

  • Un proyecto liderado por el profesor José Manuel Benítez establece sistemas de procesamiento, modelado y validación para extraer la mayor utilidad posible al manejo de grandes cantidades de información utilizando las prestaciones que ofrece la computación en la nube · La minería de datos permite definir y anticipar patrones de comportamiento con fines comerciales o, por ejemplo, para detectar riesgos en la seguridad nacional.

José Manuel Benítez Sánchez, en el centro, con investigadores de su equipo.

Aplicar las nuevas técnicas de procesamiento de datos aprovechando las prestaciones que ofrece la nube para extraer patrones de comportamiento es el objetivo de un proyecto de investigación liderado por José Manuel Benítez Sánchez en la Universidad de Granada (UGR), bajo el nombre Minería de datos en cloud computing. Se trata de un tema de potente actualidad y comprende dos líneas de investigación: la minería de datos y sus técnicas, cuyo objetivo es intentar obtener o derivar el conocimiento de grandes cantidades de datos, y por otro, aprovechar las prestaciones que ofrece el cloud computing.

Tal y como reconoce el responsable del proyecto, “hay organizaciones y empresas que generan grandes cantidades de datos pero en muchas ocasiones no los aprovechan. Nuestra pregunta fue si se podía obtener conocimiento analizando toda esa información". La respuesta fue afirmativa. Se pueden conocer desde "los hábitos de comportamiento de una persona" hasta las tendencias de una sociedad o de un determinado segmento de población "que sea relevante para la empresa o entidad”. La idea no es otra más que intentar adaptar la estragegia comercial a los gustos de los clientes y usuarios. En definitiva, averiguar cuáles son los patrones de comportamiento. Tal y como señala el profesor de la Universidad de Granada, “en la minería de datos hay técnicas que tratan de encontrar un método más o menos sistemático aprovechando la gran cantidad de información que se generan para intentar adaptarse al perfil de potenciales clientes”.

La minería de datos es un término asentado en la literatura informática y de hecho muchas empresas ofrecen ya herramientas comerciales para emplear estas técnicas en la búsqueda y procesamiento de una información que a primera vista no es visible. Estas soluciones las aplican desde las grandes compañías para adelantar su estrategia comercial a la demanda de los consumidores hasta grandes instituciones como la Agencia de Seguridad Nacional de Estados Unidos para detectar patrones de comportamiento considerados de riesgo que puedan ser útiles en las políticas de seguridad. En este sentido se analizan llamadas telefónicas, correos electrónicos o comentarios en redes sociales para detectar conductas delictivas. El aspecto negativo del manejo masivo de información reside en la colisión con los derechos relacionados con la intimidad y protección de datos.

Por otro lado, para procesar un gran volumen de información se requiere usar la computación en la nube. El cloud computing se caracteriza por la capacidad masiva de hacer cálculos, el espacio de almacenamiento y la continuidad en la comunicación. Pero además, destaca por la denominada escalabilidad transparente que es el hecho de diseñar un proceso y a partir de ahí adecuar los recursos para poder darle soporte al proceso a las necesidades reales. Para Benítez Sánchez, “en la nube todo está organizado por medios de grandes centros de datos y los servicios se prestan a través de la red. Eso ofrece un abanico de grandes posibilidades, que hace que ahora se puedan plantear grandes proyectos que antes eran imposibles llevar a cabo por los costes que suponían”.

De hecho, tal y como reconoce, “en la Universidad de Granada tenemos un supercomputador pero de entrada cuesta mucho dinero tenerlo y mantenerlo al margen del personal. Sin embargo, si necesito un supercomputador que supere las prestaciones del que tenemos en la UGR, económicamente sería inviable adquirirlo, pero gracias a los servicios que se prestan en la nube, es posible trabajar con grandes resultados pagando únicamente por el uso que se haga en un momento dado”.

El proyecto, por tanto, tiene por objetivo recabar todas las etapas de un proceso de minería de datos para determinar qué datos son interesantes y cuáles no. Por otro lado, aplicar la construcciones de modelos de datos para resolver problemas de clasificación o de reversión de valores que puedan cambiar. En estos casos, para tener un modelo adecuado no es suficiente el conocimiento de los expertos sino que se requiere analizar una gran cantidad de datos que serían imposibles hacerlo si no es gracias a estas técnicas de minería en plataformas de cloud computing, de forma que se adecuen a las necesidades de una empresa.

Pero todo este proceso sería en balde sin una buena visualización de los datos, porque de nada sirve analizar un volumen grande de datos si no se sabe interpretar y sobre todo no quedan claros a primera vista. Esto solo lo proporciona una buena técnica de visualización de datos. Por lo que el proyecto se puede resumir en tres etapas: preprocesamiento, modelado y validación.

Liderado por el profesor José Manuel Benítez Sánchez, cuenta con unos 10 investigadores del grupo de Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada así como con colaboradores de la Universidad de Córdoba y Burgos y del extranjero como Australia. 

Comentar

0 Comentarios

    Más comentarios