
Cargando ...
De vueltas, de nuevo, con el desarrollo de la nueva web de la Facultad de Comunicación. Un concepto interesante que surgió, de forma superficial, lo rozamos, se planteó ligeramente, pero que me parece realmente interesante, es el concepto de “Minería de datos“. La wikipedia lo define así:
La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.
Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.
Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
¿Qué diferencia hay entre dato e información?. Pues bien:
Los datos son la mínima unidad semántica, y se corresponden con elementos primarios de información que por sí solos son irrelevantes como apoyo a la toma de decisiones. También se pueden ver como un conjunto discreto de valores, que no dicen nada sobre el por qué de las cosas y no son orientativos para la acción.
La información se puede definir como un conjunto de datos procesados y que tienen un significado (relevancia, propósito y contexto), y que por lo tanto son de utilidad para quién debe tomar decisiones, al disminuir su incertidumbre. Los datos se pueden transforman en información añadiéndoles valor:
- Contextualizando: se sabe en qué contexto y para qué propósito se generaron.
- Categorizando: se conocen las unidades de medida que ayudan a interpretarlos.
- Calculando: los datos pueden haber sido procesados matemática o estadísticamente.
- Corrigiendo: se han eliminado errores e inconsistencias de los datos.
- Condensando: los datos se han podido resumir de forma más concisa (agregación).
El conocimiento es una mezcla de experiencia, valores, información y know-how que sirve como marco para la incorporación de nuevas experiencias e información, y es útil para la acción. Se origina y aplica en la mente de los conocedores. En las organizaciones con frecuencia no sólo se encuentra dentro de documentos o almacenes de datos, sino que también esta en rutinas organizativas, procesos, prácticas, y normas.
El conocimiento se deriva de la información, así como la información se deriva de los datos. Para que la información se convierta en conocimiento es necesario realizar acciones como:
- Comparación con otros elementos.
- Predicción de consecuencias.
- Búsqueda de conexiones.
- Conversación con otros portadores de conocimiento.

[ Fuente: www.sinnexus.com ]
La idea que se planteó es tomar distintas fuentes de datos, directorios, base de datos local, sistema de blogs,…..y procesar para generar información y propiciar un mejor conocimiento de la Facultad y sus partes, servicios, departamentos, estudios, investigación y personas, presentandola en forma de nube de tags.
Un ejemplo práctico es ésta web: http://red.uoc.edu/.
Data mining: torturando a los datos hasta que confiesen. Es otro artículo interesante al respecto. De
Luis Carlos Molina Félix
Coordinador del programa de Data mining (UOC)
lmolinaf@uoc.edu
Un concepto relacionado y más enfocado a la web es Web mining, concretamente una de sus variantes, que trata sobre la extracción de información de los datos disponibles en la web, esto suena a web semántica. Lo anoto para abordarlo, quizás, en otro post.