Resumen del webinar: Folksonomy Text Analytics

El pasado 3 de junio, nuestro Director de Innovación, Ismael Vallvé, ofreció, con la colaboración de la Dra. Laia Sans del Departamento de Nefrología del Hospital del Mar, el webinar Folksonomy Text Analytics. Durante la formación, Ismael introdujo el concepto de la folksonomía y la herramienta Bismart Folksonomy y la Dra. explicó el proyecto llevado a cabo en su hospital con esta tecnología en colaboración con la farmacéutica Ferrer.

Si quieres volver a ver la formación o si te la perdiste, puedes visualizarla aquí:

La folksonomía es un concepto que parte de la taxonomía, que no es más que el arte de clasificar mediante etiquetas. La palabra folksonomía viene, pues, de taxonomía, pero también de folk, que significa 'pueblo'. De esta forma puede decirse que folksonomía significa etiquetado social. Este concepto nació en los años 90 gracias a portales de marcadores  como Delicious.

Una de las principales ventajas de la folksonomía es que permite trabajar con datos no estructurados. Hasta hace poco, la única información que se podía utilizar para llevar a cabo data analysis era la información estructurada en campos, es decir, la información que se había preparado para que los ordenadores pudieran tratarla. En cambio, la información en formato de texto, audio, etc. no se podía tratar de esta forma, sino que había que hacerlo manualmente. El problema es que, según la consultora Gartner, el 95% del valor de la información se encuentra en estos datos no estructurados.

Hasta ahora, para poder analizar esta información no estructurada, debía crearse una entidad maestra que permitiera clasificar la información dentro del texto. El problema es que este tipo de entidades deben crearse manualmente y son tareas de mucha envergadura, por lo que a menudo puede haber errores o puede ser que la entidad con comprenda toda la información valiosa que se encuentra en los datos. Al final, en muchos casos la creación de la entidad maestra resulta más trabajo que analizar los documentos manualmente.

Otra ventaja de Folksonomy es que no requiere esta entidad maestra porque analiza todos los documentos en paralelo en base a unas reglas de pesos según la categoría gramatical de la palabra, lo que hace aflorar automáticamente los términos más relevantes. Así se forma la entidad maestra automáticamente. Esta forma de trabajar se conoce como bottom-up, mientras que la creación manual de la entidad se denomina top-down. Trabajar de forma bottom-up también permite el data-discovery, que significa que permite descubrir términos relevantes en los datos que no sabíamos que se encontraban allí, de forma que no hubieran aparecido en la entidad maestra si se hubiera creado manualmente. Lo mismo aplica a la inversa, en una entidad maestra creada por Folksonomy no aparecerán conceptos que no estén en los documentos. 

En el ámbito sanitario, las capacidades que los médicos han reportado de Folksonomy son que permite entender la práctica clínica y su variabilidad, ofrecer apoyo para la toma de decisiones en tiempo real, determinar la epidemiología de la población, generar hipótesis de investigación clínica, hacer estudios observacionales, predecir casuísticas clínicas antes de que ocurran, entre otras.

Después de la explicación de Ismael, que terminó con algunos ejemplos prácticos, la Dra. Sans expuso la experiencia del Hospital del Mar con la folksonomía mediante su artículo Big Data: Application of Folksonomy for Clinical Nephrology Research. 

Esta formación es parte de un conjunto de webinars semanales. Suscríbete a nuestro blog y canal de Youtube para poder ver los anteriores y no perderte los próximos.

DÉJANOS TU COMENTARIO