El pasado 3 de junio, nuestro Director de Innovación, Ismael Vallvé, ofreció, con la colaboración de la Dra. Laia Sans del Departamento de Nefrología del Hospital del Mar, el webinar Folksonomy Text Analytics. Durante la formación, Ismael introdujo el concepto de la folksonomía y la herramienta Bismart Folksonomy y la Dra. explicó el proyecto llevado a cabo en su hospital con esta tecnología en colaboración con la farmacéutica Ferrer.
Si quieres volver a ver la formación o si te la perdiste, puedes visualizarla aquí:
La folksonomía es un concepto que parte de la taxonomía, que no es más que el arte de clasificar mediante etiquetas. La palabra folksonomía viene, pues, de taxonomía, pero también de folk, que significa 'pueblo'. De esta forma puede decirse que folksonomía significa etiquetado social. Este concepto nació en los años 90 gracias a portales de marcadores como Delicious.
Uno de los mayores avances en el análisis de datos no estructurados es el modelo grande de lenguaje o Large Language Model (LLM). Este modelo se basa en el uso de inteligencia artificial para analizar grandes cantidades de información en tiempo real. La ventaja de este modelo es que permite la comprensión del lenguaje natural, lo que hace posible la identificación de patrones y tendencias en los datos. La combinación de LLM y la folksonomía puede ser una herramienta poderosa para el análisis de datos no estructurados en el ámbito sanitario y de investigación clínica, ya que permite una comprensión profunda del lenguaje natural utilizado en estos campos. Además, la automatización del proceso de creación de la entidad maestra por la folksonomía permite un análisis más rápido y eficiente de los datos, lo que puede ser especialmente útil en situaciones clínicas que requieren una toma de decisiones en tiempo real. En resumen, la combinación de LLM y la folksonomía puede ser una herramienta valiosa para la investigación y la práctica clínica.
Una de las principales ventajas de la folksonomía es que permite trabajar con datos no estructurados. Hasta hace poco, la única información que se podía utilizar para llevar a cabo data analysis era la información estructurada en campos, es decir, la información que se había preparado para que los ordenadores pudieran tratarla. En cambio, la información en formato de texto, audio, etc. no se podía tratar de esta forma, sino que había que hacerlo manualmente. El problema es que, según la consultora Gartner, el 95% del valor de la información se encuentra en estos datos no estructurados.
Hasta ahora, para poder analizar esta información no estructurada, debía crearse una entidad maestra que permitiera clasificar la información dentro del texto. El problema es que este tipo de entidades deben crearse manualmente y son tareas de mucha envergadura, por lo que a menudo puede haber errores o puede ser que la entidad con comprenda toda la información valiosa que se encuentra en los datos. Al final, en muchos casos la creación de la entidad maestra resulta más trabajo que analizar los documentos manualmente.
Otra ventaja de Folksonomy es que no requiere esta entidad maestra porque analiza todos los documentos en paralelo en base a unas reglas de pesos según la categoría gramatical de la palabra, lo que hace aflorar automáticamente los términos más relevantes. Así se forma la entidad maestra automáticamente. Esta forma de trabajar se conoce como bottom-up, mientras que la creación manual de la entidad se denomina top-down. Trabajar de forma bottom-up también permite el data-discovery, que significa que permite descubrir términos relevantes en los datos que no sabíamos que se encontraban allí, de forma que no hubieran aparecido en la entidad maestra si se hubiera creado manualmente. Lo mismo aplica a la inversa, en una entidad maestra creada por Folksonomy no aparecerán conceptos que no estén en los documentos.
En el ámbito sanitario, las capacidades que los médicos han reportado de Folksonomy son que permite entender la práctica clínica y su variabilidad, ofrecer apoyo para la toma de decisiones en tiempo real, determinar la epidemiología de la población, generar hipótesis de investigación clínica, hacer estudios observacionales, predecir casuísticas clínicas antes de que ocurran, entre otras.
Después de la explicación de Ismael, que terminó con algunos ejemplos prácticos, la Dra. Sans expuso la experiencia del Hospital del Mar con la folksonomía mediante su artículo Big Data: Application of Folksonomy for Clinical Nephrology Research.
Esta formación es parte de un conjunto de webinars semanales. Suscríbete a nuestro blog y canal de Youtube para poder ver los anteriores y no perderte los próximos.