Según el Diccionario de la Real Academia Española, la semántica es la disciplina que estudia el significado de las unidades lingüísticas y de sus combinaciones. De acuerdo con esto, puede decirse que la semántica es responsable del sentido del lenguaje. La semántica además nos proporciona un marco universal para describir y vincular conceptos.
Os preguntaréis ¿a qué viene esta clase de lengua si estáis leyendo un blog de gestión documental? No os preocupeis, no os habéis equivocado de blog. Resulta que esta disciplina que estudiamos en secundaria, tiene aplicación en la gestión documental.
La combinación de semántica y gestión documental abre las puertas de un universo de aplicaciones en el contexto de los metadatos y las relaciones entre documentos. La tecnología semántica permite reducir cualquier tipo de información a piezas simples, que pueden vincularse con facilidad entre ellas y que pueden explotarse mediante computación.
¿Cómo cambia la semántica la manera en que se usan los datos?
Es muy frecuente que las empresas y organizaciones cuenten con datos o documentos que están aislados. Sí es verdad que en ciertos diseños de sistemas de gestión documental, se intenta tener un repositorio en el que se definen entidades. Este diseño se prioriza en esos casos sobre convertir el gestor documental en un gran cajón de sastre en el que vamos metiendo documentos de forma aislada.
Por poneros un ejemplo para que lo veais más claro. En el caso de las aseguradoras, se podría guardar todo en el gestor documental bajo un único tipo documental en el que tenemos un formulario inmenso de campos o metadatos que, dependiendo de la información que nos llegue, podrían usarse o no. Para algunos documentos aplicarían algunos metadatos, para otros, otros. Pero normalmente, porque esto tiene mucho más sentido para los usuarios, se agrupan los documentos por entidades.
Así, de alguna forma muy básica, comenzamos a hacer semántica. Definimos una entidad agregadora llamada Siniestro, hecha para almacenar los documentos relacionados con un trámite específico que se da ante una reclamación de un cliente. Podemos vincular los documentos de soporte que contiene el siniestro mediante un metadato identificador único que nos permita vincular los documentos de ese expediente.
Pero vamos más allá y sigamos haciendo semántica. Un siniestro existe porque existe un cliente que nos ha contratado una Póliza. Sin esa póliza, no hay cobertura para el siniestro. Entonces, aparece otra entidad que es una póliza y que está relacionada con un Asegurado que, a su vez, es otra entidad. Todas estas relaciones entre entidades las podemos manejar como metadatos, definiendo claves que vinculen entidades.
Esto tiene sentido para los usuarios. Así como tiene sentido que desde el Siniestro quieran consultar la Póliza y el Asegurado.
Como decía, podemos hacer esas vinculaciones sobre metadatos y continuar vinculando de forma casi indefinida estas entidades, buscando una visión 360º de nuestro negocio. ¿Qué pólizas tiene un asegurado, cuantos siniestros, qué productos le aplican?
Pero ¿Y si no tuviéramos nosotros que definir esas claves y valores que vinculan entidades, sino que se pudieran encontrar de forma automática?
Las tecnologías semánticas pueden a través del análisis computacional del lenguaje, encontrar las entidades que nos interesan, así como las relaciones de las mismas.
La semántica puede ayudarnos a construir una vista 360º mucho más eficiente
La semántica proporciona un medio para comprender el contexto de los documentos y de los datos. Pero además de catalogación automática y construcción de relaciones entre documentos que nos permitan contextualizar los mismos, ¿cuáles son las posibilidades?
Sigamos con el ejemplo de las aseguradoras. Supongamos que las aseguradoras tienen una lista negra de personas. Estas personas son sospechosas de fraude, por eso están en la lista negra.
Haciendo un análisis semántico computacional del texto de nuestros documentos, podemos encontrar entidades como por ejemplo personas (asegurados, reclamantes, intermediarios, etc.). Supongamos que analizando millones de pólizas y teniendo esa lista negra de personas, podemos detectar de forma automática algún tipo de relación entre un asegurado y una persona de la lista negra. ¿no podríamos levantar una alerta de fraude de forma automática en nuestro sistema?
Estamos hablando de construir mediante la aplicación de semántica una visión muy compleja de lograr por personas, porque la cantidad de datos lo hace humanamente inviable. La semántica sin embargo nos brinda esta posibilidad.
En conclusión, este contexto que nos proporciona la semántica supone un medio de enriquecimiento y mejora en la gestión de documentos cuyas aplicaciones estamos aún por presenciar, pero que resultan prometedoras.