Acceda a las entrevistas anonimizadas en formatos pdf y .JSON, los lexicones utilizados para el análisis y la ontología de acuerdo con la metodología aplicada por la Comisión para el Procesamiento de Lenguaje Natural.
La recolección de testimonios, su análisis y sistematización se hizo a través de entrevistas que nutrieron la investigación. Para ello se construyeron instrumentos y sus respectivas guías metodológicas; entrevistas que fueron utilizadas para el Procesamiento de Lenguaje Natural. Si bien la Comisión de la Verdad recopiló más de 14 mil entrevistas, con el fin de dar cumplimiento a los principios y normas de protección de datos y seguridad de quienes aportaron al proceso de esclarecimiento con su testimonio, se llevó a cabo la priorización
Consulte y descargue las transcripciones anonimizadas de las entrevistas públicas en formato word aquí. También puede descargarlas haciendo clic en el botón de descargas en la parte superior derecha de este contenido.
Consulte y descargue a las entrevistas anonimizadas en formato .JSON aquí. También puede descargarlas haciendo clic en el botón de descargas en la parte superior derecha de este contenido.
Como parte de la metodología de Procesamiento de Lenguaje Natural, La Comisión llevó a cabo la construcción de lexicones (doce - 12) relacionados con los temas objeto de análisis, los cuales ponemos a su disposición para consulta y/o uso.
Para acceder a los lexicones de la Comisión de la Verdad haga clic aquí (o haga clic en el botón de descargas en la parte superior derecha de este contenido).
El Tesauro de la Comisión para el Esclarecimiento de la Verdad, la Convivencia y la No Repetición - CEV nació de la necesidad de normalizar, actualizar y dar una estructura a los términos técnicos y populares, o de mayor frecuencia de uso, en el análisis documental de la entidad y para contar con un lenguaje común sobre el conflicto armado en Colombia, y los procesos de verdad, justicia, reparación y restitución, producto de la firma del Acuerdo de Paz. En ese sentido, las funciones principales de esta herramienta son: primero, registrar y estandarizar en forma ordenada los términos utilizados por las diferentes áreas de la Comisión; y, segundo, ser el marco de referencia de los procesos de documentación, catalogación y curaduría de la entidad.
Acceda a los recursos del Tesauro haciendo clic aquí (o haga clic en el botón de descargas en la parte superior derecha de este contenido).
Para la Comisión de la Verdad, las soluciones informáticas desarrolladas representan un alto valor en conocimiento, aprendizajes e innovación que pueden ser dispuestas al público para su uso en otros procesos de investigación o memoria en el país (o similares).
Este material hace parte de la apuesta institucional por dar la más amplia difusión y apropiación del legado, en cumplimiento de su mandato de hacer público y libre el código y/o los procesos informáticos producidos para el funcionamiento de estas herramientas, acompañados de documentación suficiente para ofrecer transparencia, replicabilidad o guianza a terceros interesados en estudiar, revisar o usar el código producido por La Comisión.
Entre esas herramientas se encuentran las relacionadas con los procesos de analítica destinados al análisis del lenguaje de las entrevistas. El código y recursos se encuentran en un repositorio Github público y de uso libre bajo licencia licencia GNU GPL v.3.
Para acceder al repositorio en Github haga clic aquí
Nota importante: el código no permite replicar lo que se hizo para el informe pues no se entregan los datos originales, solo el código de ejecución.