Un estudio colaborativo publicado en Naturaleza esta semana (acceso abierto) desarrollado Ítaca, una arquitectura de red neuronal profunda que puede ayudar a los historiadores a interpretar las antiguas inscripciones griegas. Estas inscripciones se escribieron en materiales duraderos como piedras, cerámica y metal que se encontraron en todo el mundo mediterráneo antiguo entre el siglo VII a. C. y el siglo V d. C.
Aunque miles de tales artefactos han sobrevivido hasta nuestros días, muchos están dañados y sus textos son fragmentarios. Además, muchos de esos textos han sido trasladados o traficados lejos de su ubicación original.
Los epigrafistas son especialistas en el estudio de estos materiales. Reconstruyen el texto faltante, proceso conocido como restauración de texto, y establecen la atribución geográfica y cronológica (el lugar y la fecha originales de la escritura, respectivamente).
Hasta ahora, no han podido confiar en ninguna tecnología conocida, ya que la datación por radiocarbono, el método para determinar la edad de los objetos, no es útil para los materiales inorgánicos.
En este contexto, Ithaca pretende maximizar la colaboración entre epigrafistas y expertos en inteligencia artificial para comprender mejor las inscripciones y facilitar mucho el trabajo de los primeros. Además, Ítaca tiene una interfaz de código abiertopara facilitar su uso por parte de los historiadores y el desarrollo de nuevas aplicaciones.
“Los historiadores expertos con los que trabajamos lograron un 25 % de precisión cuando trabajaron solos para restaurar textos antiguos. Pero, al usar Ithaca, su desempeño aumenta al 72%, superando el desempeño individual del modelo y mostrando el potencial para la cooperación hombre-máquina”, señaló DeepMind, la institución líder que realizó la investigación.
Como funciona
Los investigadores entrenaron a Ithaca con el no procesado Instituto de Humanidades Packard (PHI), el mayor conjunto de datos digitales de inscripciones griegas. Consta de los textos transcritos de 178.551 inscripciones. Después de filtrar los datos, el conjunto de datos resultante I.PHI contenía 78 608 inscripciones. Según el equipo, este es el conjunto de datos multitarea más grande de texto epigráfico procesable por máquina.
Ítaca se entrenó en inscripciones escritas en griego antiguo por dos razones principales: la variabilidad de contenidos y contexto del registro epigráfico griego, que lo convierte en un excelente desafío para el procesamiento del lenguaje, y la disponibilidad de corpus digitalizados para griego antiguo, un recurso esencial para entrenar el modelo de aprendizaje automático.
Esta máquina de aprendizaje profundo brinda información a los historiadores para desarrollar las tres tareas que realizan cuando estudian textos antiguos: encontrar caracteres que faltan y asignarles una atribución geográfica y cronológica.
Para la restauración, Ithaca ofrece un conjunto de las 20 mejores predicciones decodificadas clasificadas por probabilidad. Esta primera visualización facilita el emparejamiento de las sugerencias de Ítaca con el conocimiento contextual de los historiadores, ayudando a la toma de decisiones humanas.
Para la tarea de atribución geográfica, Ithaca clasifica el texto de entrada entre 84 regiones, lo que representa su nivel de certeza. Los resultados se muestran en un mapa para facilitar las conexiones geográficas subyacentes en todo el mundo antiguo.
Finalmente, para determinar la fecha de la escritura, Ithaca produce una distribución de fechas previstas en todas las décadas desde el 800 a. C. hasta el 800 d.
“Si bien Ithaca solo logra un 62 % de precisión al restaurar textos dañados, el uso de Ithaca por parte de los historiadores mejoró su precisión del 25 % al 72 %, lo que confirma el efecto sinérgico de esta herramienta de investigación. Ítaca puede atribuir inscripciones a su ubicación original con una precisión del 71 % y puede fecharlas en menos de 30 años de sus rangos reales reales, relacionando textos clave de la Atenas clásica y contribuyendo a debates de actualidad en la antigüedad”, afirma la investigación que incluyeron DeepMind de Londres, el Departamento de Humanidades de la Universidad Ca’ Foscari de Venecia, la Facultad de Clásicos de la Universidad de Oxford y el Departamento de Informática de la Universidad de Economía y Negocios de Atenas.
Los investigadores creen que esta herramienta ayudará a lograr una comprensión más holística de la distribución y la naturaleza de los hábitos epigráficos en el mundo antiguo e incluso contribuirá a resolver los debates metodológicos actuales en la historia antigua.
Referencia
Assael, Y., Sommerschield, T., Shillingford, B., Bordbar, M., Pavlopoulos, J., Chatzipanagiotou, M., Androutsopoulos, I., Prag, J. y de Freitas, N. (2022). Restauración y atribución de textos antiguos utilizando redes neuronales profundas. Naturaleza, 603(7900), 280–283. https://doi.org/10.1038/s41586-022-04448-z