Resultados

Recursos

La herramienta Simple.Text transforma textos en español para hacerlos más legibles y accesibles para personas con discapacidad intelectual. Siguiendo las pautas de Lectura Fácil (Norma UNE 153101:2018 EX sobre Lectura Fácil), esta herramienta procesa el texto de entrada y devuelve una versión simplificada que cumple con estos estándares. Entre las funcionalidades actualmente implementadas, se incluye la simplificación de superlativos, adverbios que terminan en -mente, así como la simplificación de expresiones numéricas, entre otras.

Enlace a la demo: https://simpletext.demos.gplsi.es/

ClearSim es un corpus paralelo en español compuesto por textos de la administración pública, tanto en su versión original como adaptados a Lectura Fácil y Lectura Facilitada. Este recurso incluye 15,000 textos originales, 10,000 textos simplificados con ChatGPT y revisados por humanos, y más de 4,000 textos adaptados por expertos siguiendo las directrices de Easy-to-Read. Los textos han sido seleccionados de los ayuntamientos más importantes de Alicante, específicamente de las secciones de deporte, cultura y ocio. Su adaptación y validación se han realizado en colaboración con APSA, una ONG especializada en accesibilidad textual. El corpus está alineado a nivel de documento y una parte de sus textos ha sido etiquetada y alineada a nivel de oración, lo que facilita su uso en tareas de aprendizaje automático y estudios lingüísticos.

Enlace al corpus: https://rua.ua.es/entities/publication/34d696a3-8322-4d66-87ac-d0852671ecda

Corpus de documentos de la administración pública, en lectura fácil y versión original cuando está disponible. Este corpus sigue en desarrollo y por el momento contiene 140.000 tokens de documentos como el Estatuto de Autonomía de la Comunidad de Madrid o la Guía sobre las instituciones y organismos de la Unión Europea. 

Puede ser utilizado para desarrollar métodos de alineamiento entre las versiones en lectura fácil y original, el entrenamiento de modelos de generativos para simplificación, entre otras tareas de Procesamiento del Lenguaje Natural.

Enlace al corpus: Corpus ClearText

Publicaciones

  1. Espinosa-Zaragoza, I., Moreda, P., & Palomar, M. (2024). Enhancing clarity: An evaluation of the Simple. Text tool for numerical expression simplification. Procesamiento del lenguaje natural, 72, 99-108. DOI 10.26342/2024-72-7 
  2. Martin, T. J., Abreu Salas, J. I., & Moreda Pozo, P. (2023, June). A review of parallel corpora for automatic text simplification. Key challenges moving forward. In International Conference on Applications of Natural Language to Information Systems (pp. 62-78). NLDB2023. Cham: Springer Nature Switzerland. https://doi.org/10.1007/978-3-031-35320-8_5
  3. Aceptado, pendiente publicación: Niklaus, C., Espinosa-Zaragoza, I., Muñoz-García, V. and Moreda Pozo, P. (xxxx). A Comparative Study of Sentence Alignment Methods for Spanish Text Simplification, Language Resources and Evaluation.
  4. Victoria Muñoz-García, Juan Pablo Consuegra-Ayala, Paloma Moreda. Leading and non-leading prompts: Quantifying gender bias in Large Language Models through BiasBloom corpus. Knowl. Based Syst. 325: 113915 (2025). https://doi.org/10.1016/j.knosys.2025.113915
  5. Espinosa-Zaragoza, I., Abreu-Salas, J., Pozo, P. M., & Palomar, M. (2023, September). Automatic text simplification for people with cognitive disabilities: Resource creation within the ClearText project. In Proceedings of the Second Workshop on Text Simplification, Accessibility and Readability (pp. 68-77). https://aclanthology.org/2023.tsar-1.7/
  6. Espinosa-Zaragoza, I., Abreu-Salas, J., Lloret, E., Pozo, P. M., & Palomar, M. (2023, September). A review of research-based automatic text simplification tools. In Proceedings of the 14th International Conference on Recent Advances in Natural Language Processing (pp. 321-330). RANLP2023. https://aclanthology.org/2023.ranlp-1.36/
  7. Botella-Gil, B., Bonet-Jover, A., Sepúlveda-Torres, R., Martínez-Barco, P., & Saquete, E. (2024). Exploring the Relationship between News Reliability and Violent Comments in Digital Media. In Proceedings of the 40th International Conference of the Spanish Society for Natural Language Processing. https://dblp.org/rec/conf/sepln/Botella-GilBSMS24.html
  8. Moreda, P., Botella, B., Espinosa-Zaragoza, I., Lloret, E., Martin, T. J., Martínez-Barco, P., Suárez, A. & Palomar, M. (2023). CLEAR.TEXT Enhancing the Modernization Public Sector Organizations by Deploying Natural Language Processing to Make Their Digital Content CLEARER to Those with Cognitive Disabilities. In Annual Conference of the Spanish Association for Natural Language Processing 2023: Projects and System Demonstrations. https://ceur-ws.org/Vol-3516/paper09.pdf
  9. Botella-Gil, B., Espinosa-Zaragoza, I., Moreda, P., & Palomar, M.(2025) Simple.Text: A Tool for the Automatic Transformation of Spanish Texts into Easy-to-Read. Proceedings of Recent Advances in Natural Language Processing,pages 204–209 Varna, Sep 8–10, 2025.  RANLP2025
  10. Botella-Gil, B., Consuegra-Ayala, J. P., Bonet-Jover, A., & Moreda-Pozo, P. Balancing the Scales: Addressing Gender Bias in Social Media Toxicity Detection. Proceedings of Recent Advances in Natural Language Processing,pages 194–203 Varna, Sep 8–10, 2025. RANLP2025 https://doi.org/10.26615/978-954-452-098-4-023
  11. Beatriz Botella-Gil, Isabel Espinosa-Zaragoza, Alba Bonet-Jover, Margot Madina, Lucas Molino-Piñar, Paloma Moreda, Itziar Gonzalez-Dios, María Teresa Martín Valdivia, Luis Alfonso Ureña López.  Overview of CLEARS at IberLEF 2025: Challenge for Plain Language and Easy-to-Read Adaptation for Spanish texts. Proces. del Leng. Natural 75: 393-400 (2025). DOI 10.26342/2025-75-28 . http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6762
  12. Elena Lloret, Brandon Mendez, Paloma Moreda, Manuel Palomar. ADAPT@: A MULTILINGUAL AND MULTIMODAL ONLINE WEB APPLICATION TO PERSONALIZE TEXTUAL INFORMATION PROCESSING AND VISUALIZATION. 17th International Technology, Education and Development Conference. pp 605 – 614. 6-8 Marzo 2923. Valencia (España). DOI:10.21125/inted.2023.0207
  13. Paloma Moreda. Simple.Text, la herramienta virtual para la inclusión digital creada por el CENID. NOVACIENCIA. (pp. 24-25). Año 20. Número 207. Febrero 2025. (www.novaciencia.es)
  14. Enviado: Espinosa-Zaragoza, I. (xxxx) How Consistent is ChatGPT-4 in Easy-to-Read Text Generation? An Analysis Using Prompting Techniques. Language in the Digital Age / Las lenguas en la era digital. Peter Lang.
  15. Paloma Moreda y Manuel Palomar. (2025) Simple.Text: la IA al servicio del lenguaje claro. Crónica de la lengua española 2025. (pp. 279-286). Real Academia Española (RAE), Asociación de Academias de la Lengua Española. Editorial Planeta S.A. https://proassetspdlcom.cdnstatics2.com/usuaris/libros_contenido/arxius/63/62160_Cronica_de_la_lengua_espanola_2025.pdf