Модули Python для решения задач Digital Humanities
В этом разделе будем собирать полезные инструменты, разработанные сообществом DH CLOUD и студентами магистратур по Digital Humanities.
- Модуль для транслитерации старой орфографии в новую https://pypi.org/project/prereform2modern/
- Модуль для акцентуации русского поэтического текста https://pypi.org/project/ru-accent-poet/
- Модуль для вычленения прямой речи персонажей в художественном тексте https://pypi.org/project/direct-speech-extractor-ru/
- Модуль для оценки формульности фольклорного текста https://pypi.org/project/formularity-rfs/
- Модуль для преобразования текстов в формате TEI https://pypi.org/project/TEItransformer/
Модель для задач OCR при работе с текстами в старой орфографии
- OCR-модель для распознавания текстов в старой орфографии: https://huggingface.co/Serovvans/trocr-prereform-orthography
