Датасет с текстами в старой орфографии
Опубликован датасет с изображениями и текстами, изданными на русском языке в дореформенной орфографии. Данные пригодятся для разработки и оценки систем оптического распознавания символов (OCR). Тексты, представленные в датасете, были вручную проверены экспертами
DOI: https://www.doi.org/10.57967/hf/3280
URL: https://huggingface.co/datasets/nevmenandr/russian-old-orthography-ocr
Для цитирования:
@misc {boris_orekhov_2024, author = { {Boris Orekhov} }, title = { russian-old-orthography-ocr (Revision 6f60636) }, year = 2024, url = { https://huggingface.co/datasets/nevmenandr/russian-old-orthography-ocr }, doi = { 10.57967/hf/3280 }, publisher = { Hugging Face } }