Датасет с текстами в старой орфографии

21.10.202421.10.2024 Борис Орехов Борис Орехов, Датасет 0 min read

Опубликован датасет с изображениями и текстами, изданными на русском языке в дореформенной орфографии. Данные пригодятся для разработки и оценки систем оптического распознавания символов (OCR). Тексты, представленные в датасете, были вручную проверены экспертами

DOI: https://www.doi.org/10.57967/hf/3280
URL: https://huggingface.co/datasets/nevmenandr/russian-old-orthography-ocr

Для цитирования:

@misc {boris_orekhov_2024,
  author = { {Boris Orekhov} },
  title = { russian-old-orthography-ocr (Revision 6f60636) },
  year = 2024,
  url = { https://huggingface.co/datasets/nevmenandr/russian-old-orthography-ocr },
  doi = { 10.57967/hf/3280 },
  publisher = { Hugging Face }
}

Борис Орехов

Читайте также

Читайте также