Name: English OCR Corpus - DataoceanAI
SKU: King-OCR-040
Availability: InStock

English OCR Corpus

Data Entry Automation Document Digitization and Archiving

The english dataset consists of 21 categories, total of 2,637 printed images and 406 handwritten images, covering most commonly used scenarios in daily life, with all data labeled.

Specifications:

ID:

King-OCR-040

Language:

English

Data size

3043 pics

Data format

.jpg/.jpeg/.png

Data content

Including PPT type, document type, natural light photography, screenshots, and handwriting type.

Labeling Content

Line-level bounding box labeling and transcription for the texts

Devices:

Mobile

Accuracy Rate

The accuracy of the labeling results is 97%

People also searched for

Ukrainian Handwritten Checklist Corpus

Data type: Handwritten content (including notes, tables, etc.) and blackboard writing

Ukrainian OCR Handwritten

Russian Handwritten Checklist Corpus

Data type: Handwritten content (including notes, tables, etc.) and blackboard writing

Russian OCR Handwritten

Traditional Chinese Handwritten Checklist Corpus

Data type: Handwritten content (including notes, tables, etc.) and blackboard writing

OCR Handwritten Traditional Chinese

Simplified Chinese Handwritten Checklist Corpus

Data Type: Handwritten content (including notes, tables, etc.) and blackboard writing

OCR Handwritten Simplified Chinese

English OCR Corpus

Specifications:

People also searched for

Ukrainian Handwritten Checklist Corpus

Russian Handwritten Checklist Corpus

Traditional Chinese Handwritten Checklist Corpus

Simplified Chinese Handwritten Checklist Corpus

Get started

Join our newsletter to stay updated