Name: Natural Scene and Document OCR Image Corpus(10 Countries) - DataoceanAI
SKU: King-OCR-007
Availability: InStock

OCR

Natural Scene and Document OCR Image Corpus(10 Countries)

Cultural Research Information Extraction Multilingual Support

This dataset consists of french, german, italian, spanish, portuguese, japanese, korean, russian, chinese, and english datasets, total of 10 languages of natural scenes and document categories, total of 44,821 images.

Specifications:

ID:

King-OCR-007

Language:

English, Chinese, French, Portuguese, Korean, Japanese, Italian, Russian, Spanish, German

Data size

44821 pics

Data format

.jpg/.jpeg/.png

Data content

ProductLabel, Menu, Ticket, Map, StoreName, AdvertisementSign, Flyer, Poster, Banner, BusinessCard, Receipt, BulletinBoard, StreetSign, Book, Magazine, Newspaper and Form

Labeling Content

Line-level bounding box labeling and transcription for the texts

Devices:

Mobile

Accuracy Rate

The accuracy of the labeling results is 97%

People also searched for

Ukrainian Handwritten Checklist Corpus

Data type: Handwritten content (including notes, tables, etc.) and blackboard writing

Ukrainian OCR Handwritten

Russian Handwritten Checklist Corpus

Data type: Handwritten content (including notes, tables, etc.) and blackboard writing

Russian OCR Handwritten

Traditional Chinese Handwritten Checklist Corpus

Data type: Handwritten content (including notes, tables, etc.) and blackboard writing

OCR Handwritten Traditional Chinese

Simplified Chinese Handwritten Checklist Corpus

Data Type: Handwritten content (including notes, tables, etc.) and blackboard writing

OCR Handwritten Simplified Chinese

Natural Scene and Document OCR Image Corpus(10 Countries)

Specifications:

People also searched for

Ukrainian Handwritten Checklist Corpus

Russian Handwritten Checklist Corpus

Traditional Chinese Handwritten Checklist Corpus

Simplified Chinese Handwritten Checklist Corpus

Get started

Join our newsletter to stay updated