Mistral OCR, Markdown Chunking, and Hugging Face Dataset Creator

Upload one or more PDF or image files. The application will:

Upload PDF or Image Files

Chunking Options

Max Chunk Size (Characters)

0 8000

Chunk Overlap (Characters)

0 1000

Strip Headers from Content

HF Dataset Repository

Hugging Face Token

Result Status

Examples

Max Chunk Size (Characters)	Chunk Overlap (Characters)	Strip Headers from Content	Hugging Face Token	HF Dataset Repository

Requires MISTRAL_API_KEY or HF token