Wsadowe OCR
Prześlij ZIP z plikami PDF lub obrazami (łącznie do 25 MB) i otrzymaj jeden połączony plik markdown — każdy plik źródłowy staje się nagłówkiem. Idealny do digitalizacji papierowych archiwów, skanowania folderu faktur lub przetwarzania partii zeskanowanych stron za jednym razem. Napędzany przez Mistral OCR.
Potrzebujesz nieograniczonego użycia?
Ulepsz do Pro — $19/moTwoje wyniki Wsadowe OCR pojawią się tutaj
Otrzymasz czysty markdown z zachowanymi tabelami, równaniami i nagłówkami — gotowy do wklejenia lub edycji.
Jak używać Wsadowe OCR
- Umieść swoje pliki PDF i obrazy w jednym archiwum ZIP (łącznie do 25 MB).
- Prześlij archiwum ZIP do Batch OCR.
- Uruchom ekstrakcję i poczekaj, aż każdy plik zostanie przetworzony.
- Pobierz połączony plik markdown z jednym nagłówkiem na każdy dokument źródłowy.
Przykłady użycia
Zdigitalizuj folder zeskanowanych dokumentów papierowych za jednym razem
Przekształć partię faktur lub formularzy w tekst, który można przeszukiwać
Wyodrębnij tekst z wielostronicowego pakietu zeskanowanych archiwów
Zamień zestaw plików PDF zawierających wyłącznie obrazy w edytowalny markdown.
Zbuduj przeszukiwalną bazę wiedzy ze stosu starszych plików
Porady dla najlepszych wyników
- Skanuj dokumenty w rozdzielczości 300 DPI lub wyższej, aby uzyskać najczystsze rozpoznawanie tekstu.
- Nadawaj plikom w archiwum ZIP czytelne nazwy, ponieważ to one wyznaczają nagłówki w wyniku.
- Utrzymuj całkowity rozmiar ZIP poniżej 25 MB, kompresując obrazy lub dzieląc je na kilka partii.
- Sprawdź tabele i złożone układy w markdown, ponieważ skomplikowane formatowanie może wymagać drobnych poprawek.
Najczęściej zadawane pytania
Co robi Batch OCR?
Odczytuje tekst z wielu dokumentów naraz i scala wyniki w jeden plik Markdown, z nagłówkiem dla każdego pliku źródłowego, dzięki czemu możesz odróżnić poszczególne treści.
Co przesyłam i jakie są limity?
Prześlij jedno archiwum ZIP zawierające Twoje pliki PDF i obrazy o łącznym rozmiarze do 25 MB. Skompresuj lub podziel większe zestawy, aby zmieścić się w limicie.
W jakim formacie jest wynik?
Otrzymujesz jeden połączony plik markdown (.md). Każdy oryginalny plik pojawia się pod własnym nagłówkiem, z wyekstrahowanym tekstem w kolejności czytania poniżej.
Jak dokładne jest wyodrębnianie tekstu?
Mistral OCR jest dokładny w przypadku czytelnego druku i dobrze zachowuje strukturę, taką jak nagłówki i listy. Skany w niskiej rozdzielczości lub gęste pismo odręczne mogą obniżyć dokładność.
Czy zachowuje tabele i formatowanie?
Zachowuje strukturę, taką jak nagłówki, listy i tabele, w formacie Markdown tam, gdzie to możliwe, choć bardzo złożone układy mogą wymagać drobnych poprawek po wykonaniu.
Czy mogę używać wyodrębnionego tekstu komercyjnie?
Tak, możesz wykorzystywać wynik we własnych archiwach, dokumentach i produktach. Plan darmowy obejmuje 5 uruchomień wsadowych dziennie bez rejestracji; Pro kosztuje $19/miesiąc przy większej liczbie operacji.
Co dzieje się z przesłanymi przeze mnie plikami?
Twój plik ZIP i jego zawartość są przetwarzane wyłącznie w celu wyekstrahowania tekstu, a następnie usuwane. Nie są przechowywane ani wykorzystywane do trenowania modeli.
Nie przechowujemy twojego tekstu. Przetwarzanie odbywa się w czasie rzeczywistym, a twoje dane są natychmiast usuwane po wygenerowaniu wyniku.
Odblokuj Nielimitowany Dostęp
Użytkownicy darmowi: 5 użyć dziennie | Użytkownicy Pro: Nielimitowane