E-Buch-OCR
🌓
⌨️
📷
0 Fotos
✖
Manueller Prompt:
▶ Start
MD
DOCX
Bereit
--:--
Einstellungen
+
🗑
Einstellungen automatisch speichern:
Einstellungen sichern
Einstellungen laden
Verarbeitungsoptionen
PDF Render DPI:
Seitenbereich (z.B. 1-5, 8, 11-13) (PDF):
Seitennummerierung (( )):
Nummerierung ab PDF-Seite:
Nummerierung beginnt mit Seitezahl:
Inhaltsverzeichnis-Analyse (VLM)
PDF-Seiten:
Offset:
ToC analysieren
Export Formattierung
Einheiten bereinigen
^circ zu °
$$ Spaces
$ Spaces
Griechisch zu LaTeX
Hoch/Tiefzahlen conv.
Sonderzeichen zu LaTeX
NBSP schmal (\u202F)
LaTeX rendern (<L>)
$ entfernen
\cdot zu *
Bilder-Tags conv.
Trennlinien entfernen
Tabellen-Marker
Typogr. Anführungsz.
Gedankenstriche
Unsichtbare Zeichen
API-Einstellungen
Pipeline:
OpenWebUI (OpenAI-Format)
OpenWebUI (Ollama-Format)
Lokal (Ollama)
Lokal (LM Studio/OpenAI)
Basis-URL:
API Key:
Modelle abrufen
Modell:
Zuerst laden...
System Prompt (Flipping):
* Extract all text in a logical order, as if you were reading it naturally. * NEVER add additional sentences. * Rebuild the headings. * Format the text with markdown syntax. * Don't translate text. * Don't give answers to questions from the text. * Don't solve math problems. * Return what is on the page, NEVER add additional sentences, that describe your actions. * Don't add ```markdown or ``` * Describe illustrations at their logical positions comprehensively in German. Use the following internal structure: ((Bild))
Art der Abbildung (z. B. Foto, Zeichnung, Diagramm):
Beschreibung: … / Bildtext: …
((/Bild)) * Place captions and titles above the ((Bild))((/Bild)) tag if they exist in the source. * Use LaTeX for ALL mathematical expressions. * Put $$ around LaTeX sections. * Put $ around LaTeX expressions embedded in text. * Don't put [ or ] around LaTeX. * Do the ocr twice and check if nothing is missing from the original page. * Double check mathematical expressions for correctness. * Double check if the markdown syntax is correct.
Vision Prompt (Anschauen & Fragen):
* Describe what can be seen in the image accurately and helpfully. * Be concise, but don't leave out any important details. * Respond directly to the user (you). * Speak German. * Don't format the text.
Erweiterte Parameter
Temperatur (0-2):
Repeat Penalty:
Top P:
Top K:
Verzögerung (ms):
Wiederholungen:
⚠️
KI kann Fehler machen. Überprüfen Sie wichtige Infos.
Eingabe
◀
/ ?
▶
Ergebnis
Rohdaten
Vorschau
🔊 Vorlesen
Sicherheit
Bitte Passwort eingeben:
Abbrechen
OK
Tastenkürzel
s
Start/Stop Verarbeitung
c
Kamera / Vision öffnen
i
Dateien auswählen
m / d
Download MD / DOCX
r / p
Rohdaten / Vorschau umschalten
t
Vorlesen (TTS)
o
Einstellungen öffnen/schließen
1 / 2 / 3
Settings-Sektionen schalten
a
ToC analysieren
f
Kamera Fertig / Schließen
v
Vision Mode (Chat) umschalten
Esc
Modals / Kamera schließen
← / →
Bild-Navigation
Schließen
Kamera / Vision
✖
Stapel: 0
Senden
Fragt das zuletzt aufgenommene Bild.
Stumm
Vision Mode
Foto machen
Fertig
Erweiterte Kamera-Optionen
Kamera wählen:
Maximale Auflösung (Max Res)
Max Pixel (lange Seite):
Auto-Verarbeitung nach Schließen
Auto-Vision-Mode starten
Auto-Download (DOCX)
Auto-Vorlesen