Frage · 18. Mai 2026

Reicht der Maschine ein Bild, oder braucht sie auch den Text?

Ein Bild allein reicht der Maschine nicht, sie braucht den Text daneben. Unsere Pipeline schickt Gemma über Ollama jetzt beides: das gescannte Dokument als Bild mit dreihundert DPI für Layout und Position, dazu den ausgelesenen Text für die exakten Werte. So liest sie ein Dokument in fünf bis fünfundzwanzig Sekunden, ohne Zahlen zu erraten. Das Auge zeigt, wo etwas steht, der Text sagt, was dort wirklich geschrieben ist.

Wir verwenden Cookies

Wir nutzen Cookies, um Ihnen die bestmögliche Erfahrung auf unserer Website zu bieten. Einige sind technisch notwendig, andere helfen uns, unser Angebot zu verbessern. Sie können Ihre Einwilligung jederzeit über „Cookie-Einstellungen“ im Footer widerrufen. Mehr erfahren

Cookie-Einstellungen

Notwendig

Immer aktiv

Diese Cookies sind für die Grundfunktionen der Website erforderlich. Dazu gehören Session-Verwaltung, Sicherheitsfunktionen und Ihre Cookie-Einstellungen. Sie können nicht deaktiviert werden.

Name	Zweck	Laufzeit	Anbieter
pn-consent	Speichert Cookie-Einstellungen	365 Tage	benjaminweinlich.com
theme	Speichert Theme-Präferenz (hell/dunkel)	365 Tage	benjaminweinlich.com

Statistik

Wir verwenden Umami, eine cookielose, selbst gehostete Analyse-Software. Es werden keine Cookies gesetzt und keine personenbezogenen Daten gespeichert. Alle Daten bleiben auf unseren Servern in Deutschland.

Marketing

Marketing-Cookies werden derzeit nicht eingesetzt. Diese Kategorie ist für zukünftige Zwecke vorbereitet.

Name	Zweck	Laufzeit	Anbieter
Keine eingesetzt. Kategorie ist für zukünftige Nutzung vorbereitet.