Texte aus Bilddateien auf Webseiten lassen sich jetzt im Browser erkennen und extrahieren. Mit dem Google-Chrome-Plugin Naphta wird dies ganz einfach. Den Text im Bild mit der Maus markieren und dann kopieren. Anschließend kann der Text in einem beliebigen Programm weiterbearbeitet werden, sei es ein Übersetzungs- oder Schreibprogramm.
Doch zuvor gilt es, den Text in dem Bild zunächst vom Hintergrund zu isoliert, was bei Naphta durch einen Algorithmus von Microsoft geschieht. Dieser identifiziert den Text anhand der Eigenschaft der meisten Schriftarten, gleiche Strichbreiten zu verwenden. Der extrahierte Text wird dann zu einem Webdienst für die optische Zeichenerkennung geschickt, der mit der Engine Ocrad läuft. Es soll sogar möglich sein, eine Textübersetzung direkt in ein Bild anstelle des Originaltextes einzusetzen, wobei der Algorithmus die Originalschrift nachahmt.
Entwickelt wurde Naphta, das keine reine OCR-Funktion ist, vom MIT-Studenten Kevin Kwok. Naphta lässt sich kostenlos über Googles Webstore beziehen.
Diskutiere mit!
Hier kannst du den Artikel "Nie mehr abtippen: Chrome-Erweiterung ermöglicht Texterkennung im Browser" kommentieren. Melde dich einfach mit deinem maclife.de-Account an oder fülle die unten stehenden Felder aus.
Also irgendwie klappt das hier mit Chrome nicht. Naphtha wird nicht gefunden. Gibt es noch einen anderen Weg?
Und was genau ist der Vorteil, dass diese OCR-Software als Erweiterung für den Google-Spionagebrowser realisiert wurde???
Sowas macht als eigenständige App ja wohl mehr Sinn.
Aber klar, unkritische Geister sind ja völlig Chromisiert und verliebt in den angeblich so guten Browser, der dabei ein Google-typisch miserables User Interface Design hat...