Тёмный

BILD in TEXT mit PYTESSERACT umwandeln 

Florian Dalwigk
Подписаться 108 тыс.
Просмотров 10 тыс.
50% 1

Наука

Опубликовано:

 

24 авг 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 54   
@marcoarnold8022
@marcoarnold8022 2 года назад
Obwohl ich schon seit über einem Jahr Abonnent deines Kanals bin, ist das tatsächlich mein erster Kommentar. Deshalb möchte ich mich zunächst einmal möchte ich mich für deine sehr informativen und unterhaltsamen Videos bedanken. Dein Kanal ist ,was die Qualität der Videos angeht, ganz weit vorne mit dabei. Da ich mich gerade auch mit Tesseract beschäftige, allerdings in Java und mit dem Ziel, die Zahlen eines Sudokus richtig zu erkennen und dieses dann zu lösen, wollte ich hier mal auch meinen Senf zu der Sache geben. Da bei einem Sudoku natürlich nur die Zahlen von 1 bis 9 relevant sind, habe ich ebenfalls die Einstellung getroffen nur nach Zahlen zu suchen. Mit Java ging das allerdings mit einer sog. "Whitelist" bzw. " Blacklist", in die man einzelne Zeichen eintragen kann nach denen gesucht bzw. nicht gesucht werden soll. Die Beschränkung auf einzelne Kategorien (z.B. Ziffern, Buchstaben) entfällt somit. Je nach Qualität des Bildes kann es sinvoll sein, dieses vor der Übergabe an Tesseract dieses zu bearbeiten / Vereinfache. In meinem Fall mit dem Sudoku habe ich gute Erfahrungen mit Biarisierung gemacht . D. h. man legt fest, ab welcher "Helligkeit" ein Pixel als weiß bzw. als Schwarz gewertet werden soll. Dadurch verschwinden Grautöne, sodass es dem Algorithmus deutlich leichter fällt, die Zeichen richtig zu erkennen.
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Danke für deinen Input :)
@felori233
@felori233 2 года назад
Verdammt gutes Video, immer sachlich, konkret und verständlich erklärt. Ich freue mich sehr, dass momentan fast jeden Tag ein Video von dir kommt, auch wenn mir klar ist, dass das wohl nicht immer so bleibt, du hast ja auch Uni etc. Mach weiter so!
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Vielen, vielen Dank 😊
@tobiaskaruth
@tobiaskaruth 2 года назад
13:00 jaaaa endlich
@andrej_sound
@andrej_sound 2 года назад
Oui das ist perfekt für ein Projekt was ich gerade starte.
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Super :) Was hast du vor?
@andrej_sound
@andrej_sound 2 года назад
@@Florian.Dalwigk Office Tools .Also Kalender Todoliste..... Da weiß ich dann auch das die Daten bei mir sind.
@MiauRizius
@MiauRizius 2 года назад
Das ist geil, vielen Dank xD Ich habe so oft, dass wer ein Tutorial hochläd, aber man den Code nirgendwo findet.
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Gerne!
@annaj.4740
@annaj.4740 2 года назад
Du bist der Beste😄 btw. sich Deinen Quellcode abschreiben zu müssen, ist auch Meckern auf hohem Niveau😉 immerhin ist es nie langer Code und selber Schreiben macht einem viel bewusst🤘 Aber okeeeeeee, ich würde dann wahrscheinlich auch Dein Github Repository benutzen. Hast es ja extra zur Verfügung gestellt und Menschen sind eher faul😂🤣😂
@fhcsghgggfghghhggg4566
@fhcsghgggfghghhggg4566 2 года назад
12:53. das ist der Satz, auf den ich das ganze video lang gewartet hab. und ich warte natürlich auf den dark-souls-mit-Gedanken-zocken walkthrough.
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Danke für deine Geduld ;)
@rayvvenn
@rayvvenn 2 года назад
oh ja sehr gutes modul. genau wegen dem von dir am Anfang beschriebenen Problem hab ich mir so ein kleines Skript geschrieben
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Cool, was macht das?
@annaj.4740
@annaj.4740 2 года назад
spannend😃 wüsste ich auch gern.
@rayvvenn
@rayvvenn 2 года назад
@@Florian.Dalwigk Der nimmt das bild aus der zwischenablage und kopiert dann direkt den text den er findet. also ich schneide mir einen ausschnitt mit snipping tool aus, dann lasse ich das skript laufen. sehr hilfreich!
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Richtig cool 😎
@forestcat512
@forestcat512 2 года назад
Bin gespannt, Morpheus hat ja auch schon ein Video dazu gemacht. Ich fände mal eine Sache die ihr gemeinsam macht cool. Tolles Thema
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Wir haben schon ein Video gemeinsam gemacht.
@picklerick5843
@picklerick5843 2 года назад
Warum nicht 2 Monate früher D: da hab ich tesseract zum durchsuchen von bild formaten auf einem server verwendet. Man kann einfach nach einem schlagwort suchen und bekommt alle dateien die das enthalten angezeigt. (Ist allerdings sinnvoll die Datein vorher zu komprimieren da der Vorgang sonst ewig dauern kann - je nach umfang der zu durchsuchenden datein) Gutes Video wie immer ❤️
@olivdi4137
@olivdi4137 2 года назад
Kann man damit auch irgendwie ein Programmschreiben, welches PDF dDateien in txt oder ähnliche Dateiformate umwandeln kann?
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Kann man.
@rabin371
@rabin371 2 года назад
Super Video! Danke!
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Gerne :)
@cead2723
@cead2723 10 месяцев назад
Wenn ich pytesseract start mit diesen befehlen bekomme ich den Fehler "Unsupported image object" obwohl ich png verwende undauch mit bildern getestet habe die du verwendet hast. Könnte mir da vielleicht jemand helfen? PS: Ich verwende Jupyter Notebook
@kicobabic1551
@kicobabic1551 Год назад
Ich habe zwei Fragen: 1. Kann man über pytesseract und python auch nur einen bestimmten Bereich aus dem Bild auslesen? (z.b. über RECT) 2. Kann man neben den Bildern wie png/jpg/gif auch den Text aus einem PDF auslesen? Wenn ja, mit welchen befehlen oder parametern?
@Florian.Dalwigk
@Florian.Dalwigk Год назад
Ja, mit pytesseract und Python kannst du einen bestimmten Bereich aus einem Bild auslesen. Du kannst die Parameter config und boxes von pytesseract verwenden. Der config-Parameter ermöglicht es dir, bestimmte Konfigurationen und Einstellungen für Tesseract OCR festzulegen, während der boxes-Parameter es dir ermöglicht, Tesseract anzuweisen, nur den Text innerhalb bestimmter Begrenzungsrahmen (Rectangles) zu erkennen. Hier ist ein Beispiel, wie du einen bestimmten Bereich aus einem Bild auslesen kannst: import pytesseract from PIL import Image def extract_text_from_image(image_path, rectangle): image = Image.open(image_path) cropped_image = image.crop(rectangle) # Ausschnitt des Bildes basierend auf dem Rechteck text = pytesseract.image_to_string(cropped_image) return text # Beispielaufruf image_path = 'pfad/zum/bild.png' rectangle = (x, y, width, height) # Rechteckkoordinaten des auszulesenden Bereichs text = extract_text_from_image(image_path, rectangle) print("Erkannter Text:") print(text) Stelle sicher, dass du die erforderlichen Bibliotheken pytesseract und PIL installiert hast (pip install pytesseract pillow). Ja, es ist möglich, Text aus PDF-Dateien mit Python zu extrahieren. Du kannst das PyPDF2- oder pdftotext-Modul verwenden, um den Text aus einem PDF-Dokument zu extrahieren. Mit dem PyPDF2-Modul kannst du den Text aus PDF-Dateien extrahieren. Hier ist ein Beispiel: import PyPDF2 def extract_text_from_pdf(pdf_path): with open(pdf_path, 'rb') as file: pdf_reader = PyPDF2.PdfFileReader(file) text = "" for page_num in range(pdf_reader.numPages): page = pdf_reader.getPage(page_num) text += page.extract_text() return text # Beispielaufruf pdf_path = 'pfad/zum/dokument.pdf' text = extract_text_from_pdf(pdf_path) print("Extrahierter Text:") print(text) Alternativ kannst du das pdftotext-Modul verwenden, das auf dem Befehlszeilentool "pdftotext" basiert, um Text aus PDF-Dateien zu extrahieren. Hier ist ein Beispiel: def extract_text_from_pdf(pdf_path): with open(pdf_path, 'rb') as file: pdf = pdftotext.PDF(file) text = "" for page in pdf: text += page return text # Beispielaufruf pdf_path = 'pfad/zum/dokument.pdf' text = extract_text_from_pdf(pdf_path) print("Extrahierter Text:") print(text) Stelle sicher, dass du das entsprechende Modul installiert hast. Du kannst es mit pip install PyPDF2 oder pip install pdftotext installieren. Antwort generiert von ChatGPT
@cheepcheep2204
@cheepcheep2204 2 года назад
warst du an der hochschule coburg?
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Nein
@cheepcheep2204
@cheepcheep2204 2 года назад
@@Florian.Dalwigk Achsoo, weil unser C++ Lehrer hat dich empfohlen :D
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Achso 😅 Richtig cool 😎 Grüß ihn gerne mal von mir und vielen Dank für die Empfehlung 🙏
@lofya_
@lofya_ 2 года назад
yes sir
@Julian-yf2ey
@Julian-yf2ey 2 года назад
Ich habe mit ocr nem pi und einem netzwekkable die Industrie um 1900 Euro unterboten .....
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
😅
@patrickFREE.
@patrickFREE. 2 года назад
Einfach göttlich
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
😊
@user-hr1vo2sr4t
@user-hr1vo2sr4t 2 года назад
Gutes Video 👍
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Dankeschön 😁
@user-hr1vo2sr4t
@user-hr1vo2sr4t 2 года назад
:)
@clemens3123
@clemens3123 2 года назад
Hey, gutes Video :) Ist es möglich mit dieser Methode aus einem Bild eines Sudoku-Grids die Zahlen auszulesen? Bei mir ging dies leider nicht
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Ja, das geht. Aber nicht zuverlässig als Matrix.
@oida10000
@oida10000 2 года назад
Gut zu wissen. Mich wundert nur, dass die entsprechenden Trainigsdaten nicht ein Opt-In beim Installieren sind.
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Du kannst eben die Language Pakete bei der Installation schon herunterladen (wie im Video erwähnt).
@redjul9065
@redjul9065 2 года назад
Kann man Code aus exe Files extrahieren?
@JakobDev
@JakobDev 2 года назад
Exe Files haben keinen Code den man extrahieren könnte. Du kannst es höchstens mit einem Decompiler versuchen.
@MihuKat
@MihuKat 2 года назад
me so bild in text my mind: STEGO? Stego? STEGO ??? STEGO??:D
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
😂
@bauzerbuddy9741
@bauzerbuddy9741 2 года назад
epic
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
🔥🔥🔥
@sorenholzenkamp8877
@sorenholzenkamp8877 2 года назад
Versprecher am Anfang "menschenlesbarer Text"
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
Ja mei ...
@jeyt436
@jeyt436 2 года назад
Du sprichst das Programm falsch aus, glaube ich. Ich hätte es englisch ausgesprochen.
@Florian.Dalwigk
@Florian.Dalwigk 2 года назад
In meinem Umfeld wird das so ausgesprochen. Notfalls weiß man ja, was gemeint ist.
Далее
Х.евая доставка 😂
00:23
Просмотров 703 тыс.
Optical Character Recognition (OCR) - Computerphile
14:16
So teste ich Phishing-Links und Malware!
14:04
Просмотров 29 тыс.
Der ekelhafte Megabau von Mercedes
14:46
Просмотров 1 млн
Anti-Patterns: Wie du SCHLECHTEN Code schreibst!
9:33
Merge, split PDF files and read text with Python
17:08
Training Tesseract 5 for a New Font
17:24
Просмотров 41 тыс.
ALLE Python Keywords in EINEM Video erklärt | #Python
14:06
MSI GAMING BLACK SCREEN / STUCK ON BOOT LED
1:00
Просмотров 4,8 млн
Электронный звонок #shorts
0:26
Просмотров 476 тыс.