Решено: извличане на таблици от питон за изображения

Последна актуализация: 09/11/2023

Основният проблем при извличането на таблици от изображения е, че данните от таблицата могат да бъдат разпръснати по цялото изображение, което затруднява намирането и извличането.

There is no built-in function in Python to extract tables from images but there are many libraries that you can use. One such library is pytesseract which is a wrapper for Google's Tesseract-OCR Engine.

Here is a simple example of how you can use pytesseract to extract table data from an image:

import pytesseract import cv2 # read the image image = cv2.imread("image.png") # convert the image to grayscale gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # apply thresholding to preprocess the image thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1] # perform OCR on the thresholded image result = pytesseract.image_to_string(thresh) print(result)

Този код импортира библиотеките pytesseract и cv2.

След това се чете на изображението.

След това преобразува изображението в скала на сивото.

След това той прилага прагове за предварителна обработка на изображението.

Накрая той извършва OCR върху праговото изображение и отпечатва резултата.

Работа с изображения

Има няколко начина за работа с изображения в Python. Най-лесният начин е да използвате модула Image, който предоставя различни методи за манипулиране на изображения. Например, можете да създадете изображение от нулата с помощта на функцията Image() или можете да заредите изображение от файл с помощта на функцията open().

Друг начин за работа с изображения в Python е да използвате модула PIL (Python Imaging Library). Този модул предоставя различни методи за манипулиране на изображения, включително тяхното изрязване и преоразмеряване, конвертирането им между различни формати и др.

Дума с таблици

В Python можете да създавате таблици с функцията table(). Функцията table() приема два аргумента: типа данни на таблицата и списък с имена на колони. Ето един пример:

таблица (“име”, “възраст”)

име възраст
Джон 20
Джейн 25

Подобни публикации:

Оставете коментар