fix: Document tuple expects Section

winstxnhdw · Nov 22, 2023 · e2a68b1 · e2a68b1
1 parent 4c699a7
commit e2a68b1
Showing 1 changed file with 6 additions and 6 deletions.
diff --git a/server/features/extraction/extract_from_image.py b/server/features/extraction/extract_from_image.py
@@ -1,15 +1,15 @@
+from io import BytesIO
 from typing import Generator
 from uuid import uuid4
 
 from fastapi import UploadFile
-
-from tesserocr import PyTessBaseAPI
-from io import BytesIO
 from PIL import Image
+from tesserocr import PyTessBaseAPI
 
 from server.features.extraction.models import Document
 from server.features.extraction.models.document import Section
 
+
 def extract_texts_from_image(file_name: str, image: Image) -> Document:
     """
     Summary
@@ -27,11 +27,11 @@ def extract_texts_from_image(file_name: str, image: Image) -> Document:
     """
     with PyTessBaseAPI(path='/usr/share/tesseract-ocr/5/tessdata') as ocr:
         ocr.SetImage(image)
-        sections = [ocr.GetUTF8Text()]
+        section = Section('', ocr.GetUTF8Text())
 
     return Document(
         id=str(uuid4()),
-        sections=sections,
+        sections=[section],
         semantic_identifier=file_name
     )
 
@@ -55,4 +55,4 @@ def extract_texts_from_image_requests(requests: list[UploadFile]) -> Generator[D
                 extract_texts_from_image(request.filename.rsplit('.', 1)[0], image=img)
                 if request.filename
                 else None
-            )
+            )