You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
24 lines
924 B
24 lines
924 B
import fitz |
|
from pprint import pprint |
|
from _arango import arango |
|
from _llm import LLM |
|
|
|
llm = LLM(chat=False) |
|
docs = [i for i in arango.db.collection('interrogations').all()] |
|
sorted_docs = sorted(docs, key=lambda x: x['date']) |
|
|
|
filename = "Förhörsprotokoll.pdf" |
|
pdf = fitz.open(f"pdfs/{filename}") |
|
|
|
for doc in sorted_docs: |
|
|
|
pdf_page = pdf[doc['page']] |
|
text = pdf_page.get_text() |
|
|
|
print(doc['person']) |
|
prompt = f'Kolla på texten nedan: \n\n """{text}""" \n\n Den förhörda personen heter {doc["person"]} Varför förhörs {doc["person"]}? Om det har något att göra med {doc["person"]}s titel eller yrke, svara med det, annars med eventuell annan anledning. Om det inte finns någon speciell anledning eller titel, svara "None". \n\:' |
|
answer = llm.generate(prompt) |
|
doc['reason'] = answer |
|
print("\033[92m" + answer + "\033[0m") |
|
print() |
|
arango.db.collection('interrogations').update(doc) |