kapicAI to innowacyjny, otwarty, niekomercyjny projekt badawczy, wykorzystujący modele sztucznej inteligencji do automatycznej transkrypcji rękopisów łacińskich, polskich, rosyjskich oraz niemieckich powstałych od II połowy XIV do końca XIX wieku.
W projekcie kapicAI korzystamy między innymi z
OCR – Optical Character Recognition czyli optyczne rozpoznawanie znaków
HTR – Handwritten Text Recognition czyli automatyczne rozpoznawanie pisma ręcznego
Obie te technologie wykorzystujemy do trenowania LLM – Large Language Model czyli dużych modeli językowych.
Nasze autorskie rozwiązania opieramy również na oprogramowaniu eScriptorium oraz Kraken Transcoding System.

Naszym celem jest stworzenie ogólnodostępnego, bezpłatnego narzędzia, które umożliwi każdemu samodzielne odczytywanie i analizowanie dokumentów historycznych, dotąd dostępnych wyłącznie dla wąskiego grona specjalistów.

Lista źródeł rękopiśmiennych, które wykorzystujemy do trenowania modeli językowch LLM
- Kapicjana (wypisy ze staropolskich ksiąg sądowych) sporządzone przez Ignacego Kapicę, będące w zasobach polskich oraz zagranicznych archiwów
- Staropolskie spisy podatkowe XVII-XVIII w.
- Staropolskie spisy wojskowe XVI-XVIII w.
- Staropolskie księgi ziemskie oraz grodzkie XIV-XVIII w.
- Księgi metrykalne XVII-XVIII w.
- Metryka Koronna
Podobnie jak wszystkie nasze działania również kapicAI to niekomercyjny projekt pro bono oparty o wolontariat.
UWAGA! Właśnie wystartował nabór do II Kohorty!
Tworzymy kolejną grupę badawczą.
Dla wolontariuszy gotowych poświęcić nieco czasu i energii uruchomimy dostęp do narzędzi badawczych. Organizujemy również bezpłatne szkolenia przeprowadzające przez sposób pracy z narzędziem.
Jeżeli ktoś z Was jest zainteresowany udziałem w kapicAI – wypełnijcie ankietę zgłoszeniową (wymagana autentykacja za pomocą konta google)
Spośród autorów ankiet wybierzemy grupę osób z której powstanie drugi zespół badawczy.
Pierwsze efekty działania kapicAI (kilka tysięcy indeksów XVII wiecznych spisów podatkowych) pojawią się już wkrótce w naszej bazie GENPOD
kapica.org.pl
30.10.2025





