KapicAI – projekt badawczy

kapicAI to innowacyjny, otwarty, niekomercyjny projekt badawczy, wykorzystujący modele sztucznej inteligencji do automatycznej transkrypcji rękopisów łacińskich, polskich, rosyjskich oraz niemieckich powstałych od II połowy XIV do końca XIX wieku.

W projekcie kapicAI korzystamy między innymi z
OCR Optical Character Recognition czyli optyczne rozpoznawanie znaków
HTRHandwritten Text Recognition czyli automatyczne rozpoznawanie pisma ręcznego

Obie te technologie wykorzystujemy do trenowania LLMLarge Language Model czyli dużych modeli językowych.

Nasze autorskie rozwiązania opieramy również na oprogramowaniu eScriptorium oraz Kraken Transcoding System.

Naszym celem jest stworzenie ogólnodostępnego, bezpłatnego narzędzia, które umożliwi każdemu samodzielne odczytywanie i analizowanie dokumentów historycznych, dotąd dostępnych wyłącznie dla wąskiego grona specjalistów.

Lista źródeł rękopiśmiennych, które wykorzystujemy do trenowania modeli językowch LLM

  • Kapicjana (wypisy ze staropolskich ksiąg sądowych) sporządzone przez Ignacego Kapicę, będące w zasobach polskich oraz zagranicznych archiwów
  • Staropolskie spisy podatkowe XVII-XVIII w.
  • Staropolskie spisy wojskowe XVI-XVIII w.
  • Staropolskie księgi ziemskie oraz grodzkie XIV-XVIII w.
  • Księgi metrykalne XVII-XVIII w.
  • Metryka Koronna

Podobnie jak wszystkie nasze działania również kapicAI to niekomercyjny projekt pro bono oparty o wolontariat.


UWAGA! Właśnie wystartował nabór do II Kohorty!
Tworzymy kolejną grupę badawczą.
Dla wolontariuszy gotowych poświęcić nieco czasu i energii uruchomimy dostęp do narzędzi badawczych. Organizujemy również bezpłatne szkolenia przeprowadzające przez sposób pracy z narzędziem.

Jeżeli ktoś z Was jest zainteresowany udziałem w kapicAI – wypełnijcie ankietę zgłoszeniową (wymagana autentykacja za pomocą konta google)

Spośród autorów ankiet wybierzemy grupę osób z której powstanie drugi zespół badawczy.


Pierwsze efekty działania kapicAI (kilka tysięcy indeksów XVII wiecznych spisów podatkowych) pojawią się już wkrótce w naszej bazie GENPOD 


kapica.org.pl
30.10.2025

415539
Udostępnij
error: Content is protected!

Szanowni Państwo, nieustannie staramy się dostosowywać treści i obsługę strony do Waszych potrzeb. To możliwe dzięki plikom cookies. Wykorzystujemy je zgodnie z Polityką prywatności. Pozostając na stronie, akceptujecie te warunki. Dziękujemy! more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close