Gépi kézírásfelismeréssel készült el a Magyar Nemzeti Levéltár legnagyobb adatbázisa

Gépi kézírásfelismerés segítségével készült el a Magyar Nemzeti Levéltár (MNL) legnagyobb, az 1828. évi országos összeírást feldolgozó adatbázisa.


Az 1828. évi országos összeírás teljes, 12 688 település adatait tartalmazó, indexelt képanyaga a Valenciai Műszaki Egyetem által fejlesztett algoritmus és mintegy 70 önkéntes munkájának eredményeként jött létre. Ez az összeírás az eddigi legnagyobb, kézírásfelismeréssel feldolgozott gyűjtemény Magyarországon – írta meg az MTI, a Nemzeti Levéltár tájékoztatása nyomán. 

Mikó Zsuzsanna, az intézmény általános főigazgató-helyettese kiemelte: számos jó nemzetközi gyakorlatot követve az MNL is nyitott a civilek bevonására adatbázisainak fejlesztésében. Reményét fejezte ki emellett, hogy az önkéntesek által feldolgozott iratanyag és adatbázisok száma egyre gyarapodni fog, és megköszönte az önkénteseket adó Magyar Családtörténet-kutató Egyesület segítségét a közösségi összefogással végzett munkában. A közlemény kiemeli az önkéntesek európai szinten egyedülálló aktivitását, a meghirdetett programra ugyanis két nap alatt annyian jelentkeztek, hogy le kellett állítani a toborzást.

Az 1828. évi országos összeírás 196 724 oldalból áll, és a 19. század első feléből valamennyi adófizetési kötelezettség alá eső háztartás tulajdonosának és családfőjének az adatait tartalmazza. Az egyedülálló történeti forrásban 2 845 595 személynév szerepel a történeti Magyarország, Horvátország és Szlavónia teljes területéről.

A most közzétett irategyüttes elsősorban családtörténet-kutatási szempontból kivételesen értékes forrás, illeszkedve a már régóta elérhető korábbi, 1715. és 1720. évi összeírások sorába.

Az adatbázisban a kereshető személynevek mellett a vagyoni és társadalmi helyzetre vonatkozó adatok digitalizált képei is elérhetők a kutatók számára, szem előtt tartva, hogy az összeírás a korszak magyar társadalom- és gazdaságtörténete szempontjából pótolhatatlan forrásértékkel bír.