kokemusta tekstitunnistusohjelmista?

Tänne voit lähettää sukututkimukseen liittyviä kysymyksiä, henkilöhakuja, linkkivinkkejä ja muuta sellaista.
R Junkkari
Viestit: 13
Liittynyt: 10.09.2025 16:54

kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja R Junkkari » 31.01.2026 22:01

Hei kaikki

Onko teillä kokemusta ruotsin kielen tekstitunnistusohjelmista? Käyttökelpoinen ohjelma nopeuttaisi vanhalla ruotsinkielellä ja käsialalla kirjoitettujen asiakirjojan raakakopion tekemistä. Siitä voisi sitten alkaa hiomaan tekstiä eteenpäin.
R Junkkari

Essimi
Viestit: 769
Liittynyt: 21.03.2007 21:58
Paikkakunta: Lhj

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja Essimi » 31.01.2026 23:33

Olen käyttänyt Kansallisarkiston tekstintunnistusohjelmaa ihan mukavalla menestyksellä. Kannattaa katsoa heidän opastuksensa asiaan. "Kansallisarkiston tekstintunnistus" löytyy vaikka googlella. Se käyttää ohjelmaa Chat Gpt https://chatgpt.com/ Sen verran vinkkiä, että kannattaa tallentaa asiakirjojen kuvat ensin omalle koneelle, ja muokata ne vain yhden sivun käsittäviksi kuviksi - aukeaman kanssa tekoäly menee helposti sekaisin.
Suosittelen kokeilemaan, ei ole yhtään pelottavaa. Tekoäly osaa olla hyvin viehättävä ja kohtelias!

Avatar
Ilpo
Viestit: 407
Liittynyt: 23.09.2006 20:29
Paikkakunta: Helsinki
Viesti:

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja Ilpo » 01.02.2026 04:06

Vanhoja tuomiokirjoja on luettu OCR tekstintunnistuksella. Niitä on muutettu tekstiksi tekoälyn avulla. Kyllä ne sen verran ja oikeastaan aika hyvinkin ovat luettavaa tekstiä. SIinä oli myös kuva siitä alkuperäisestä sivusta. Siitä voi sitten arvailla niitä sanoja, joiden tunnistus on mennyt pieleen.

Tuomiokirjahaku uudistui: nyt voit tehdä kokotekstihaun yli kolmeen miljoonaan käsin kirjoitettuun sivuun

Tiedän sitten, että Linux Kubuntun ohjelmaan Spectacle (kuvaruudunkaappaus) ollaan tekemässä tekstintunnistinta. Ei taida olla vielä valmis. Ihan varmasti Windowsissa on tekstintunnistusohjelmia. Tuo Linuxin ohjelma on ilmainen.

R Junkkari
Viestit: 13
Liittynyt: 10.09.2025 16:54

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja R Junkkari » 02.02.2026 21:01

Hei

Kiitos vinkinstä. Sain arkistolaitoksesta oheisen ohjelman ja se toimi varsin hyvin 1800-luvun tekstiin ja siitä oli iso apu kääntämisessä. Kannattaa kokeilla.

Reijo

https://huggingface.co/spaces/Kansallis ... y-HTR-Demo

eoh
Viestit: 6
Liittynyt: 22.01.2026 19:48

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja eoh » 02.02.2026 21:43

Hei, Reijolle pointsit linkistä, kokeilin erääseen sivuun jota olen pähkäillyt ijätajat, eikä kaikki ole mulle selvinnyt, mutta tällä selkis kokosivu 10 sekuntia ja homma hanskassa välittömästi. Mainiota tekoa.

R Junkkari
Viestit: 13
Liittynyt: 10.09.2025 16:54

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja R Junkkari » 07.02.2026 19:43

Hei

Kiitos kiitoksista. Minullaki arki helpottui tosi paljon vaikka dekkarityötä jäikin.

Hapero
Viestit: 1173
Liittynyt: 31.07.2020 02:24

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja Hapero » 08.02.2026 01:26

Yleisesti (normilaatuisen paperioriginaalin) tekstintunnistuksen tehtäviin yllättävänkin mainio ollut:
https://www.ilmaisohjelmat.fi/naps2

En nyt suoraan muista saiko sen tunnistamaan mitä vain skannerin ulkopuoleltakin syötettyä kuvaa tai PDF-tiedostoa, luulisin, kun en muista skannailleeni tällä erikoisemmin (edellisellä "tuotantokoneella").

Kimpula
Viestit: 532
Liittynyt: 31.01.2013 08:56

Re: kokemusta tekstitunnistusohjelmista?

Viesti Kirjoittaja Kimpula » 08.02.2026 09:43

tesseract

https://github.com/tesseract-ocr/tesseract

mutta vain painetulle tekstille. Osaa melko hyvin fraktuuraakin.

Digiarkistolla on tietysti oma viritys....
https://digi.kansalliskirjasto.fi/search

Vastaa Viestiin