OCR van gescande documenten (VelOCRaptor)
jakeh op 18 november 2009 #
Na wat zoeken heb ik eindelijk een stuk software gevonden dat niet duur / gratis is : VelOCRaptor. Werkt allemaal prima, maar ik zit nog mee een klein probleempje. Soms worden er fouten gemaakt die ik graag zou willen aanpassen. Maar hoe pas ik de "text" van een PDF document aan? Dus de tekst die voor het zoeken gebruikt wordt, niet het beeld zelf natuurlijk. Iemand een idee?
iFredo op 18 november 2009 #
Wat is het voordeel van OCR naar PDF. Kun je niet naar Word importeren, lijkt me veel nuttiger en stelt je in staat om aanpassingen te doen. Edit: op de website wordt vermeld dat je de text ook kunt kopieren na het scannen, vervolgens plakken in Word lijkt me de oplossing voor jouw "probleem".
jakeh op 18 november 2009 #
iFredo Wat is het voordeel van OCR naar PDF. Kun je niet naar Word importeren, lijkt me veel nuttiger en stelt je in staat om aanpassingen te doen. Edit: op de website wordt vermeld dat je de text ook kunt kopieren na het scannen, vervolgens plakken in Word lijkt me de oplossing voor jouw "probleem".
Ik wil graag al mijn PDF's doorzoekbaar hebben. Zodat ik met spotlight alles kan vinden. Dat is een vrij gangbare manier van zaken bijhouden in een administratie. Teksten in Word plakken hoort daar bepaald niet bij.
iFredo op 18 november 2009 #
Nadat ze in Word hebt staan, de fouten eruit hebt gehaald, kun je er toch weer PDF's van maken? Wat jij wil is een OCR die geen fouten maakt.
sedikit op 18 november 2009 #
Deste hoger de dpi's bij het scannen, deste minder fouten er in het OCR-document zitten.
Marius1976 op 18 november 2009 #
Het "aardige" van een PDF is nu juist dat je er niets in kunt wijzigen. Dus dat wat jij wil kan niet. Fouten in een OCR moet je wijzigingen in Pages of Word, en daarna maak je er een PDF van.
F_Vervoort op 18 november 2009 #
Hoi jakeh heb je geen Acrobat Pro? Die heeft standaard een zeer goede OCR en je kan daarna wat aanpassen. Is niet simpel, maar het kan. greetz
Dorkiban op 18 november 2009 #
Marius1976 Het "aardige" van een PDF is nu juist dat je er niets in kunt wijzigen. Dus dat wat jij wil kan niet. Fouten in een OCR moet je wijzigingen in Pages of Word, en daarna maak je er een PDF van.
Ja hoor kan wel. Wat de TS wil is niet de PDF veranderen, maar de onderliggende platte tekst die de OCR genereert. Dit maakt de PDF doorzoekbaar. Als de OCR een woord verkeert interpreteert, doordat de PDF niet helemaal goed is, dan wil de TS dit kunnen corrigeren in de platte tekst. Ik dacht ook dat Acrobat Pro dit zou moeten kunnen, maar hoe, dat weet ik niet precies.
PowerMac op 18 november 2009 #
DorkibanMarius1976 Het "aardige" van een PDF is nu juist dat je er niets in kunt wijzigen. Dus dat wat jij wil kan niet. Fouten in een OCR moet je wijzigingen in Pages of Word, en daarna maak je er een PDF van.Ja hoor kan wel. Wat de TS wil is niet de PDF veranderen, maar de onderliggende platte tekst die de OCR genereert. Dit maakt de PDF doorzoekbaar. Als de OCR een woord verkeert interpreteert, doordat de PDF niet helemaal goed is, dan wil de TS dit kunnen corrigeren in de platte tekst. Ik dacht ook dat Acrobat Pro dit zou moeten kunnen, maar hoe, dat weet ik niet precies.
Kan ook, zie screenshot. http://gallery.me.com/jorisland#100959
Doede op 02 december 2009 #
Hey luitjes, bedankt voor dit draadje! Ik liep ineens tegen een scan + OCR probleem aan in 10.6, en nu is 't gelukt met o.a. Adobe Acrobat.
Advertentie
Je kunt alleen reageren met een gratis OMT account.
Log in of registreer.
Inloggen
Over dit topic
Gestart op 18 november 2009 door jakeh
Laatste reactie door Doede
Reageer op dit topic