plwk  Dołączył: 21 Kwi 2006
Naprawa formatowania zeskanowanego tekstu
Czy spotkaliście się z problemem jak w tytule.
Wielostronicowy tekst, przy skanowaniu, nie był potraktowany inteligentnym programem OCR i każdy wiersz został zakończony twardym enterem.
Jak, chociaż w przybliżeniu, pousuwać entery pomiędzy początkami akapitów? W jakim programie jest to najprostsze, czy może znacie gotowe skrypty, ułatwiające taką naprawę
 

tref  Dołączył: 05 Wrz 2006
Tak na szybko to przychodzi mi do głowy notepad++ i funkcja zamień z włączoną opcją rozszerzonego trybu szukania \n albo wyrażeniami regularnymi.
 

plwk  Dołączył: 21 Kwi 2006
Dziękuję, sprawdzę.
 

opiszon  Dołączył: 29 Sty 2008
tref, jak przekleisz tekst sformatowany do n++ to formatowanie się usunie.
Jeżeli to nie przeszkadza to prawdopodobnie wystarczy tylko skopiowanie z edytora do n++ i spowrotem do edytora.
Wszelkie znaki formatujace powinny zostać usunięte, ew zamienione na zwykłe znaki nowej linii...
 

plwk  Dołączył: 21 Kwi 2006
W notepad++, podobnie jak w notepadzie, ginie całe formatowanie, więc jest on, do tego zastosowania, nieprzydatny.
 

plwk  Dołączył: 21 Kwi 2006
Edytor, do wykonania tego zadania, musi posiadać opcję zastępowania z wyłączeniami. Trzeba wszystkie entery zastąpić pojedynczą spacją, z wyłączeniem tych występujących po kropce, wykrzykniku, znaku zapytania i dwukropku.

Nie wiem, czy czegoś nie pominąłem.
 

PiotrR  Dołączył: 03 Maj 2006
Jeśli nie znajdziesz lepiej zrób tak:
Odpal to w wordzie.
Znajdź sobie symbol, który nie występuje w tekście (dajmy na to, że @ - ale to zależy od tekstu - na pewno taki symbol się znajdzie).
Wszystkie entery po kropce zamień na .@, po przecinku na ,@, po dwukropku na :@ i tak dalej.
Następnie wszystkie entery zamień na spacje.
Następnie wszystkie @ zamień na entery.
I gotowe.
Cała operacja nie zajmie więcej niż trzy minuty.

edit: jeśli nie chce Ci się szukać symbolu, którego nie ma w tekście, możesz wymyślić kombinację, której nie ma na pewno - np @#$ - entery po kropce zamieniasz na .@#$ i reszta tak samo, a potem całą kombinację zamieniasz z powrotem na entery.
 

plwk  Dołączył: 21 Kwi 2006
Dziękuję :-D

W jaki sposób jest reprezentowany enter w wordzie w opcjach zamiany?
Właściwie to w openoffice - worda nie mam ani w domu, ani w pracy.

 

PiotrR  Dołączył: 03 Maj 2006
^p

Po rozwinięciu na dole opcji zmiany "więcej" będzie znów na dole do rozwinięcia "specjalne" i tam są wszystkie takie.
 

Kytutr  Dołączył: 20 Lut 2007
Plwk, a próbowałeś może takiego sprytnego narzędzia Microsoft Office Lens, które jest dostępne na telefony z Androidem? Robisz zdjęcie tekstu, a aplikacja zajmuje się resztą.
 

tref  Dołączył: 05 Wrz 2006
Kytutr napisał/a:
Robisz zdjęcie tekstu, a aplikacja zajmuje się resztą.
A nie ma wersji PRO, żeby nie trzeba było robić czegokolwiek, a aplikacja zajmie się resztą? :evilsmile:
 

plwk  Dołączył: 21 Kwi 2006
Znalazłem, w openoffice koniec akapitu to \p.
Kytutr napisał/a:
Robisz zdjęcie tekstu, a aplikacja zajmuje się resztą.

Dla kilku tysięcy stron tekstu? 8-)

Wyświetl posty z ostatnich:
Skocz do:
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach