Dyskusja indeksu:Opis ziem zamieszkanych przez Polaków 1.djvu

Z Wikiźródeł, wolnej biblioteki
Przejdź do nawigacji Przejdź do wyszukiwania

OCR mismatch[edytuj]

There is a mismatch in the OCR. Strona:Opis ziem zamieszkanych przez Polaków 1.djvu/547 (click edit) contains the text which belongs with the image Strona:Opis ziem zamieszkanych przez Polaków 1.djvu/541 --John Vandenberg (dyskusja) 07:24, 13 paź 2009 (CEST)

This appears to be true for most pages - about six pages off.Radeksz (dyskusja) 07:36, 13 paź 2009 (CEST)

Is it cool to just copy/paste the text to appropriate page? Mozna to po prostu copy/pastowac do wlasciwej strony?Radeksz (dyskusja) 07:37, 13 paź 2009 (CEST)

Yes, you can use copy&paste to correct this manually. It is also possible to use m:djvutext.py to automatically fix this.
If a high quality copy of the text is already available somewhere else on the internet, you should use that instead. There is no benefit in fixing OCR errors if someone else has already done it.
John Vandenberg (dyskusja) 07:46, 13 paź 2009 (CEST)

The discrepancy starts at „Strona:Opis ziem zamieszkanych przez Polaków 1.djvu/32” and appears to be due to presence of tables and picturesRadeksz (dyskusja) 08:57, 13 paź 2009 (CEST)

Zaznaczam niebieskim te strony w ktore wklejilem wlasciwy tekst OCR, ale ktory jeszcze nie poprawilem/sprawdzilem. I'm marking pages into which I copy/pasted the correct OCR text but which I haven't yet checked and fixed.Radeksz (dyskusja) 13:22, 14 paź 2009 (CEST)

Rozbieznosc miedzy skanami i tekstem jest o 6 stron, przynajmniej mniej wiecej do dwustej stronny. Najlepiej zaczac wysoko i potem robic copy/paste az sie dojedzie do dolu.Radeksz

UWAGA
[edytuj]

Strony przepisywać należy po kolei, bez przeskakiwania i przepisywania wybiórczego. Związane jest to z przesunięciem OCRa o 6 stron w stosunku do właściwego tekstu. Przepisując stronę poza kolejnością, likwiduje się OCR dla jednej ze stron poprzednich. --Teukros (dyskusja) 22:25, 29 paź 2010 (CEST)