Wikiźródła:Narzędzia/Popraw tekst OCR

Z Wikiźródeł, wolnej biblioteki
Przejdź do nawigacji Przejdź do wyszukiwania

Gadżet dodaje przycisk Toolbaricon regular T.png (Button defaultsort.png w standardowym pasku narzędzi edycyjnych) do paska narzędzi edycyjnych, który poprawia format tekstu oraz typowe błędy OCR w oknie edycji proofread.

Gadżet posiada także wersję przystosowaną do poprawy tekstów wierszowanych (<poem>). Aby ją włączyć należy w swoich Preferencjach zaznaczyć opcję opisaną:

Popraw tekst OCR dla poezji – dodaje przycisk Toolbaricon templatelink.png (Button copy edit.png w starym pasku narzędzi edycyjnych), który poprawia format tekstu dla poezji oraz typowe błędy OCR w oknie edycji proofread.

W tej wersji gadżet poprawia błędy OCR, lecz nie usuwa podziałów wierszy; opcjonalnie dodaje na początku i końcu strony, znaczniki <poem></poem> (dodawanie znaczników w tym trybie można włączyć w sposób opisany w sekcji Instalacja).


Instalacja[edytuj]

Aby skorzystać ze skryptu wystarczy w preferencjach w sekcji Gadżety zaznaczyć pole obok nazwy skryptu.

Jeżeli chcesz, aby w wersji dla Poezji dodatkowo dodawał na początku i końcu strony znaczniki <poem></poem> wklej, w swojej przestrzeni użytkownika, na stronie common.js (lub na stronie globalnej meta:Special:MyPage/global.js, jeżeli używasz), następujący kod:

/* Dodawaj znaczniki <poem> w trybie dla poezji */
jQuery(document).ready(function($) {
	if ( mw.user.options.get( 'gadget-Typo-pl-poem', 0) == 1 ) {
		$.typo.add(function(str,poem) {
			if ( poem === "poem" ) {
				str = '<poem>\n' + str + '\n</poem>';
			}
			return str;
		});
	}
});

Funkcje[edytuj]

Obecnie skrypt realizuje następujące poprawki:

  • usuwa łączniki opcjonalne,
  • usuwa podziały wiersza, (nieaktywne w trybie dla Poezji)
  • usuwa zbędne odstępy przed i po akapicie,
  • usuwa znaki , , _, ·,
  • zamienia wiele spacji na jedną
  • zamienia "tekst" na tekst (poza tagami html i mw),
  • zamienia - na (jeżeli znak "-" nie łączy wyrazów),
  • usuwa zbędne odstępy przy znakach „“, ,, ., ,
  • zamienia {{tab}}—_1_ na {{tab}}—_I_
  • zamienia _tern na _tem.
  • zamienia /. na z
  • zamienia _011_ na _on_
  • zamienia cb na ch (poza wyrazami kończącymi się na ...cby)
  • zamienia ćh na ch
  • zamienia c[lł]i na ch
  • zamienia ź[eaoąęiuóy] na ż[eaoąęiuóy]
  • zamienia _iź na _iż
  • zamienia iź_ na iż_
  • zamienia _teź na _też
  • zamienia _[bB][yv][lł]_ na _był_
  • zamienia _[\iv]v_ na _w_
  • zamienia _v[/]_ na _w_
  • zamienia _\\’_ na _w_
  • zamienia czvm na czym
  • zamienia [0-9]O na [0-9]0
  • zamienia _0[a-z] na _O[a-z]
  • zamienia _aui_ na _ani_
  • zamienia _si[ąo]_ na _się_
  • zamienia _juz_ na _już_
  • zamienia ó_ na ć_
  • zamienia ćj na éj
  • zamienia na
  • zamienia slde na skie
  • zamienia _oc[lł] na _od
  • zamienia _dła_ na _dla_
  • zamienia [a-z]6[a-z] na [z-a]ó[a-z]
  • zamienia [a-z]1[a-z] na [z-a]l[a-z]
  • zamienia _[!?.,:;] na [!?.,:;]
  • zamienia ' na
  • zamienia _<br /> na <br />
  • zamienia na _—_
  • zamienia {{tab}}_ na {{tab}}
  • zamienia n. p. na n.&nbsp;p.
  • zamienia i_t._ na i&nbsp;t.&nbsp;
  • zamienia t._zw. na t.&nbsp;zw.
  • zamienia t._j. na t.&nbsp;j.
  • zamienia p._t. na p.&nbsp;t.
  • dodaje znaczniki <poem></poem> na początku i końcu strony (jedynie w trybie dla Poezji)

Autor[edytuj]

Skrypt jest zmodyfikowaną przez Zdzislawa wersją Skryptu fr:MediaWiki:Gadget-Typo.js, którego Autorem jest Marc oraz Tpt, jeśli masz jakieś uwagi co do działania skryptu, zostaw wiadomość na stronie dyskusji.