Wikiźródła:Biuletyn

Z Wikiźródeł, wolnej biblioteki
Przejdź do nawigacji Przejdź do wyszukiwania

Nr 1-2011 (23)[edytuj]

Biuletyn/1-2011 (23)

Początek nowego roku wiąże się jak zawsze z przejściem dzieł kolejnych twórców do domeny publicznej (Public Domain), a tym samym z możliwością ich publikacji na Wikiźródłach. 1 stycznia 2011 roku do PD przeszły utwory autorów zmarłych w 1940 roku, m. in. Kazimierza Przerwy-Tetmajera, Izaaka Babela, Wacława Berenta, Francisa Scotta Fitzgeralda, Selmy Lagerlöf i Michaiła Bułhakowa. Miłośników „Mistrza i Małgorzaty” muszę jednak rozczarować – nie ma polskiego tłumaczenia tej powieści w domenie publicznej. Można za to zająć się przepisywaniem lub korygowaniem wierszy Kazimierza Przerwy-Tetmajera, którego trzy tomy zostały wrzucone na Wikiźródła na początku stycznia.

W ostatnim czasie zostały dodane również inne indeksy proofread: Nowelle Hajoty, O ideale doskonałości Bolesława Prusa, XIX-wieczny przewodnik po Lublinie, Królowa Śniegu Hansa Christiana Andersena, Odprawa posłów greckich Jana Kochanowskiego, kolejne powieści Józefa Ignacego Kraszewskiego, Dante studja nad Komedją Bozką tego samego autora, a także dzieła Władysława Orkana, Elizy Orzeszkowej i Williama Shakespeare'a.

Ukończono opracowywanie następujących projektów: A...B...C... Elizy Orzeszkowej, tom II Matki królów Józefa Ignacego Kraszewskiego, listy Jana Kazimierza do Maryi Ludwiki w tłumaczeniu i opracowaniu Wiktora Czermaka, Obwieszczenie w sprawie kary śmierci za nieuprawnione opuszczenie żydowskich dzielnic mieszkaniowych oraz Zwycięstwo r. 1675 pode Lwowem Karola Szajnochy.

Pełna lista opracowywanych dzieł znajduje się na stronie Wikiprojektu:Proofread, można również dodawać własne propozycje. Jest w czym wybierać! Osoby chcące rozpocząć swoją przygodę z proofread, porady dotyczące pracy w tym systemie mogą uzyskać na odpowiedniej stronie pomocy bądź na kanale IRC Wikiźródeł.

Nr 5-2010 (17)[edytuj]

  • Wydzielenie osobnej przestrzeni przeznaczonej dla Autorów; Autor
  • Nowa strona główna (opisze Awersowy)
  • Remedios adminką
  • Dyskusja nad nieaktywnymi adminami i biurolami
  • Start Blipa (opisze Awersowy)
Przeglądając starsze Biuletyny, zauważyłem że informacja o Blipie poszła do sekcji Co w wikiblogach piszczy. --Teukros (dyskusja) 19:31, 25 maj 2010 (CEST)
  • Wyszukiwarka wikiźródła.pl

Podsumowanie miesiąca (23 kwietnia - 24 maja)[edytuj]

Opublikowane w numerze 16.[edytuj]

Wersje przejrzane[edytuj]

27 marca br., kiedy w Warszawie odbywała się Konferencja Wikimedia Polska, deweloperzy zrealizowali zgłoszenie na Bugzilli uruchamiając mechanizm wersje oznaczonych w polskojęzycznych Wikiźródłach. Wniosek o włączenie został złożony po długiej dyskusji w Skryptorium (odpowiednik wikipediowego Baru), zainicjowanej przez Beau. Samo włączenie wersji przejrzanych obyło się z lekkim opóźnieniem. Dzięki szybkiej interwencji Leinada u administratorów fundacji można było rozpocząć oznaczanie stron (pierwszą z nich była – symbolicznie – Bogurodzica). Decyzją społeczności Wikiźródeł, wersjami przejrzanymi objęto następujące przestrzenie: główną, Szablon:, Plik:, Kategoria:, Pomoc:, Strona: i Indeks:.
Uprawnienia redaktora mogą nadawać administratorzy według własnej oceny. Flaga nadawana jest także automatycznie tym użytkownikom, którzy wykonali 100 edycji w przestrzeni głównej oraz mają zarejestrowane konto co najmniej 14 dni.
Po prawie trzech tygodniach od uruchomienia wersji przejrzanych oznaczono wszystkie strony z przestrzeni Indeks:, Strona: i Pomoc:, a także ponad 26% w przestrzeni głównej. Czternastu użytkowników otrzymało uprawnienia redaktora. W celu zaoszczędzenia pracy wszystkie strony edytowane tylko przez administratorów zostały automatycznie oznaczone jako przejrzane.

Encyklopedie na Wikiźródłach[edytuj]

W projektach Wikimedia treści o charakterze encyklopedycznym tradycyjnie utożsamiane są wyłącznie z Wikipedią. Niesłusznie! Na polskojęzycznych Wikiźródłach już od 2007 r. opracowywana jest Encyklopedia staropolska. Ostatnio prace nad nią istotnie przyspieszyły, ponieważ pojawiły się skany na Commons i teraz cała treść jest przenoszona do systemu proofread. Trwają także prace nad ostatnim, czwartym, tomem. Natomiast na początku kwietnia rozpoczęto przepisywanie trzydziestotrzytomowej (sic!) Encyklopedii kościelnej, wydawanej w zaborze rosyjskim na przełomie XIX i XX wieku. Oczywiście, oba te wydawnictwa w żadnym razie nie mogą konkurować ze współczesnymi encyklopediami, pozostają jednak niezwykle cennym (a niekiedy jedynym w miarę łatwo dostępnym) źródłem wiedzy o zapomnianych już dzisiaj terminach, zwyczajach, czy też ogólnie o dawnej Polsce.

Gwałtowny spadek licznika stron po masowej edycji bota[edytuj]

Czytelnicy Wikiźródeł zapewne zauważyli, że znajdujący się na stronie głównej licznik tekstów spadł z ponad 15 000 do 13 720. Co się stało? Otóż w związku z wprowadzeniem, przy pomocy bota, do systemu proofread Encyklopedii staropolskiej, składające się na nią strony w przestrzeni głównej stały się tak małe, że oprogramowanie mediawiki przestało je rejestrować jako "artykuły". Przykładowo, hasło Chorągiew, wcale przecież niemałe, po zamianie na inkludowany tekst z proofread zajmuje ledwie 313 bajtów. Haseł w kategorii Encyklopedia staropolska jest obecnie 1446, i stąd tak znaczy spadek.
Warto zauważyć także, że liczba tekstów uzyskiwana w sposób automatyczny zawsze była myląca, ponieważ określa ona ogólną liczbę stron w projekcie, a nie samych utworów. Na przykład Pan Wołodyjowski to jeden tekst składający się z 56 rozdziałów oraz wstępu i epilogu. Wraz ze stroną indeksującą to w przestrzeni głównej 59 stron (każdy rozdział na osobnej podstronie – dla wygody czytelnika), a przecież jest to jeden tekst. Być może w przyszłości powstanie półautomatyczny system liczenia utworów, a nie stron, aby na stronie głównej informować czytelnika o rzeczywistej liczbie tekstów w projekcie.

Publikacja tekstów na Wikiźródłach[edytuj]

Jakiś czas temu w projekcie zaszła spora zmiana, polegająca na tym, że w Wikiźródłach nie zamieszcza się już utworów, lecz wydania. Czyli – nie poemat Juliusza Słowackiego Jan Bielecki, ale Jan Bielecki – konkretne wydanie tego poematu z 1857 r., nakładem Bolesława Maurycego Wolffa, ze wszystkimi jego wadami i zaletami (np. z ingerencją carskiej cenzury, która wycięła dwa wersy).
Takie wydanie zostaje następnie zeskanowane (w praktyce, po prostu wikiskrybowie znajdują wolne skany w sieci), co istotne – w całości, także z okładkami, kartami tytułowymi, spisem treści itp., następnie takie skany są zamieszczane na Commons. Dzięki temu, osoby pracujące na Wikiźródłach mogą później wykonać szczegółową korektę tekstu, mając przed oczami jego oryginał.
Kolejnym etapem jest stworzenie na Wikiźródłach strony indeksu, i rozpoczęcie pracy w systemie distributed proofread. Oznacza to, że każda strona opracowywanego wydania zostaje najpierw poddana OCRowi, a następnie tenże OCR zostaje poddany sprawdzeniu przez przynajmniej dwie osoby. To oczywiście pod warunkiem, że jest dostępny OCR – w przypadku jego braku cała praca wykonywana jest ręcznie, co spowalnia pracę, ale zwiększa pewność, że tekst nie zawiera błędu. Dla wielu starszych publikacji wykonywanie OCRu nie ma sensu – pisownia uległa w ciągu lat zmianom na tyle, że poprawienie błędów OCRu zabrałoby więcej czasu, niż przepisanie tekstu przez człowieka.
Ostatnim etapem opracowywania tekstu jest wikizacja, czyli udostępnienie tekstu czytelnikowi. Teoretycznie najprostsza część, w praktyce jest równie pracochłonna, co korekta w systemie proofread, jak się bowiem okazuje, udostępnienie np. tomiku wierszy w sposób, pozwalający na łatwy dostęp i wyszukanie każdego utworu, nie należy do łatwych zadań. Tu kryje się błąd, popełniany niekiedy przez osoby działające w dobrej wierze, lecz nie znające się na publikacji; zdarza się, że wrzucają na jedną stronę ogromną ilość tekstu, np. całą, liczącą kilkaset stron powieść. Opracowanie później takiego tekstu to przynajmniej kilka godzin pracy, i to dla doświadczonego użytkownika.