Distributed Proofreaders 528 books posted to PG from DP!   Visit DP-INT 
  DP » Beginning Proofers' FAQ
ID: Password:  ·  Register ·  Help 
 

Aloittelevan oikolukijan
usein esitettyjä kysymyksiä (FAQ)

Version 1.5, julkaistu 19.06.2003

Tämän FAQ:n tarkoituksena on tarjota vastauksia yleisiin kysymyksiin, joita DP webpalvelussa liittyneet uudet käyttäjät ovat meiltä kysyneet. Tietystikään kaikki kysymykset eivät ole tässä mukana. Ellet löydä vastausta täältä, voit tarkastella muita dokumentteja tai lähettää sähköpostia Charles Franksille.

  Sisältö
 
  1. Mikä on Distributed Proofreaders (hajautetut oikolukijat)?
  2. Mikä on Projekti Gutenberg?
  3. Miksi valitsemme oikoluettavaksi juuri tietyt kirjat?
  4. Miten minä voin auttaa?
  5. Miten käsittelen...?
  6. Miten otan yhteyttä...?
  7. Mikä on koko e-tekstin tuotantoprosessi?
  8. Miten saan kopion tekemistäni e-teksteistä?
  9. Miten saan kopioita muista Gutenbergin e-teksteistä?
  10. Taisin sotkea jotain (tai tein jotain väärin). Miten voin korjata tämän?
  11. Websivulla tuotaa ongelmia ... Kirjautua sisään/Oikolukea sivu/Saada uusi sivu
   

1. Mikä on Distributed Proofreaders?

Distributed Proofreaders (hajautetut oikolukijat) on keino tukea Projekti Gutenbergia, ja se onkin virallinen PG liitännäispalvelu. Perusideana on, että sivustomme ohjelmisto sallii usean oikolukijan työskennellä saman kirjan parissa samaan aikaan jokaisen oikolukiessa eri sivua. Tämä nopeuttaa oleellisesti oikolukuprosessia.

Miten se toimii:

  1. Tämä webpalvelu käyttää online ohjelmistoa ja tietokantoja "kirjaston" luomiseen.
  2. Jotkut ("sisällön tuottajat") skannaavat kirjoja sekä lähettävät skannatut kuvat kirjastolle.
  3. Kaltaisesi ihmiset ("oikolukijat") valitsevat projektin ("kirjan") ja voivat aloittaa vaikka heti.
  4. Palvelumme näyttää tällöin websivun, joka sisältää kirjan yhden sivun skannatun kuvan ja tästä kuvasta peräisin olevan tekstin (OCR- eli tekstintunnistusohjelman tuottamana). Voit näin helposti verrata skannattua tekstiä sivusta otettuun kuvaan, jolloin voit helposti havaita eroavaisuudet ja korjata ne.
  5. Luet tekstin ja korjaat sen sivun kuvan mukaiseksi. Lähinnä korjaat OCR-ohjelman tuottamat virheet, ja merkitset esim. tekstiin lihavoinnin ja kursiivin, alaviitteet jne. yleisohjeittemme mukaisesti (jotta kaikki noudattaisimme samaa merkintätapaa).
  6. Kun k.o. sivu on valmis, talletat sen ja sitten joko otat toisen sivun oikoluettavaksi tai poistut tältä erää.
    Huomaa, että muut voivat samaan aikaan käsitellä joko tämän kirjan muita sivuja tai kokonaan eri kirjoja. Kukin oikolukija työskentelee vain vähäsen (ehdotamme "sivun päivässä"), mutta yhdessä toimiessamme saamme paljon kirjoja valmiiksi! [Vuonna 2003 meillä oli keskimäärin 250-300 oikolukijaa vuorokaudessa maapallon joka kolkassa sijaitsevista maista, missä ajassa valmiiksi saimme 2500-3000 sivua. Tämä tekee noin kaksi sivua vuorokauden joka minuuttia kohden!]
  7. Palvelu tallettaa oikoluetun sivun tietokantaamme seuraavaa kierrosta varten. (Kukin kirja läpikäy kaksi oikolukukierrosta, jolloin pyritään löytämään kaikki tekstissä olevat virheet.)
  8. Kun kaikki kirjan sivut on oikoluettu, "jälkikäsittelijä" suorittaa k.o. kirjan valmistumiseen tarvittavan viimeistelytyön: hän yhdistää kaikki sivut yhdeksi isoksi tiedostoksi, varmistuu merkintöjen yhdenmukaisuudesta jne. sekä tekee viimeisen tarkistuksen virheiden osalta.
  9. Lopuksi kirja lähetetään Projekti Gutenbergin arkistoon, ja se jaellaan peilauspalvelimille eri puolille maailmaa, jolloin kaikki halukkaat saavat sen vapaasti luettavaksi ja nautittavaksi.

2. Mikä on Projekti Gutenberg?

Michael Hart perusti Projekti Gutenbergin vuonna 1971. Hänen ajatuksenaan oli: kaikki mikä voidaan siirtää tietokoneeseen, voidaan monistaa loputtomiin. Tämä johti ideaan siirtää kirjoja tietokoneisiin ja jakaa nämä kirjat koko maailman kanssa.

Nämä sähköiset tekstit (e-tekstit) tuotaisiin esille mahdollisimman yksinkertaisessa, helpossa muodossa käyttää. Tämä tarkoittaa "puhdasta ASCII-tekstiä", (aluksi 7-bittistä). Kursiivi, alleviivaukset ja lihavoinnit muunnettaisiin ASCII.ksi. Saman ajatuksen mukaisesti valitut kirjat olisivat sellaisia, jotka kiinnostaisivat mahdollisimman suurta ihmisjoukkoa. Tekijänoikeuslaeista johtuen näin voidaan tehdä laillisesti vain vanhempien kirjojen kohdalla (USA:ssa yleisesti ottaen, jos kirja on jossain julkaistu ennen vuotta 1923, EU:ssa jos tekijän kuolemasta on kulunut yli 70 vuotta). Tästä johtuen Projekti Gutenberg käsittää enimmäkseen "klassikoita."

Voit lukea lisää Projekti Gutenbergin historiasta: www.gutenberg.net/history.html

3. Miksi valitsemme oikoluettavaksi juuri tietyt kirjat?

Projektin vetäjät (useimmiten Charles) nappaavat minkä tahansa kirjan, jonka voimme löytää. US tekijänoikeuslait rajoittavat suuresti sitä kirjamäärää, joiden parissa meidän on sallittua työskennellä. Käymme antikvariaateissa ja selaamme Internet websivuja sekä huutokauppoja. Joskus lainaamme harvinaisia kirjoja kirjastosta ja skannaamme ne. Yritämme löytää kirjoja, joita arvelemme ihmisten lukevan mielellään ja jotka ovat lisäksi kohtuuhintaisia.

Ennen kuin valitsemme kirjan muunnettavaksi e-tekstiksi, tarkastamme Projekti Gutenbergin luettelon (ollaksemme varmoja, ettei sitä ole jo tehty) sekä tutkimme Davidin 'Tekeillä' luettelon (varmistuaksemme siitä, ettei joku muu ole paraikaa työstämässä sitä).

Yhteenveto: teemme mitä tahansa kirjoja, joita meille hankitaan (sikäli kuin laki ei ole esteenä). Sikäli kuin Sinulla on kirja, jonka haluaisit nähdä valmiina e-tekstinä (ja kirjan tekijänoikeus on selvitetty), voimme todennäköisesti (avustuksellasi) sada sen valmiiksi. Ota yhteyttä Charles Franksiin tai katso "Sisällön tarjoajien foorumia.

4. Miten minä voin auttaa?

E-tekstin tuotantoprosessi on pitkä.
DP perustettiin tämän toiminnan nopeuttamiseksi, se antaa Sinun auttaa sisällön tuottajia oikolukemalla sivuja heidän kirjoistaan. Ellet ole vielä tehnyt niin, paina "Luo" linkkiä ja avaa käyttäjätili. Tämä tekee Sinulle mahdolliseksi valita tarjolla oleva kirja ja oikolukea muutama sivu. Rohkaisemme ihmisiä yrittämään lukea ainakin "sivun päivässä", mutta mikä tahansa työmäärä on oikein tervetullut ja auttaa paljon e-tekstien luomisessa. Juuri näin useimmat lukijat meitä auttavat.

Jos saat sitten oikein Gutenberg-kuumeen, saatat haluta tulla projektin vetäjäksi (PM). PM:t pääasiassa kaitsevat projektin ("kirjan") esillepanon, oikoluvun ja jälkikäsittelyn vaatimien prosessien läpi sivustollamme. Välistä he huolehtivat kaikista tehtävistä itse, joskus he taas koordinoivat muiden k.o. tehtävien parissa työskentelevien toimintaa.
Jos arvelet haluavasi tulla projektin vetäjäksi, ala opetella kaikkea mahdollista Projekti Gutenbergista. Mene kotisivulle www.gutenberg.net ja lue kaikki tarjolla oleva. Liity PG postituslistalle ja seuraa sitä vähän aikaa. Oikolue meillä sivuja useista erilaisista kirjoista, jotta saat oikean tuntuman kokonaisuudesta. Yritä etsiä paikka tai paikkoja, mistä voisit saada sopivia kirjoja. Lue Projektin vetäjän FAQ. (Kokeneet PM:mme auttavat Sinua mielellään toiminnan käynnistämisessä.) Kun tunnet olevasi valmis, lähetä sähköpostia Charles Franksille.

Jos haluat tehdä enemmän palvelumme hyväksi, mutta Sinulla ei ole aikaa tai taipumusta projektin vetäjän toimeen, voit harkita lahjoituksen tekemistä. Paikkamme rahoitus tulee kokonaan Charlesilta, PM:iltä ja oma-aloitteisista lahjoituksista. Katso "Lahjoita" painiketta kotisivultamme, mikäli haluat tehdä verovähennyskelpoisen lahjoituksen. Tai täältä!

Voit myöskin lahjoittaa kirjoja (public domain eli tekijänoikeudesta vapautuneita) lähettämällä ne meille skannattaviksi (toivottavasti niitä ei tarvitse palauttaa). Voit myös itse skannata kirjat ja lähettää kuvat meille (tee näin, jos haluat pitää kirjan itselläsi). Haluaisimme mieluusti, että selvittäisit ensin kirjojesi tekijänoikeuskysymykset Projekti Gutenbergin kanssa ennen skannausta ja kuvien meille lähettämistä. Ole hyvä ja tutustu Miten toimitan materiaalia FAQ:iin saadaksesi yksityiskohtaista tietoa tekijänoikeuden selvittämisestä ja kirjojen skannauksesta.

Jos siis haluat tehdä enemmän kuin pelkkää oikolukua, voit auttaa myös omaksumalla minkä tahansa seuraavista rooleista:

  • Materiaalin tuottaja. Hän suorittaa minkä vain tai kaikki seuraavista tehtävistä:
    1. Etsii sopivan (copyright-vapaan) kirjan oikoluettavaksi.
    2. Hankkii kirjalle copyright-selvityksen.
    3. Skannaa kirjan jokaisen sivun.
    4. Käsittelee kaikki sivuista otetut kuvat tekstintunnistusohjelmalla (OCR).
    5. Ajaa saadun tekstitiedoston esikäsittelyohjelman läpi yleisten virheiden korjaamiseksi.
    6. Syöttää sivujen kuvatiedostot ja OCR-tunnistetun tekstin DP webpalveluun.
  • Projektin vetäjä. Katso yllä olevaa selvitystä.
  • Jälkikäsittelijä. Tekee kaiken tarvittavan viimeistelytyön valmistaakseen projektin oikoluetuista sivuista yhdistetyksi e-tekstiksi, joka on sovelias lisättäväksi Projekti Gutenbergin arkistoon. Yhdistää kaikki sivut yhdeksi suureksi tiedostoksi, käsittelee sivujen yli pilkkoutuneet sanat tai kappaleet, siirtää ala- ja reunaviitteet asianomaisiin kohtiin ja yleisesti ottaen varmistuu siitä, että kaikki oikolukijat ovat olleet johdonmukaisia lukiessaan tekstiä, lopuksi hän toimittaa valmistuneen tekstin Projekti Gutenbergille.
  • Sivuston avustaja. Toivotamme aina jokaisen tervetulleeksi auttamaan ja parantamaan webpalveluamme. Ohjelmoijat (PHP, mySQL ja jkv. Java Script) voivat työskennellä sivustomme ohjelmiston parissa, beta-testaajat tarkastavat uusia versioitamme, ohjetekstien kirjoittajat auttavat dokumentaatiomme tuottamisessa jne. Kaikkia heitä tarvitaan lisää. Ota yhteyttä Joseph Gruberiin, jos haluat auttaa joissakin näistä tehtävistä.

Voit tehdä mitä vain näistä täysin omin päin tai voit toimia yhdessä muiden kanssa tehtävien suorittamiseksi. Useimmat osaprojektimme valmistuvatkin ryhmätyönä.

5. Miten suoriudun...?

Projekti Gutenberg ei pakota käyttämään mitään ehdottomia "sääntöjä", mutta jotta hajautettu oikolukusysteemi toimisi hyvin, olemme laatineet omat Oikolukijan ohjeemme. Ole hyvä ja lue nämä sekä mahdolliset PM:n kommentit projektista ennen oikolukemisen aloittamista. Päämääränä on säilyttää mahdollisimman paljon sivun muotoilusta ja tehdä tarvittavat merkinnät aina samalla tavalla sekä valmistella näin teksti tietokoneessa luettavaan muotoon. Jos olet uusi oikolukija, saattaa olla hyödyllistä tulostaa kaksisivuinen yhteenvetomme Oikolukijan pikaopas ja pitää se saatavilla oikoluvun aikana. Tämä kattaa oikolukemisen perusteet.
Lisäksi jotkut projekteistamme on merkitty "Vain aloittelijoille". Nämä ovat helppoja kirjoja eivätkä sisällä mutkikkaita oikolukuongelmia. On hyvä ajatus valita joku näistä kirjoista oikolukemista aloitellessasi.

6. Miten otan yhteyttä...?

Voit lähettää sähköpostia Charles Franksille.
Muihin projektin vetäjiin saat yhteyttä näpäyttämällä heidän nimeään 'Projektit' sivulla. Kukin projekti sisältää linkin k.o. kirjasta vastaavan PM:n luo.
Lisäksi "Keskustele tästä kirjasta" linkki ensiksi avautuvalla sivulla paikassa, jossa alat oikolukea kirjaa, siirtää Sinut tämän kirjan keskustelufoorumille. Se onkin paras paikka ottaa yhteyttä kirjaprojektin vetäjään tai esittää kirjaan liittyviä kysymyksiä tai tiedustella, miten tulisi käsitellä joitain ilmenneitä oikolukuongelmia.

7. Mikä on koko e-tekstin tuotantoprosessi?

Tässä on kohta kohdalta etenevä luettelo toimista, joista PM joutuu huolehtimaan luodessaan e-tekstiä:

  1. Löytää sopiva kirja ja tarkistaa Davidin 'Tekeillä' luettelo.
  2. Lähettää tekijänoikeustiedot Michael Hartille varmistuakseen siitä, että kirjan valmistaminen on laillista.
  3. Saatuamme '"selvä" tiedon lähetämme tämän Charles Franksille
  4. Otamme nyt sivuista digitaaliset kuvat skannerin avulla.
  5. Syötämme sitten nämä kuvat OCR-ohjelmalle, joka muuntaa ne tekstiksi.
  6. Seuraavaksi syötämme tämän tekstin jollekin muulle esikäsittelyohjelmalle, joka korjaa osan OCR-ohjelman jättämistä virheistä (kuten lukujen otsikot, kappaleiden sisennys, kappaleiden erottelu jne.).
  7. Nyt luomme projektin käyttäen PM websivua.
  8. Syötämme kuvat ja tekstin webpalveluun ja järjestämme ne oikolukijoiden käytettäväksi.
  9. Oikolukijat tulevat webpalveluun ja lukevat tekstin sivuja tehden tarvittavat korjaukset kuvien perusteella.
  10. Toisen kierroksen oikolukijat tutkivat sivujen tekstin uudelleen löytääkseen joitain ensimmäisellä kierroksella havaitsematta jääneitä virheitä.
  11. Jälkikäsittelijä lataa kaikki sivut ja kokoaa ne yhdeksi tiedostoksi.
  12. Jälkikäsittelijä tarkastaa tämän oikoluetun tekstin ja korjaa mahdolliset virheet käyttäen hyväksi tähän tarkoitukseen suunniteltuja erityisohjelmia.
  13. Lopullinen kopio lähetetään takaisin Charlesille, joka tarkastuttaa sen uudelleen ja toimituttaa edelleen Projekti Gutenbergille.
  14. Muut PG vapaaehtoiset tekevät vielä viimeiset varmistukset ja lisäävät kirjan PG arkistoon sekä ilmoittavat meille, kun se on kaikkien saatavilla.

Kuten näet, kirja kulkee pitkän tien, ennen kuin se valmistuu e-tekstiksi. Näitä askeleita käsitellään yksityiskohtaisemmin Projektin vetäjien FAQ:ssa.

Tämä webpalvelumme työvuokaavio näyttää materiaalin kulun sisään ja ulos sivustolla.

8. Miten saan kopion tekemistäni e-teksteistä?

Alkaessasi oikolukea kirjaa avautuu sivu, jossa on kohta "Kirja valmistunut". Valitse "Kyllä, haluaisin tulla informoiduksi, kun tämä kirja on lähetetty Projekti Gutenbergille." Jos teet näin, niin kun kirja on vihdoin lisätty Projekti Gutenbergin arkistoon, saat sähköpostitse ilmoituksen asiasta sekä linkin, mistä voit ladata kirjan itsellesi.
DP kotisivulla on myöskin viikottainen linkkiluettelo hiljattain valmistuneisiin ja Projekti Gutenbergille lähetettyihin kirjoihin, oikoluettuihin ja jälkikäsiteltävänä oleviin kirjoihin sekä juuri sillä hetkellä oikoluettavana oleviin kirjoihin.

9. Miten saan kopioita muista Gutenbergin e-teksteistä?

Voit mennä Projekti Gutenbergin webpalveluun www.gutenberg.net ja ladata kopion mistä tahansa kirjastossa olevasta kirjasta, myös DP:n kautta valmistuneista.

10. Taisin sotkea jotain (tai tein jotain väärin). Miten voin korjata tämän?

Älä hermostu. Kaikki me teemme virheitä. Jos arvelet tehneesi virheen tietyn projektin muutaman viime sivun kohdalla, palaa takaisin projektin sivulle ja tutki "VALMIS" linkkejä. Ne palauttavat Sinut tämän projektin viidelle viimeksi oikolukemallesi sivulle. Valitse haluamasi sivu, jolloin voit korjata aiemmin oikolukemaasi tekstiä.

Jos virheesi esiintyy aiemmin kuin näillä viidellä viimeisellä sivulla tai ellet ole varma jonkun yksityiskohdan käsittelystä, jätä lyhyt viesti tämän kirjan projektin foorumille (sinne pääset oikolukemisen alussa auenneelta sivulta--valitse "Keskustele tästä projektista"). Anna k.o. sivun numero (mikäli muistat) ja kerro, mitä teit. Tämän perusteella toisen kierroksen oikoukija tai jälkikäsittelijä pystyy korjaamaan sen, mikäli kyseessä todella oli virhe.

Pidä mielessä, että kaikki oikolukemasi sivut tarkistetaan uudelleen 'toisen kierroksen' oikoluvun yhteydessä. Vähän jää enää virheitä huomaamatta kahdelta oikolukijalta! Joten tee vain parhaasi äläkä turhia huoli. (Toisen kierroksen oikoluku rajoittuu 'kokeneisiin' ensimmäisen kierroksen lukijoihin [yli 100 sivua valmiiksi saaneet].)

Voit myöskin vapaasti jättää lyhyitä huomautuksia sivuille niitä lukiessasi, muistathan kuitenkin merkitä ne tähdellä, jotta seuraava oikolukija voi ne löytää. Kas näin:
      John Smyth* [**kuva liian himmeä--en saa selvää, onko se Smythe vai Smith tässä kohdin.]

11. Websivulla tuottaa ongelmia ... Kirjautua sisään/Oikolukea sivu/Saada uusi sivu

Lähes kaikki selainongelmat (ei voi kirjautua sisään, ei näe oikoluettavaa sivua, ei saa uutta sivua oikoluettavaksi, vaikka edellinen sivu on valmistunut) voidaan ratkaista varmistumalla siitä, että selaimesi asetukset on tehty seuraavalla tavalla:

  1. Keksit (cookies) sallittu/päällä*
  2. Javascript sallittu
  3. Välimuisti pois käytöstä (tai sivun päivitys 'joka kerta')

    Myöskin jos foorumien profiilisi (sijaitsee täällä) kohta "Avaa uuteen ikkunaan" on asetettu "Kyllä", niin silloin vaaditaan lisäksi:

  4. Ponnahdusikkunat sallittu* (ja varmistu siitä, ettei toinen ohjelma estä niiden aukeamista)

Näiden valintojen oikeat asetukset ratkaisevat useimmiten webpalvelumme saatavuuden ja käytön ongelmat. Jos haluat täsmällisiä esimerkkejä siitä, miten nämä asetukset tehdään eri selaimilla, tarkista viimeisimmät tiedot DPWiki viestistä painamalla tästä.

* Huom. turvallisuudesta: turvallisuus- ja yksityisyyssyistä monet käyttäjät ovat ottaneet jotkut näistä valinnoista pois päältä. Ne on palautettava, jotta DP sivusto toimisi. Valintoja voidaan kuitenkin rajoittaa:
Keksit: DP keksit ovat vain DP webpalvelua varten, joten paremminkin kuin asettamalla valinnaksi "Hyväksy kaikki keksit", voit tehdä rajoitetumman valinnan "Hyväksy keksit vain k.o. webpalvelusta".
Pop-up ikkunat: Useimpien selaimien pop-up valinnat tai pop-up sulkuohjelmat tarjoavat mahdollisuuden luetella tietyt paikat, joista hyväksyt pop-upit. Joten sen sijaan että valitsisit "Hyväksy kaikki pop-upit", voit tehdä rajoitetumman valinnan "Torju kaikki pop-upit", mutta sijoita DP websivu (www.pgdp.net) poikkeuksien luetteloon.
Huom.: näiden valintojen täsmällisen sananmuodon määrää selaimesi.

Joskus PC:n, paikallisverkon tai internet-palveluntarjoajan palomuuri taikka proxy tallettaa sivuja välimuistiinsa, mikä johtaa ongelmaan 'Saan saman sivun oikoluettavaksi yhä uudelleen ja uudelleen'. Jos tätä esiintyy omassa koneessasi, voit todennäköisesti korjata vian itse. Sikäli kuin on kyse paikallisverkosta tai internet-palveluntarjoajasta, Sinun on otettva yhteyttä ylläpitoon ongelman korjaamiseksi. Katso yllä annettua DPWiki viestiä neuvoja varten.


Tämän dokumentin muutoshistoria

06/16/2003 -- Versio 1.5: Lisäyksiä ja tyylikorjauksia, Tim Bonham.
10/27/2002 -- päivitetty versio, Charles Franks.
10/16/2001 -- alkuperäinen versio tästä dokumentista, Robert Rowe.
  Palaa: DP kotisivu,     DP FAQ Keskus,     Projekti Gutenbergin kotisivu.
 
Copyright Distributed Proofreaders (Page Build Time: 0.090) Report a Bug