PT-PG Vozes dos Voluntários

Do Project Gutenberg, o primeiro produtor de livros electrónicos (ou livros eletrônicos) grátis.

Jump to: navigation, search

Nesta secção, pedimos aos voluntários que falassem das suas experiências práticas com o Project Gutenberg, como aderiram, porque abdicam do seu tempo a trabalhar por textos Electrónicos Gratuitos, como se debruçam sobre o âmago da produção dos textos.

Algumas pessoas escolheram um formato de entrevista para as suas respostas, com perguntas predefinidas; outros escreveram, simplesmente.

Contents

Amy Zelmer

Deparei-me com o Project Gutenberg há alguns anos--só não me lembro do que estava à procura na Rede mas a ideia do PG intrigou-me. Também estava à procura de algo que me esse materiais de leitura que eu não leria habitualmente por isso não queria propriamente encontrar um livro no qual estivesse interessada--e todo o processo de encontrar um livro, descobrir se ele já estava "em curso" e depois verifica a desobstrução de direitos autorais pareceu-me simplesmente um pouco desencorajador pelo que eu conseguia reunir de informação na Rede.

Para mais, eu vivo numa pequena cidade regional da Austrália, por isso, a possibilidade de encontrar algo ou na biblioteca local ou numa livraria de livros em segunda mão, era quase nenhuma.

Felizmente, também encontrei o nome da Sue Asscher e pensei que teria de perguntar a um camarada australiano como começar. A Sue parece ter uma reserva inexaurível de livros à espera para entrar -- e fez com que eu começasse com o "Essays and Lectures" de Thomas Huxley. Já fiz agora outros cinco livros e estou actualmente a trabalhar no "The Power of Movement in Plants" de Darwin--uma bela variedade, mas ao menos preencheu o meu objectivo de ler algo de diferente.

Felizmente, a Sue também teve paciência para responder às minhas questões de iniciada acerca dos dilemas da formatação e conseguiu coordenar outros aspectos da produção, como obter digitalizações de diagramas e a revisão final. Isto significa que tudo o que eu tenho de fazer é pôr o texto.

Sou uma digitadora razoavelmente boa -- e a prática com o PG está, certamente, a melhorar a minha rapidez e precisão! (Isto serve como palavra de incentivo a outros.) Normalmente, digito durante 20 minutos de cada vez e depois faço uma pausa; tanto a minha concentração como o meu desejo de evitar as LER (lesões por esforço repetitivo ou síndroma ocupacional por utilização excessiva) dizem que é melhor encurtar as sessões mais frequentemente do que continuar durante muito tempo. Geralmente, uso o Microsoft Word 2001 para Macintosh para a primeira entrada e correcção ortográfica, depois salvo o material "apenas como texto" e faço uma leitura geral, removendo os números de página à medida e corrigindo erros que o corrector ortográfico não tenha detectado à medida avanço.

Também já fiz alguma introdução de dados para outra colecção de livros electrónicos. Contudo, eles separam o texto e enviam pequenos molhos de páginas para muitos voluntários. Acho isso bastante frustrante uma vez que é impossível ver se a nossa parcela está boa até estar tudo estar finalmente postado.

Já fiz algumas digitalizações, OCR e revisões de material mas, de um modo geral, considero a revisão atenta que é exigida muito frustrante. A cada um, o seu método.

Ben Crowder

Sou um amante de livros desde o dia em que aprendi a ler. Há muitos anos, descobri o Project Gutenberg enquanto navegava na rede e fiquei encantado ao encontrar tantos livros bons disponíveis gratuitamente. Descarreguei todos os livros electrónicos em que estava interessado e li um bom número deles. Após alguns anos, decidi envolver-me mais e, para isso, comecei a rever no Distributed Proofreaders. Gostei muito disso -- fui editor de um jornal no liceu durante dois anos -- mas senti um forte desejo de produzir textos electrónicos por minha própria conta. Eu não tinha, contudo, um digitalizador por isso a única solução que eu conseguia ver, na altura, era encontrar um livro e começar a transcrevê-lo à mão. Sou um digitador relativamente rápido e achei que isso não iria demorar muito tempo.

Então, fui à biblioteca da minha universidade, encontrei uma edição pré-1923 do "The Ball and the Cross" de G.K. Chesterton (Chesterton é um dos meus escritores favoritos) e comecei a digitar. Demorou muito mais do que eu estava à espera, com certeza mais do que 30 horas, talvez mesmo próximo das 50. Quando terminei, deparei-me com uma página no PG que mencionava que deveriam existir dois espaços entre as frases. Olhei para o texto electrónico que tinha acabado de digitar e apercebi-me, com horror, que tinha usado espaços simples ao longo dele todo. :) [1] Eu tinha a *certeza* que o PG usava espaços simples e estava convencido que o tinha lido num dos documentos do PG, ao que demorei algum tempo a habituar-me uma vez que uso normalmente dois espaços. Mas todos os textos electrónicos do PG que eu verifiquei tinham dois espaços entre as frases, por isso comecei a tarefa monótona de acrescentar um espaço extra entre cada frase (e tendo muito cuidado para não acrescentar espaços onde eles não deveriam estar). Várias horas depois, o livro estava finalmente concluído. Tinha obtido uma desobstrução de direitos autorais antes de começar por isso, em breve, enviei-o e, em poucos dias, vi essas maravilhosas palavras na minha caixa de correio: "Posted (#5265, Chesterton)".

[1] O Ben tinha razão das duas vezes: as pessoas enviaram mensagens defendendo tanto um espaço como dois. Ambos teriam sido aceites--jt

Desde então, fiquei viciado em produzir textos electrónicos. As línguas interessam-me bastante por isso encontrei um livro elementar em Islandês Antigo que alguém tinha digitalizado, fiz o OCR das imagens utilizando o DocMorph (não demorou tanto quanto estava à espera e o resultado foi bastante bom para trabalhar com ele) e apercebi-me que teria problemas a introduzir caracteres estrangeiros (como o com ganchos por baixo, etc.) Graças as Deus que existe o Unicode. Vim (o meu editor de eleição) tem um suporte para Unicode bastante bom e não demorou muito tempo a fazer uma lista dos códigos Unicode para os caracteres Islandeses.

Como disse, uso o Vim para todo o meu trabalho de edição. Consigo embrulhar as linhas em 65 caracteres escrevendo "gq", consigo usar expressões regulares para localizações e substituições (*muito* útil), consigo editar em Unicode quando preciso e consigo acelerar significativamente as coisas fazendo mapeamentos do teclado para tarefas repetitivas. (Num texto em que trabalhei, tive de acrescentar uma linha em branco antes de cada parágrafo. Cada um estava numerado mas as linhas em branco, de algum modo, ficaram de fora antes de eu ter o texto, por isso comecei a adicioná-las manualmente. O ficheiro tinha 30.000 linhas, todavia, e rapidamente me apercebi que isso demoraria *muito* tempo. Reparei então em que teclas estava a carregar para acrescentar a linha em branco entre cada parágrafo, mapeei-as com <F9> e mantive a tecla premida enquanto o Vim ia zipando o resto do texto. Acelerei o processo em um factor superior a cem.)

A biblioteca da minha universidade está bem abastecida e tem montes de livros velhos, por isso, normalmente, conto com isso quando preciso de ter uma FR&V para textos que não vou eu próprio digitar. Continuo a não ter um digitalizador/escaner por isso ou encontro textos já existentes na Internet e reformato-os para o Project Gutenberg (depois de obter a permissão, claro) ou encontro imagens na Rede e faço eu próprio o OCR ou digito os livros manualmente. Digitar manualmente demora muito mais tempo e por isso prefiro os dois primeiros métodos.

Voluntariar-me no Project Gutenberg tem sido extremamente gratificante. As pessoas são maravilhosas para se trabalhar com elas, o trabalho é divertido e sabe muito bem para uma pessoa saber que fazemos a diferença no Mundo.

Col Choat

Como comecei

As pessoas, por vezes, perguntam-me como comecei a preparar textos electrónicos para o Project Gutenberg, e, ainda que elas ESTEJAM interessadas na minha história, elas estão, na verdade, mais interessadas em descobrir se isso é algo em que elas se possam eventualmente querer envolver. O Jim Tinsley, um colega do PG, preparou recentemente um questionário como forma de estimular os voluntários já existentes a documentarem as suas experiências. Responder ao questionário parece uma forma tão boa como qualquer outra de responder à questão "como começaste?".

Onde ouviu falar do PG?

Acho que foi provavelmente num jornal ou numa revista de informática. Não me lembro bem agora.

Como é que foi o seu primeiro contacto?

Inicialmente, visitei o sítio para pesquisar livros que me interessavam para ver se tinham sido postados no PG. Foi um processo bastante linear. Descarreguei alguns textos e li alguns no meu computador ou, ocasionalmente, imprimi-os para os ler mais tarde.

Quando fiquei interessado em me voluntariar, visitei o sítio para obter alguma informação acerca de como o passar a ser. Achei um bocadinho intimidador, na verdade. Havia montes de informação mas era-me difícil ordená-la na minha mente. Havia problemas de direitos autorais, regras de edição e procedimentos para depositar os textos electrónicos. Havia uma página de perguntas e respostas e algum enquadramento e informações para aqueles que queriam subscrever as listas de correspondência do PG. Por fim, enviei simplesmente uma mensagem de correio electrónico para o Michael Hart, cujo endereço de e-mail estava listado no sítio e perguntei "o que posso fazer?". Reparo que há voluntários que ainda hoje fazem isso por vezes.

Qual foi o primeiro trabalho para o PG que você fez? Como é que correu?

Decidi preparar um texto electrónico de um livro que tinha na biblioteca de minha casa, intitulado "UNDER THE NORTHERN LIGHTS". É uma série de contos acerca do Norte do Canadá, de Alan Sullivan. Eu tinha um pequeno digitalizador "de mão" em casa, que ainda não tinha utilizado muito. Não sabia e comecei a digitalizar cerca de dez páginas e a guardá-las em ficheiros "tif". Então utilizava o programa de OCR (Reconhecimento Óptico de Caracteres, Optical Character Recognition) fornecido com o digitalizador para converter a imagem para texto para o trabalho de edição subsequente. Recentemente, comprei um digitalizador A4 com um programa de OCR topo de gama e nem acredito como continuei com aquele digitalizador de mão durante tanto tempo.

Tentei seguir as regras de edição destacadas no sítio do PG, apesar de não serem tão rígidas quanto eu desejaria. Eu queria certezas, uma vez que sentia que não sabia o suficiente para seguir as minhas próprias regras de edição. Também não tinha um bom editor de texto por isso fiz, do trabalho, mais difícil do que era preciso. Contudo, falarei mais acerca das "ferramentas do negócio" mais tarde.

Quando submeti as páginas de rosto do livro ao PG para desobstrução de direitos autorais ele foi rejeitado porque o livro tinha sido publicado em 1926. Não sei em que é que estava a pensar quando o escolhi. Apenas deve ter PARECIDO suficientemente velho. Tinha digitalizado e revisto cerca de metade e por isso abandonei-o e tentei outro. É interessante, os Australianos e residentes em outros países com leis de direitos autorais semelhantes podem agora lê-lo uma vez que se encontra no domínio público na Austrália e está agora no sítio do Project Gutenberg of Australia. Consegui, afinal de contas, terminá-lo e postá-lo no PG.

Como é que desenvolveu a sua experiência no PG a partir daí?

Penso que uma das coisa mais valiosas que fiz foi juntar-me ao grupo de discussão dos voluntários. Descobri que não precisava de tomar partido mas que podia apenas tomar atenção aos diferentes problemas levantados por outros voluntários. Em alguns dias, não existia qualquer actividade no grupo mas, então, levantar-se-ia um tópico quente (p. ex.: se alguns livros, como o Mein Kampf de Adolf Hitler, não deveriam ser aceites pelo PG, mesmo que elegíveis) e haveria muitos comentários. Apercebi-me que também poderia pedir ajuda em questões específicas relacionadas com a preparação de textos e receber respostas informativas prontas. Uma vez, quando pensava que estava a enviar um e-mail com um anexo grande a apenas UM dos membros do grupo, apercebi-me rapidamente que TODOS o tinham recebido. Alguns acharam engraçado mas eu aprendo rápido--não o fiz novamente.

Também vale a pena subscrever o boletim semanal. Existe uma ligação na página principal do sítio na rede do PG que permite ás pessoas subscrever a lista de correspondência e o grupo de discussão. Também descobri algumas pessoas com quem me comecei a corresponder por e-mail em privado, fora do grupo de discussão. Isso também me ajudou muito. Talvez seja meritório instigar um esquema de mentores, de forma a que um voluntário novo se possa dirigir a um outro, mais experiente, para obter ajuda, orientação e encorajamento. Eu estaria interessado em fazer parte disso.

Podia falar-nos do primeiro texto que produziu.

Como já mencionei, a minha primeira tentativa foi abortiva (pelo menos no princípio). Todavia, como me tinha apercebido que não havia muitos conteúdos Australianos no PG, decidi ir nesse sentido. Então descobri que já havia muitos títulos Australianos elegíveis já na Internet, sobretudo em formato HTML. Estes apenas podem ser lidos usando um navegador da rede por isso decidi que valeria a pena descarregá-los, convertê-los para ficheiros de texto, compará-los com um livro do mesmo título que era elegível para aprovação de direitos autorais do PG e, então, fazer com que fossem postados no PG. Já tinha aprendido a minha lição portanto, a partir de então obtive a aprovação sempre ANTES de começar o trabalho de conversão.

Preparei um número de textos electrónicos usando este método e aumentei rapidamente a quantidade de conteúdo Australiano no PG. Contudo, ainda queria criar um texto electrónico a partir de um livro. A minha irmã tinha-me dado, como presente, o "Australia's Greatest Books" de Geoffrey Dutton, que fez uma revista de aproximadamente cem livros e eu decidi ir trabalhando por eles. Já tinha convertido alguns a partir de HTML, como destacado acima, por isso o primeiro a ser digitalizado acabou por ser o diário de Charles Sturt que explorou o sudeste da Austrália ente 1828 e 1831. Fiquei bastante satisfeito comigo mesmo quando os dois volumes foram postados no PG.

Porque é que você ocupa as suas horas a contribuir para o PG?

A resposta simples é "porque é DIVERTIDO". É fácil inventar justificações mas visto que não há necessidade disso dever ser porque gosto. Obtenho uma sensação de realização por o trabalho que eu faço ir ficar "por aí fora" durante muito tempo. Ainda não começámos a aperceber-nos onde a tecnologia nos levará. Os livros que eu preparo estarão prontos a serem lidos por pessoas que se encontrem em qualquer parte da Terra, ou mesmo mais além, por astronautas em viagem a Marte. "Manda aí A ODISSEIA, Scottie. Sempre a quis ler."

Também tenho tido prazeres inesperados. "Conheci" algumas pessoas maravilhosamente generosas e interessantes e li alguns livros maravilhosos que não me teria dado ao trabalho de ler se não os estivesse a preparar para o PG.

Você especializa-se em algum tipo de obras ou textos em especial?

Comecei pensando que me limitaria a livros com um sabor Australiano. Mas não consigo evitar. Se vir algo em que estou interessado e já se encontra na Internet, mas não no PG, tenho de o fazer. Enviei textos electrónicos do "Ulysses" de James Joyce e obras de D. H. Lawrence e Norman Douglas. Também tenho uma longa lista de livros que gostaria de digitalizar por mim próprio, nem todos sobre a Austrália--um dia.

O que é que mais gosta no fazer um texto electrónico para o PG?

Acho que já tinha respondido a isso. Gosto de sentimento de realização, do divertimento de ler o livro e de pensar que estará disponível para tantas pessoas que, de outro modo, não teriam acesso a ele, possivelmente numa forma que até ainda nem foi inventada.


O que é que menos gosta no fazer um texto electrónico para o PG?

Por vezes o caminho não é fácil. Ocasionalmente, fico impaciente com o tempo que está a demorar e por vezes farto-me do assunto de que trata. Comprei recentemente um digitalizador com um excelente programa de OCR, que converte a imagem da página para texto, e isso permitiu-me começar uma vida nova porque é exigida menos revisão. Por vezes lembro-me que não tenho de o fazer depois descubro que, assim como assim, o quero fazer.

Onde é que você obtém os seus livros elegíveis?

As bibliotecas locais têm uma quantidade surpreendente de material elegível. A principal dificuldade é encontrar livros com uma data de publicação de 1922 ou anterior, para o PG dos EUA pelo menos. Encontrei um número de edições "fac-simile" que são reimpressões directas do originas e estes são aceitáveis. Também andei à procura em livrarias de livros em segunda mão. Encontrei recentemente uma cópia gasta do "A short history of Australia" publicado por volta de 1910 e comprei-a por 1,50 dólares australianos. Para livros elegíveis para postagem no sítio do PG Australiano, estão prontamente disponíveis edições de capa mole baratas. Estou a trabalhar agora numa, e arranquei-lhe todas as páginas para ser mais fácil digitalizar. Apenas custa alguns dólares. Também existe um número de sítios na Internet que listam livros em segunda mão para venda.

Você digita ou digitaliza? Que tipo de digitalizador/ocr/editor/processador de texto prefere?

Esta secção pode muito bem cobrir todos os "topo de gama". Tenho-me apercebido que os voluntários têm muitas ferramentas favoritas e pelo que consigo perceber, a maioria servirá. A lista abaixo abarca aquilo em que me baseio. Devo notar que trabalho num ambiente Windows, e as ferramentas estão prontamente disponíveis para tudo aquilo que pretendo fazer.

Digitalizador

Comprei recentemente um digitalizador de mesa Canon A4 sem alimentação de documentos por menos de 200 dólares australianos. Tem uma tampa com uma dobradiça para digitalizar livros e vem apetrechado com um programa de melhoramento de imagem e um programa de OCR para converter as imagens para texto.

Programa de OCR (Reconhecimento Óptico de Caracteres)

O 'Omnipage Version 9' veio integrado no meu digitalizador. Acho que não preciso de qualquer outro programa que veio com o digitalizador--o Omnipage faz tudo por mim. Consigo digitalizar, rever, verificar a ortografia e guardar o resultado num ficheiro de texto com muito pouco esforço.

Editor

Uso o Editplus, que está disponível como programa de avaliação na Internet. Permite-me ler no ficheiro produzido pelo programa de OCR Omnipage e reformatá-lo para um tamanho de linha conveniente para os textos do PG (cerca de 70 caracteres). Também permite que uma pessoa veja na página linhas de guia verticais para ajudar a verificar linhas "longas". Carreguei o "Ulysses" de James Joyce no Editplus e aguentou com ele, por isso presumo que consiga lidar com ficheiros de qualquer tamanho. Como em tudo o que uma pessoa possa querer fazer no PG, há sempre alguém mais do que disposto a ajudar nos problemas encontrados, colocando simplesmente questões na discussão dos voluntários.

Programa de FTP (Protocolo de Transferência de Ficheiros)

Alguns voluntários fazem as suas entregas para o PG por correio electrónico como anexos ao e-mail. Todavia, também é possível colocá-los no sítio do PG para processamento por FTP. O Microsoft Windows Explorer tem uma ferramenta que permite tratar disto e isso serve-me. Sei que existem muitos outros e o SmartFTP é um excelente produto grátis para aqueles que precisam de programs de FTP baseados no Windows.

Outras ferramentas

Uso o Microsoft Word para converter ficheiros em HTML para ficheiros de texto. Em primeiro lugar, corto e colo o documento em html para o word, depois converto quaisquer itálicos para maiúsculas, uma vez que os itálicos não são suportados por ficheiros de texto simples; depois guardo o documento como ficheiro de texto. Uso então o Editplus, mencionado acima, para reformatar o tamanho das linhas. Por vezes é necessário acrescentar um "regresso ao berço" ("carriage return") obrigatório no fim de cada parágrafo para satisfazer o estilo preferido para os textos do PG. Isto pode ser feito dentro do Word ou do Editplus substituindo os caracteres. Os novos voluntários talvez precisem de pedir informações acerca deste processo.

Como é que verifica o seu texto? Algumas ferramentas especiais? Corrector ortográfico? Imprime-o e lê-o? Põe-lo no seu PDA e lê-o? Tem um programa sintetizador de voz para o ler em voz alta para si a partir do seu PC?

Tentei alguns métodos diferentes. Não tenho um computador de bolso ou um leitor de textos electrónicos por isso eu tenho ou de ler num PC ou de o imprimir. O Editplus tem um corrector ortográfico que permite a uma pessoa acrescentar novas palavras, por isso uso-o para começar. Também uso o GUTCHECK, um programa desenvolvido pelo Jim Tinsley, que apanha muitos erros. Uma pessoa precisava de o contactar via PG se quisesse uma cópia. Eu viajo de comboio para o trabalho por isso faço frequentemente uma impressão para a ler para fazer a revisão final, ou uso a minha mulher se é algo que a interesse. Tenho uma lista de coisas a não esquecer, que desenvolvi ao longo dos tempos, que uso para me assegurar de que cobri tudo aquilo que precisava--mas, também, EU SOU o homem das listas.

Tem algumas dicas e truques ou rotinas especiais pelas quais passa quando prepara um texto?

Acho que já abarquei a maioria dos meus métodos. Por vezes descubro que os travessões dentro das frases precisam de atenção. Gosto de os formatar como "--" e por isso tento ser consistente e não os deixar escapar como "-". Acho que nós no PG podíamos juntar uma lista mais ou menos prescritiva de regras de edição para os novos voluntários seguirem. Assim que ganhassem experiência podiam mudá-las se quisessem. Gosto de colocar um marcador de fim ("THE END") no fim do meu trabalho em curso para que não perca inadvertidamente nenhuma parte dele e faço rotativamente várias salvaguardas do ficheiro no qual estou a trabalhar. Já "perdi" ficheiros do computador uma ou duas vezes ao longo dos anos e nunca mais quero ter aquela sensaçãozinha no estômago NUNCA mais.

Como já disse antes, tenho uma listas de coisas para não me esquecer e poderia ser útil o PG (isso inclui-me a mim, visto que o PG somos "nós") fornecesse uma lista de coisas que precisam de ser feitas para fazer com que um texto electrónico seja postado, por exemplo: aprovação de direitos autorais, digitalização, edição, revisão, colocação de informações relevantes no início do texto electrónico, etc. Toda a informação já lá está, apenas precisa de ser colocada toda junta num só documento.

Quanto tempo demora a preparar um texto?

Obviamente, isso depende do número de páginas, da eficácia do digitalizador e do número de horas que uma pessoa lhe dedica. Os dois volumes de Sturt mencionados acima devem ter-me demorado cerca de seis meses, mas estava a fazer muitas outras coisas nos entretantos. Para digitalizarmos e editarmos, digamos, o "The Prophet" de Kahlil Gibran demoraria uma fracção desse tempo uma vez que é mais fino e fácil de ler. Se uma pessoa estiver preocupada em ter uma ideia do tempo que demoraria a completar um texto electrónico, eu sugeriria que ela fizesse primeiro uma pequena revisão casual no "Distributed Proofreaders" para ter uma ideia do que está envolvido.

Trabalha sozinho ou partilha o seu trabalho em cada texto? Alguém o ajuda regularmente a rever o texto?

Trabalho geralmente sozinho, contudo a minha mulher também revê por vezes. Ela ficou interessada em rever o livro que estou a rever agora e está à espera que eu lhe forneça mais páginas. Quando eu comecei, um novo voluntário concordou em rever algo para mim (ela abordou-me) mas depois não fez nada nem sequer me enviou um e-mail a avisar que tinha mudado de ideias. Editar e rever não é para toda a gente e uma pessoa precisa de descobrir se gosta de o fazer. Contudo, a cortesia não custa nada.

Faz trabalhos para o PG regularmente ou vai e vem consoante a oportunidade o permite ou quando lhe apetece?

Tudo isso em diferentes alturas. Eu não sou um espectador de televisão ávido e prefiro fazer alguém "trabalho" (ou devo dizer "prazer"?) para o PG na maioria das vezes.

Quantos tipos de trabalhos ou livros diferentes já fez?

Uma vez que já converti muitos livros a partir de trabalhos já na internet já cobri um bom leque embora, na verdade, não tenha digitalizado e revisto muitos livros. Os que tenho feito têm sido obras de história Australiana. Mas tenho arrebanhado livros sobre filosofia, lendas aborígenes e vários romances. Uma vez que muitos sítios na internet vêm e vão, interesso-me em "agarrar" textos electrónicos e em postá-los no PG para o caso de o sítio desaparecer da internet. Tem-se tornado um passatempo em si mesmo. Descobri recentemente o "South Wind" de Norman Douglas, um livro que causou alguma sensação quando foi publicado pela primeira vez porque retratava um estilo de vida boémio. Ironicamente, eu costumava ter o livro na minha biblioteca de casa, mas prescindi dele quando precisei de espaço. Agora está no PG e posso tê-lo sempre que eu quiser.

O que é que você gosta mais no processo do PG?

A abordagem democrática, de entreajuda e amigável de todas as pessoas envolvidas é uma das coisas de que mais gosto. "Conheci" tantas pessoas maravilhosas, sem ter de "viver" com elas, se está a perceber. Não muito depois de eu me ter começado a associar com o PG, o Michael Hart enviou um e-mail par o grupo de discussão dos voluntários a avisar da morte de longa data. Pareceu que ela era uma pessoa da "família".

Uma pessoa, para se começar a voluntariar para o PG, precisa mesmo de ser indiferente a louvores e à expectativa de obter recompensas. Não está, definitivamente, nenhum dinheiro envolvido. Contudo, uma pessoa descobre rapidamente que existe lá fora uma comunidade de pessoas com um interesse comum e com as mesmas perspectivas e o mesmo interesse em fazer uma tarefa também, sem uma recompensa tangível. Porém, não existe falta de louvores e uma pessoa descobre rapidamente que não lhes é indiferente.

O que é que você gosta menos no processo do PG?

Não há muito de que eu não goste. Pelo menos nada que valha a pena referir.

Há alguma coisa que você gostasse de ver o PG fazer de modo diferente?

Existem algumas coisas; todavia, uma vez que eu não sei todas as razões pelas quais algumas coisas são feitas e, para além disso, porque tudo é feito por voluntários, não gostaria de as escrutinar aqui. Ter produzido mais de 5.000 textos electrónicos durante mais de 30 anos testemunha o facto de a maioria das coisas estar a ser feita "bem".

Se um dos seus amigos chegasse ao pé de si a pedir-lhe conselhos sobre como começar a contribuir para o PG, o que lhe diria?

Passaria algum tempo com ele(a) e trabalharia alguns dos problemas. Sei que eu teria beneficiado dessa abordagem. Apresentar-lhe-ia gradualmente os diferentes problemas que precisam de ser encarados e descobriria quais eram exactamente as suas expectativas e tentaria ajudá-lo(a) a alcançá-las.

O que é que espera que o PG seja daqui a cinco anos? E daqui a dez?

Praticamente o mesmo que é agora, espero eu. Afinal de contas, o objectivo continuará a ser fornecer "literatura de qualidade republicada digitalmente". Embora eu espere que, como qualquer outra organização, continue a evoluir na resposta a novos desafios e oportunidades. Há dez anos, quem iria pensar que estariam postados 5.000 textos electrónicos; que existiriam voluntários a operar um sítio de revisão em linha; e que existiria um voluntário a escrever programas gratuitos para ler textos electrónicos do PG? O rápido crescimento do PG nos últimos anos apresentará muitos desafios no futuro.

Ao escrever acerca de leitores de textos electrónicos, lembrei-me que brinquei recentemente com um voluntário dizendo-lhe que queria um programa para leitura de textos electrónicos por meio do qual aparecesse um holograma no interior das minhas pálpebras para que eu pudesse ler textos electrónicos com os meus olhos fechados. Quem sabe, isto pode ser possível. Porém, independentemente dos avanços da tecnologia que ocorram nos próximos dez anos, uma coisa é certa: o trabalho de todos os voluntários até à data garantirá que estará disponível uma fantástica biblioteca de livros electrónicos abarcando obras intelectuais de algumas das mentes mais brilhantes que alguma vez viveram. Os muitos voluntários que contribuíram para o PG ao longo das décadas terão dado aos futuros leitores dos livros electrónicos do PG uma dádiva maravilhosa.

Project Gutenberg of Australia

Na parede do escritório de um colega estava afixado um bocado de papel no qual estava escrita uma citação. Não me lembro agora o que era e o colega foi-se embora há algum tempo e levou o papel com ele. Porém, por debaixo da citação o autor estava identificado como "Prince Machiavelli". Eu tinha uma vaga ideia que a citação vinha efectivamente de "O Príncipe" de Nicolo Machiavelli, e pensei como poderia satisfazer a minha curiosidade. Então lembrei-me de ter lido algo acerca do Project Gutenberg e decidi ver se o livro estava postado no sítio do PG, apesar de eu não estar realmente à espera que estivesse. Escusado será dizer que o texto ESTAVA lá e consegui descarregá-lo e lê-lo inteiramente devido ao tempo passado por John Bickers e Bonnie Sala (os nomes deles apareciam no início do texto electrónico) a prepararem-no para o PG. De uma forma interessante, havia lá outras obras de Machiavelli, a que espero voltar um dia.

Mais tarde, quando enviei um e-mail para o PG a manifestar interesse em voluntariar-me, porque eu disse que era Australiano, encaminharam-me para a Sue Asscher, a Directora de Produção Australiana do PG. A Sue pediu-me para rever "A Vindication of the Rights of Women" de Mary Wollstonecraft. Também por essa altura, um jornalista tinha contactado a Sue a respeito de uma história que estava a ser preparada acerca do PG. A Sue encaminhou-me o jornalista, com a minha permissão, claro, e uma das suas primeiras perguntas foi "Há muito conteúdo Australiano no PG?" Depois de eu ter verificado a lista de textos electrónicos do PG apenas pude responder "não muito".


Por isso decidi começar a criar textos electrónicos de autores Australianos para o PG. A Sue Asscher chamou-me a atenção para o facto de existirem muitas obras Australianas elegíveis no domínio público já como textos electrónicos por isso comecei a reunir textos electrónicos e a fazê-los corresponder aos livros que tinham sido impressos antes de 1923 para que pudessem ser postados no PG. Então comecei a criar eu próprio os textos electrónicos de obras que não conseguia encontrar na internet. A minha irmã tinha-me dado, há muitos anos, um livro de Geoffrey Dutton intitulado "Australia's Greatest Books", por isso decidi começar o meu percurso pelos títulos elegíveis de uma lista de cerca de cem livros criticados por Dutton. Já tinha encontrado um número deles na internet e alguns já estavam no PG. Mais ainda havia "alguns" por fazer. Ainda ESTÃO alguns por fazer se alguém está interessado em ajudar.

Então a Sue Asscher deu-me uma mão no caminho que eu devia seguir pedindo-me que revisse um texto electrónico do "Animal Farm" de George Orwell, cuja obra tinha recentemente entrado no domínio público na Austrália. Não sabíamos onde o iríamos postar, uma vez que não está no domínio público nos EUA, mas concordei em revê-lo uma vez que o tinha lido há muitos anos e tinha gostado.

Por essa altura, decidi compor uma página pessoal. Sendo um desenvolvedor de programas, as pessoas perguntavam-me sempre acerca da internet e de sítios na rede, na crença errada de que eu sabia TUDO sobre computadores. Decidi ter uma ideia de como o desenho de uma página na rede e a manutenção de um sítio em rede funcionavam, criando um sítio que listasse todo o conteúdo "Australiano" do PG. Quando não consegui encontrar nenhum lugar para colocar o meu Orwell, que tinha recentemente revisto, decidi criar uma página no meu sítio para textos electrónicos no domínio público na Austrália, para que os Australianos e os utilizadores da internet em outros países com leis de direitos autorais semelhantes pudessem ler e/ou descarregá-los.

O Michael Hart, o fundador do PG, foi rápido em fazer-me interessar pela criação de um sítio do PG "oficial" na Austrália. Depois de registar um nome comercial, de obter o nome de domínio e de encontrar um patrocinador para alojar o sítio, o Project Gutenberg of Australia estava de pé e a funcionar.

Aconteceu tudo muito rapidamente, e como em muitas coisas que acontecem na nossa vida, tudo parece ter acontecido por acaso. Mesmo o mote do sítio "Um tesouro de literatura" foi encontrado por acaso quando eu procurei, relativamente a um outro assunto, a palavra "treasure-trove" num dicionário, para apurar se a palavra era hifenizada. Imaginem a minha surpresa quando vi "treasure-trove" definido como "tesouro encontrado escondido, sem indícios de pertencer a alguém". Isso definia EXACTAMENTE a literatura que se encontrava no PG.

A minha cooperação com o PG resultou do culminar de um interesse de uma vida inteira por livros e literatura e um interesse igualmente forte por computadores. Cada voluntário trás os seus próprios interesses particulares e capacidades para o PG e isso, juntamente com a abordagem democrática seguida pela pequena equipa executiva, é o que faz o PG a forte organização cooperativa que é. Os meus interesses e capacidades, e uma boa dose generosa de um dom para fazer descobertas por acaso, levou à criação do Project Gutenberg of Australia.

Dagny

Descobri o Project Gutenberg em 1996 e quis imediatamente ajudar porque adoro livros e queria que todos tivessem acesso a todos os livros fantásticos que mesmo hoje, com a pesquisa na Internet, são difíceis de encontrar ou muito caros quando você os localiza.

Comecei por rever algumas obras mas o que eu queria mesmo fazer era partilhar a minha colecção de Balzac com outros fãs. Descobri Balzac nos anos 1970 e recordo-me das minhas frustrações ao tentar encontrar mais do que uma dúzia de novelas das mais de cem que Balzac escreveu. Passou mais de uma década até que o meu marido descobriu um conjunto completo num alfarrabista enquanto estava de férias. Infelizmente, nem todas as pessoas têm tanta sorte.

Nas primeiras novelas que digitei para o Project Gutenberg preocupava-me com tudo: devo corrigir um erro ortográfico, deixá-lo, colocá-lo em nota de rodapé, etc. Isto precisou de muito tempo e correspondência. Agora, a minha ideia é fazer o texto tão legível quanto possível. Para mim isso significa corrigir todos os erros tipográficos que conseguir. Outros preferem mantê-los intactos. No fim de contas, não acho que os leitores se importem. Tenho-os achado, geralmente, muito agradecidos por terem encontrado algum tesouro de que tinham andado à procura. Em alguns casos de obras mais obscuras de um autor, eles nem sabiam que o livro existia -- de facto, uma descoberta fora do comum para eles.

É tão gratificante receber um e-mail de alguém a agradecer-nos por todo o nosso trabalho árduo. A maioria dos leitores não perde tempo a escrever mas os verdadeiros fãs fazem-no frequentemente e fazem com que tudo valha a pena. Até já conheci pessoas desta forma que acabaram, elas próprias, por se tornarem voluntárias do Project Gutenberg, porque queriam dar algo em troca ao Projecto do qual receberam tantas horas de prazer.

Gardner Buchanan

Material de Fonte

Antes de mais, há a questão de saber que textos eu decido fazer. Para mim, isto é bastante simples. Já sou um pouco um coleccionador de livros menor e tenho um tema pessoal: "Literatura Canadiana em Inglês" e "História Canadiana em Inglês". Não tenho nenhum problema, de todo, em aparecer com edições enviáveis de obras que se encaixem, de algum modo, neste tema. Não obstante, existem autores e obras específicos com os quais não tenho tido sorte, por isso ainda estou a rondar regularmente pelos alfarrabistas e a apanhar todo o tipo de coisas.

Os volumes elegíveis têm-me custado de 10,00-150,00 dólares por edição coleccionável, ou 0,50-15,00 dólares para uma edição de capa mole recente ou objecto numa venda de garagem. Paguei 0,50 por uma cópia elegível, mas não muito coleccionável, do Glengary School Days de Ralph Connor numa venda de garagem. Parece que alguém já se tinha adiantado a mim--já estava no acervo desde 2001. Por vezes, se estou a ponderar comprar um livro mais caro pelo qual não tenho particular interesse, regresso para confirmar a página The Online Books para ver se alguém já enviou o livro.

Uma outra forma pela qual obtenho livros é a partir do arquivo Early Canadiana Online. Eles alojam imagens de página de um acervo bastante vasto de livros velhos escritos em ou acerca do Canadá ou por Canadianos. As imagens de página servem razoavelmente bem para o OCR.

Tendo a produzir textos electrónicos de duas maneiras diferentes. Uma maneira é enviar imagens ao Charles Franks que dirige o Distributed Proofers e deixar que ele se preocupe com o OCR de fundo. Faço então a gestão da revisão distribuída o que é, sinceramente, uma actividade de baixo esforço. A outra maneira é digitalizar, fazer o OCR e rever tudo por mim. Actualmente faço uma média de dois projectos meus para cada um do Distributed Proofer.

Digitalizar e fazer o OCR

Tenho um digitalizador de porta paralela muito lento, um UMAX Astra 2000P. Encrava imenso. Avaliá-lo-ia com um 2 em 5, se não agir de modo inesperado--criando uma barra preta ao longo da página, ao meio, ao comprido--por isso tenho de digitalizar os livros de uma certa forma em redor para evitar que a barra aterre sobe o texto. Como está agora, avalio-o com um 0,5 ou 1. É glacialmente lento na melhor das alturas e, devido a ser um modelo de porta paralela, tranca todo o meu computador durante a digitalização.

Não obstante, adequa-se totalmente às minhas necessidades para o trabalho do PG. Já digitalizei com ele mais de uma dúzia de livros e tem feito um trabalho diligente--apesar dos defeitos. Podemos apanhar digitalizadores usados como este por 30 dólares, e compensam o dinheiro.

A maneira como trabalho quando estou a produzir eu próprio um livro é digitalizar e rever página a página. Faço as digitalizações em página dupla, depois faço o OCR, revejo e copio as páginas para um documento de trabalho, antes de prosseguir para a digitalização do par de páginas seguinte.

O meu digitalizador veio com dois "pacotes" de OCR: o Omnipage ou coisa que lhe valha, que nunca consegui instalar, e o Recognita Standard 3.2.7. Eu uso o Recognita, e para as digitalizações a 300dpi que faço tem uma velocidade e precisão adequadas. É um pacote básico e DÁ muitos erros mas é inteiramente utilizável para os meus propósitos. Avalio-o com um 2 em 5.

Já usei a versão de avaliação do Abbyy FineReader 5.0. Este sistema de OCR é magnífico. Aguenta com enormes molhos e é rápido e assombrosamente preciso. Avalio-o com um 5 em 5. Infelizmente custa quase um milhão de dólares receber um item comprado pela internet no Canadá e, ainda que tenha um preço muito razoável de 100,00 dólares, custar-me-ia 600 dólares Canadianos depois da taxa de câmbio, taxas de corretagem, expedição, mais taxas, taxas, taxas de serviço e mais taxas sobre as taxas.

Eu podia comprar o Omnipage directamente da prateleira aqui mas, sinceramente, se não consigo ter o Abbyy, fico-me pelo Recognita.

Assim que digitalizo cada página, colo-a no Windows-95 Wordpad. Por vezes, também faço algumas revisões no Wordpad mas revejo, corrijo citações, travessões e quebras de parágrafo principalmente no programa de OCR antes de copiar para o Wordpad. Gosto de manter as fronteiras das páginas intactas e marco-as no meu documento do Wordpad assim:

kjdk ldjd ll;llkj dklj dklj
kjdk ljd llllkj klj dklj

página 354

kjdk ldjd lll;;llkj dklj dklj
kjdk ldd lll;;llkj dklj dklj
kjdk ldjd ll;llkj dklj dklj
kjdk ljd llllkj klj dklj

página 355

kjdk ldd lll;;llkj dklj dklj
kjdk ldjd ll;llkj dklj dklj
kjdk ldd lll;;llkj dklj dklj
kjdk ljd llllkj klj dklj

Nesta altura também corrijo as palavras hifenizadas que se dividem entre duas páginas. Presto atenção aos parágrafos que começam numa nova página e marco-os com um <p>, e presto atenção às secções avançadas ou com citações em bloco e marco-os com <in>..</in>. Isto ajuda quando regresso para os formatar uma vez que consigo ver facilmente onde se encontram esses casos especiais.

O Wordpad aguenta razoavelmente bem documentos grandes e compreende bem os ficheiros UNIX (i.e.: apenas <LF>, não <CR><LF>). Por isto, avalio-o com um 3.


Rever e Formatar

Quando todo o texto está reunido, seja por mim ou pelos Distributed Proofers, uso praticamente o mesmo o processo para formatar e fazer a revisão final.

Uso o MS-Word 95 para fazer uma verificação ortográfica. Este, avalio-o com um 3 em 5. Selecciono todo o texto e a língua apropriada - para mim, normalmente prefiro o Inglês do RU em vez do Americano. Gostaria de ter um dicionário de Inglês Canadiano para o Word 95 mas ainda não precisei o suficiente disso para começar a procurar. O Word tem um corrector ortográfico bastante bom e os dicionários personalizados são fáceis de lidar. Uso um dicionário personalizado para cada trabalho grande - tenho um para o Chronicles of Canada e outro para todos os livros de John Richardson que fiz.

Nesta altura no meu processo pessoal abandono o Windows e passo para o FreeBSD.

Uso o vi (avaliado com um 9 em 5) para corrigir uma sério de brechas. Procuro e corrijo hifenizações quebradas (sem- par) e outros que tais. Também procuro e corrijo alguns erros especiais de OCR 'rnar'->'mar' e 'ler'->'ter'. Isto por vezes vai exigir mais tempo mais tarde, para passar por todos os ler e ter para ver se estão correctos.

Ainda no vi, a segui uso algumas fórmulas mágicas para correr o comando 'fmt' do UNIX em cada parágrafo para os reformatar. Uso:

fmt -55 60

O Fmt leva uma nota 3 em 5 para aquilo de que eu preciso dele. Isto coloca dois espaços depois das frases o que--apesar de ser provavelmente a melhor coisa a fazer--não é a convenção do PG (pelo menos para mim). Também acrescenta um espaço quando junta linhas com um travessão. Volto e corrijo cada uma destas coisas utilizando o vi. Tomo em linha de conta as etiquetas <in></in> e faço a formatação em conformidade nesta altura.

Enquanto reformato, dou uma revisão final ao texto. Tenho o texto original à mão nesta altura e uso os marcadores de página (lembram-se deles) para perceber onde estou. Enquanto reformato, apago os marcadores de página e outras marcações. Quando acabo este passo, o livro está quase feito.

A seguir uso o Gutcheck 0.2 (nota 5 em 5, para o fim a que se destina - boa, Jim!) para verificar todas as coisas que ele verifica. Nesta altura obtenho qualquer coisa como 50 avisos, dos quais 30 são reais. Então regresso ao vi e corrijo todos esses problemas. Finalmente, acabei.

À medida que vou avançando, tendo a guardar várias versões do documento. Neste preciso momento estou na versão 27 do 'The Imperialist'. Cada digitalização, edição, verificação ortográfica ou qualquer tipo de sessão recebe uma nova versão: imperialist_12.txt, imperialist_13.txt,... Em alturas diferentes posso achar útil utilizar os 'wc', 'grep' e 'diff' para descobrir o que se passa, onde uma palavra aparece ou se apaguei algo que não queria.

Recolher Imagens de Página

Mencionei acima que por vezes trabalho a partir de imagens de página que obtenho na rede. Existem vários arquivos por aí que mantêm materiais elegíveis como imagens de página que você pode facilmente descarregar e fazer OCR. Pessoalmente tenho trabalhado principalmente com o arquivo Early Canadiana Online.

Depois de remexer um bocado no interface na rede desta colecção, consegui perceber como as páginas individuais são numeradas e organizadas. Escrevi alguns scripts em shell que eu consigo utilizar para irem buscar todas das páginas de um volume e convertê-las dos formatos GIF para TIFF. Recolher um livro de 200 páginas demora algumas horas.

Assim que tenho todas as páginas, tenho de fazer algum trabalho com um editor de imagem para as preparar para o OCR. Uso o Corel PhotoPaint 7 para cortar cada imagem apenas para a área do texto e para remover as faixas negras nos lados devido à lombada ou ao que seja. As imagens de página são normalmente feitas a partir de microfichas e as marcas se sujidade também são comuns. Estas, consigo por vezes editá-las com o PhotoPaint.

Porque certas imagens de página, ou certas secções delas, podem ser completamente ilegíveis, dou por mim frequentemente a seguir o rasto a edições modernas ou a visitar a biblioteca de uma universidade local para descobrir uma cópia do livro para procurar alguns parágrafos ou passagens que não estão legíveis nas imagens. Mesmo tendo de fazer isto, acho que a apanha de imagens do arquivo ainda poupa bastante tempo e permite-me aceder a uma edição que, de outro modo, estaria completamente inacessível.

Tendo recolhido as imagens e tendo-as preparado para o OCR, envio-as de seguida para o Charles do Distributed Proofers, ou trato eu mesmo delas, utilizando o mesmo processo que utilizaria se as estivesse a digitalizar.

Distributed Proofers

Já fiz vários livros usando o excelente aplicação em rede Distributed Proofers do Charles Franks. Tendo a escolher o DP quando não tenho tempo pessoal para ler e rever um volume sozinho ou quando a pobre qualidade do texto desafia a capacidade (não muito grande) do meu pacote de OCR.

Quando digitalizo para o DP, digitalizo na mesma em página dupla. Tenho então uma colecção de scripts em shell que cortam as imagens a meio para produzir ficheiros TIFF de páginas únicas. Sigo então um procedimento manual com o Corel PhotoPaint 7 - se necessário - para corrigir páginas distorcidas ou com margens pretas. Na maior parte das vezes, as imagens de página que eu próprio digitalizo ficam suficientemente registadas na minha área de digitalização de maneira que as imagens de página não precisam de ser editadas.

As imagens de página que eu recolho da rede precisam mesmo de ser corrigidas antes de poderem ser usadas pelo DP.

O Carles, acho, preferia que, como gestor do projecto, eu tratasse do meu próprio OCR. Mas ele, contudo, tem sido simpático o suficiente para correr vários molhos de imagens de página pelo seu OCR por mim para ter bons resultados. Acho que ele usa o Abbyy Finereader, e o meu procedimento para enviar páginas ao Charles é correr um subconjunto de páginas que pretendo enviar-lhe por uma versão de demonstração do Finereader para me assegurar que os resultados são vagamente aceitáveis. Se tudo parecer bem, aí vão elas.

Quando o projecto percorreu todo o caminho pelo DP, eu descarrego o texto completo e continuo a formatá-lo e reformatá-lo, na maior parte, como se eu o tivesse digitalizado e tivesse feito eu próprio o OCR.

Jim Tinsley

Como é que eu (finalmente) comecei.

Há cinco anos atrás, eu era o novato mais ignorante que alguma vez tentou voluntariar-se para o PG. Se você se sente perdido sobre como ajudar o PG, pode ter a certeza que não está sozinho! E se eu consegui escrever as primeiras Perguntas Frequentes Completas do PG depois do meu mau começo, você poderá certamente fazer melhor! :-)

Em 1997, existia o sítio na rede mas não existiam Perguntas Frequentes, nem Painel de Voluntários, nem gutvol-d, nem sítios de Distributed Proofing. Comecei fazendo uma doação e enviando um e-mail ao Michael, sugerindo que eu poderia ajudar em tarefas pequenas ou em programação. Não fiquei com nenhumas e não tinha ideia o que, se é que alguma coisa, eu poderia fazer sozinho.

Olhei para a lista em curso da altura e enviei um e-mail a algumas pessoas que apareciam listadas como estando a trabalhar nos livros, a oferecer ajuda. Nenhum deles estava ainda a trabalhar nos livros. (Nós já não mostramos mais os endereços de correio electrónico das pessoas na lista InProg). Ainda não fazia ideia como arranjar livros elegíveis, não tinha digitalizador e não fazia ideia de como abordar a produção de um livro electrónico.

Subscrevi o Boletim mensal e li-o simplesmente durante um ano. Numa edição "O Project Gutenberg precisa de SI", a Dianne Bean, na altura Directora de Produção dos EUA, era dada como contacto. Enviei-lhe um e-mail e, finalmente, as coisas começaram a acontecer.

Ela enviou-me uma coisa pequena para eu fazer uma segunda revisão e esplicou-me que eu apenas tinha de corrigir tudo o que precisasse de ser corrigido. Eu devolvi-a e ela apresentou-me o Bill Brewer que, na altura estava a digitalizar o Wisters a uma velocidade impressionante. Ele e eu formámos uma equipa de digitalização e revisão durante algum tempo.


Como comecei a produzir e os meus problemas com a digitalização e OCR.

Eu tinha algumas ideias de livros que queria produzir mas não os conseguia localizar perto de mim, por isso virei-me para a Internet e descobri quão fácil é encontrar e comprar livros usados em linha.

Comprei um digitalizador de mesa da HP. Vinha com um programa de OCR gratuito-- "PrecisionScan"--com imagens e OCR tudo na mesma interface.

Digitalizei o meu primeiro livro que felizmente tinha um texto grande e nítido e o OCR fez um trabalho razoável a partir dele, de acordo com os meus critérios na altura, que ter qualquer texto que fosse sem ter de o digitar era uma forma de magia :-)

Sei agora que poderia ter feito um trabalho melhor se tivesse pressionado a lombada com mais força para baixo, ou se tivesse fechado o topo para evitar que a luz ambiente entrasse ou tivesse escurecido o quarto, e feito cada digitalização mais exacta. Sou muito melhor no digitalizador de mesa agora.

O meu programa PrecisionScan reconhecia efectivamente duas páginas e lidou bem com elas, apesar de IIRC colocar alguns caracteres de lixo entre as páginas, os quais tive de remover à mão.

Precisou, de facto, de muita edição, contudo, e regressei recentemente ao meu texto original e encontrei montes de erros. Em parte devido à digitalização, em parte devido à minha falta de experiência.

Ao longo da edição, tinha de ir tomando decisões de formatação no vácuo, reinventando rodas e aplicando as regras de um Como-Fazer. Agora, tendo lido e formatado e revisto e produzido tantos textos, já sei simplesmente como formatar um texto sem pensar e ter lido ou mesmo passado os olhos opr alguns textos antes de produzir o meu ter-me-ia dado muitos conhecimentos prévio e poupado montes de tempo. Já tinha revisto vários textos mas nunca tinha pensado em olhar atentamente para as decisões de formatação.

Esse texto levou-me um mês de trabalho, quase todas as noites, e muita perseverança. Sei admirar o esforço que um voluntário tem de fazer para produzir o seu primeiro texto se recuar até esse mês. Acho que é o não-se-saber-muito-bem-o-que-se-está-a-fazer que é a pior parte. Lembro-me de ficar tãããão descansado quando o enviei para uma segunda revisão.

O sujeito que ficou com ele para a segunda revisão não me disse nada durante um mês e depois disse que não a ia fazer. Foi decepcionante. Enviei-a para outro sujeito a rever. Respondeu-me depois de algumas semanas a fazer algumas perguntas. Respondi-lhe. Depois de mais algumas semanas, reenviei-lhe outro e-mail. Sem resposta. Algumas semanas depois disso, desistir, e enviei simplesmente o ficheiro para postagem.

O livro seguinte que eu produzi não tinha um tipo de letra assim tão bom, nítido e grande e a digitalização era aquilo a que eu chamaria hoje abismal. Diria que transcrevi de novo cerca de um quarto do livro. Quanto menos se disser acerca desse, melhor.

O meu terceiro livro não conseguia fazer o OCR de uma forma perceptível. A impressão era muito pequena e desmaiada e o OCR produziu coisas sem nexo. Mesmo com os meus baixos padrões não me conseguia iludir que isto estava a funcionar. Tentei 400dpi, 600dpi. Sem hipótese. Conseguia ficar com 10 palavras completas numa página.

Foi nesta altura que comprei o TextBridge. Não tinha mesmo ideia da diferença entre os programas de OCR gratuitos que davam com os digitalizadores e um produto comercial genuíno mas estava desesperado por tentar algo diferente que conseguisse ler aquela imagem.

O Textbridge abriu-me os olhos. Continuava a não fazer um bom trabalho nas imagens más mas fez tentativas decentes em talvez metade delas e, depois de o comprar, tentei usá-lo nos dois livros que tinha estado a trabalhar tão arduamente antes--deu resultados enormemente melhorados. O livro que apenas tinha sido 75% reconhecido passou a 100%, mas com alguns erros. Amaldiçoei o tempo que tinha perdido a compensar as diferenças do pacote que me tinha sido oferecido.

Desde então, continuei a actualizar o meu TextBridge (penso que comecei na versão 8 e estou agora na Millennium) e compre o OmniPage e o Abbyy. Agora uso sobretudo o Abbyy 6.

Da última vez que reparei, havia versões de teste descarregáveis do Abbyy, TextBridge, e OmniPage. Descargas grandes, contudo.

No ano passado comprei um digitalizador Epson Perfection 1640 novo para substituir o meu antigo HP Scanjet. Nunca tive queixas do Scanjet propriamente dito--servia-me bem-- mas o Epson novo é mais rápido, tem uma maior resolução e ADF.

Melhor ainda, agora sei digitalizar. Sei como processar mais de 200 páginas numa hora, digitalizando o livro espalmado, duas páginas de cada vez. Sei ajustar as definições para digitalizar apenas a área ocupada pelo livro. Tento várias definições em cada livro para ver qual resulta.

Tanta coisa sobre digitalização e OCR. Eu era um aprendiz muito lento nesta área.

Como preparo um texto agora.

Nunca fui muito mau na parte de rever as coisas. Como editor, uso o Brief no DOS e o Crisp (um clone do Brief) no Windows. (Uso principalmente o vi no *nix, mas faço muito pouco ou nenhum trabalho do PG no *nix para além de um script ocasional que posso fazer numa linha de Perl mas que seria maçadora no MS).

Agora, eu sou pela tolerância e igualdade no que se refere às crenças das outras pessoas :-) mas tenho de dizer que para qualquer pessoa habituada a um editor poderoso, editar com o Word ou qualquer editor padrão do Windows é como coçar o nariz com um ancinho.

Quando acabo de tirar o texto do OCR, tenho muitas páginas com quebras entre elas e, normalmente, sem linhas de espaço entre os parágrafos, mas com cada parágrafo avançado.

Saco do Crisp e corro uma macro para pesquisar e destruir todas as quebras de página, números de página e linhas em branco pelo meio e, depois, outra para colocar as quebras de linha entre parágrafos e para lhes remover os avanços. Uma vez que eu observo este processo cuidadosamente para evitar estragar as citações, isto demora-me talvez 15 minutos.

Tenho agora um texto basicamente formatado. O tamanho das linhas é geralmente muito curto e existem palavras hifenizadas no fim das linhas que eu preciso de juntar e algumas que não . Em cada hífen, decido simplesmente se as devo juntar ou não. Digamos, 20 minutos no máximo. Depois reembrulho o texto. Mais 15 minutos.

Por isso, em talvez uma hora tenho um texto pronto para rever e a parte realmente boa nisso é que passei de leve por todo o texto três vezes por isso já reparei em quaisquer particularidades.

Se me apercebi de algumas características especiais, como letras ou poemas que precisam de tratamento especial, faço-o nesta altura.

Para preparar um texto para revisão, dou simplesmente uma olhadela sobre ele no Crisp com o corrector ortográfico ligado, em Inglês dos EUA ou do RU consoante necessário. Isto coloca uma linha vermelha em baixo das palavras duvidosas, tal como no Word. Demoro cerca de 5 a 10 segundos por cada monitor cheio com 50 linhas. Não espero apanhá-los todos; isto é apenas uma passagem curta p'ra reduzir o número de erros. Também posso apanhar alguns problemas de formatação mas não olho para eles.

Agora, revejo.

Já tentei rever de montes de maneiras. Na maior parte das vezes é só sentar-me à frente do monitor. Por vezes imprimo o texto, ou partes dele, e marco os erros com uma caneta. Ocasionalmente, ponho o computador a ler o texto por mim, e acompanho-o lendo o livro, anotando quaisquer erros. (Isto é bom quando você quer um nível muito elevado de precisão - substitua ":" por "dois pontos", "," por "vírgula" e por aí em diante antes de ligar o leitor.) Recentemente, tentei ler o texto no meu PDA e marcar os problemas.

Qualquer que seja a maneira como o faça, demora tempo. Sou melhor agora do que era antes mas ainda tenho tendência para deixar escapar coisas como urna/uma.

Algumas pessoas têm mais confiança em alguns tipos de letra em especial para fazerem a revisão, dizendo que a fonte X mostra as diferenças "1"/"l" mais claramente do que a fonte Y. Eu uso Arial ou Verdana para quando faço impressões e Courier ou Fixedsys quando vejo no monitor; as fontes especiais parecem não me fazer diferença.

Portanto, já acabei a revisão e já fiz as minhas correcções. Agora deixo-as estar quietas durante alguns dis. Preciso de as tirar da minha cabeça, para que não deixe escapar os mesmos erros que deixei escapar antes.

Quando regresso, estou a olhar para aquilo a que a gente da programação chamaria Versão Candidata e dá-se uma mudança na minha mente . . . Encaro-o de uma forma diferente, não como um trabalho em curso mas como um projecto potencialmente terminado. Isto torna-me muito mais crítico e menos disposto a aceitar erros.

Normalmente existem problema os traços para corrigir (travessões com " - " em vez de "--") e outras pequenas coisas como esta. Faço pesquisas globais para " -" e "- " e "...".

Dou uma vista de olhos rápida pelo texto, escolhendo aqui e ali alguns parágrafos de amostra para testar a sua qualidade. Faço quaisquer ajustamentos de formatação, como o espaçamento de linhas dos capítulos ou o avanço das letras, em que repare.

Então, corro o gutcheck. O Gutcheck é um pequeno programa que eu escrevi / estou a escrever / escreverei ao longo dos anos que acusa problemas comuns num texto do PG . . . comprimentos de linha errados, erros tipográficos comuns, números dentro de palavras (como o "1" dentro de "g1obo"), aspas desequilibradas, pontuação espaçada ou não espaçada, caracteres não-ASCII. Corrijo os problemas para os quais o Gutcheck chama a atenção.

Novamente, ligo o corrector ortográfico no Crisp e dou uma olhadela pelo texto, mais lentamente do que na primeira vez. Desta vez, procuro tudo aquilo que não deveria estar no texto do PG.

Corro o gutcheck novamente só para me certificar.

E aí vai ele!

A Equipa de Postagem

Durante alguns anos, produzi um texto regularmente a cada dois meses, passando cerca de 40 horas em cada um, e pegava em alguma revisão ocasional mas desde que me tornei moderador do Painel de Voluntários as pessoas começaram a enviar-me textos para verificação ou reformatação. Isto começou a levar cada vez mais do meu tempo disponível do PG e a minha própria produção abrandou em conformidade.

Foi como resposta a estes pedidos que eu escrevi o gutcheck, que incorpora todas as confirmações-padrão não ortográficas que eu correria num ficheiro. O gutcheck permitiu-me passar menos tempo em cada texto ao mesmo tempo que podia estar razoavelmente certo que não havia nada de aberrantemente errado nele.

Quando o Michael formou a Equipa de Postagem no ano passado eu voluntariei-me e isso foi uma progressão natural para mim uma vez que eu já estava habituado a fazer muito trabalho de última hora nos textos.

No início, achei a postagem desorientadora e confusa; as pessoas bombardeiam-no com pequenos fragmentos de informação acerca dos livros que devem ser postados; alguns textos precisam de trabalho sério; alguns textos não foram desobstruídos e precisam de ser encaminhados de volta; algumas pessoas querem um tratamento especial nos seus textos, o que pode entrar em conflito ou com os meus pontos de vista ou com os precedentes do PG, ou com ambos; há montes de perguntas. Mas como qualquer outro novo trabalho, apenas é preciso algum tempo para aprender os pormenores.

O processo de postagem propriamente dito demora agora muito pouco tempo: posso passar pelos passos necessários em 3-5 minutos. Mas os postadores são a última linha de defesa contra erros e mesmo os voluntários mais cuidadosos os cometem (e sim, nós também!). Demora um mínimo de 15 minutos a correr as verificações-padrão num ficheiro perfeitamente limpo e ode demorar vários horas a corrigir um ficheiro que precise de ajuda. Em média, demoro uma hora a fazer o meu melhor razoável por cada texto enviado.

Para além da postagem propriamente dita, há montes de perguntas a serem respondidas, a maior parte dad quais espero ter resolvido nas PergFreq, "casos especiais" que comem tanto tempo quanto o que estou disposto a dar-lhes, correcções a serem feitas nos textos existentes, e debates intermináveis sobre se o PG deveria fazer isto ou aquilo.

Agora que já passei a curva da aprendizagem, o problema com a postagem é que ela gera montes de e-mails e discussões e come mito tempo e é um compromisso de 7 dias por semana. Tendo postado mais de mil textos, estou agora particularmente interessado em melhorar a qualidade dos textos.

John Mamoun

Como criar um texto electrónico eficaz ou automaticamente é um problema lógico interessante. Aqui fica o procedimento que sigo, que usei recentemente para produzir um texto electrónico em aproximadamente uma semana com talvez 6 horas de trabalho da minha parte:

Pego no livro e uso a lâmina de um x-acto para cortar todas as páginas do livro. Então alimento com as folhas um digitalizador HP 4C com um acessório de alimentação automática de documentos que comprei no E-bay por 200 dólares. Alimento-o com até 50 páginas de cada vez e ele digitaliza-as automaticamente.

Trabalho com o digitalizador usando um programa chamado scan2000, da www.informatik.com (30 dias de período de avaliação, 50 dólares para registar). Este programa trabalha automaticamente com o digitalizador para guardar cada imagem como um ficheiro TIFF de formato padrão CCITT4. Mais importante, numera automaticamente cada página, começando com o valor inicial que você especifica (tipicamente 001.tif) e aumentando o número no nome do ficheiro com um aumento que você especifica (normalmente em duas páginas, uma vez que pode digitalizar páginas duplas; você primeiro digitaliza as páginas pares, depois roda as páginas ao contrário e digitaliza as ímpares, mas quer que os números de página estejam por ordem, certo?). Portanto o digitalizador produz como resultado, digamos, 001.tif, 003.tif, 005.tif, etc., então viro as páginas ao contrário e volto a alimentar o digitalizador com elas; as páginas pares são guardadas como 02.tif, 004.tif, etc., depois de você dizer ao programa para começar o primeiro dos ficheiros das páginas por 002.tif.

Tenho agora um molho de ficheiros TIFF CCITT4 numerados consecutivamente. Nesta altura poderia usar um programa grátis chamado cc42 (procurem-no em www.pdfzone.com) para combinar todos os ficheiros TIFF CCITT4 numerados sequencialmente num ficheiro PDF com as páginas por ordem.

Ou, ao fazer textos electrónicos e não ficheiros PDF, faço o OCR das páginas e guardo-as como páginas correspondentes como 001.txt, 002.txt, etc. Também uso o Paint Shop Pro (programa com 30 dias de avaliação) para converter em molho os ficheiros tiff para o formato de ficheiro GIF. Posso então carregar os ficheiros GIF e os ficheiros de texto correspondentemente numerados para a página do Distributed Proofreaders (http://texts01.archive.org/dp) para que sejam rapidamente revistos por inúmeros revisores, que concluem a tarefa a um ritmo de 50-100 páginas por dia, vagamente falando. Quando isto está feito, descarrego os ficheiros de texto como um ficheiro de texto único que combina todos os ficheiros. A função de carregamento do sítio do DP é cansativa, exigindo a uma pessoa que carregue os ficheiros um a um mas falei com o administrador do sítio recentemente e ele disse-me que existem, com ajustamentos especiais, formas de os enviar por FTP ou mesmo por e-mail para ele em CD.

Agora, os retornos obrigatórios. Já foi outrora um problema grave corrigir os retornos obrigatórios para que o texto aparecesse em 65 caracteres por linha. Depois arranjei um programa grátis chamado Clipcase em www.shareware.com. Com o Clipcase, você selecciona um corpo do texto (cerca de 20 páginas ou assim; mais e o programa bloqueia) no seu processador de texto, copia o texto para a área de transferência, depois carrega o Clipcase, cola o texto na janela do Clipcase e processa o texto.

Quando isto acontece, todos os retornos obrigatórios dentro do texto são eliminados, EXCEPTO os retornos entre parágrafos. Então, você selecciona o texto, copia-o e cola-o em qualquer processador de texto para o processar. Eu uso o Microsoft Word. Depois de colar todo o texto para lá, selecciono todo o texto, escolho o tipo de letra Courier New, tamanho 10, e defino as margens para 14 cm. Com esta definição, quando guardo o texto como "Text with layout," o texto resultante fica com 65 caracteres por linha, em cada linha.

Depois faço uma verificação ortográfica do texto e dou-lhe uma olhadela para procurar erros tipográficos e "categorias" de erros que tendem a ocorrer repetidamente dentro do texto. Um erro comum é ter um só traço em vez de dois, por exemplo:

Ele prolongou-se-por muito tempo.
em vez de: Ele prolongou-se--por muito tempo.

Outro erro comum é um espaço entre o ponto final, o ponto de exclamação ou outro sinal de pontuação e a letra que estava antes dele, como:

Hey !
em vez de Hey!
ou " Hey, "
em vez de "Hey,"

Uso então o comando "Localizar e substituir" dentro do Microsoft Word para me ver livre dessas coisas com eficácia. Por exemplo, posso dizer-lhe que localize ^w", em que ^w significa "um espaço em branco" e " é uma aspa. Isto localiza espaços em branco antes das aspas. "^w localiza espaços em branco depois de aspas. ^w! significa um espaço em branco antes de um ponto de exclamação. Também o posso pôr a pesquisar por "qualquer letra"-"qualquer letra," para que encontre traços simples entre letras, e posso então decidir se quero substituí-los por traços duplos. Utilizando este género de truques de localizar/substituir torna-se mais fácil remover erros tipográficos.

Quando acabo, guardo como "texto com quebras de linha" e está feito.

Este é basicamente o meu procedimento. Uma semana e 6 horas de trabalho da minha parte para um ficheiro de texto com 190k...

Ken Reeder

A História da Minha Vida (no que se refere ao PG), por Ken Reeder Junho de 2002

Estou neste momento a acabar o meu quarto texto electrónico, com mais dois textos electrónicos em processamento, outros sete livros à espera na prateleira, e mais um monte de livros adicionais que gostaria de fazer quando esses estiverem prontos.

Há dezasseis meses eu era alegremente desconhecedor do PG e do mundo dos livros em linha. Duas coisas parecem terem-se juntado para me levarem a envolver no PG. Eu passei algum tempo a ajudar um dos meus filhos, para um projecto da escola, procurando sem sucesso uma tradução em linha em Inglês da Historia Naturalis de Plínio. Cerca de um ano antes disso tinha estado tentar experimentar, sem nenhuma razão em particular, transcrever um dos meus livros de ficção científica favoritos para um ficheiro de texto. E tinha estado a pensar, ocasionalmente enquanto alguns anos passavam, acerca de uma colecção de livros da qual eu era avidamente devoto quando tinha cerca de doze ou catorze anos, que estava largamente disponível na altura mas que agora é relativamente escassa. Foi uma pesquisa na Rede do nome do autor, Joseph Altsheler, que por acaso me levou a umas mensagens já com alguns anos no boletim do painel de voluntários do PG.

Explorei o sítio do PG durante um bocado e pensei, olha!, acho que isto é capaz de me interessar. Uns meses antes, por nenhuma razão em particular, eu tinha comprado um antigo digitalizador de mesa paralelo (pelo qual paguei 36 dólares, incluindo os portes de envio). O pacote do digitalizador incluía alguns programas de OCR, portanto eu já tinha o básico para digitalizar um livro e produzir um texto electrónico.

Por isso investiguei o sítio na rede do PG durante mais um bom bocado e espreitei o painel de voluntários e descobri que eu podia encontrar os livros que pretendia no Ebay ou no ABEbooks e comprei alguns livros por 10 ou 15 dólares cada um. Digitalizei um capítulo ou dois e experimentei fazer o OCR, que funcionou muito bem. (O programa de OCR que veio com o meu digitalizador era o TextBridge Pro, que parece ser um dos mais bem cotados no mercado, por isso tive sorte a esse respeito pois não fazia a mínima ideia. Podia ver que o programa de OCR era claramente melhor do que alguns programas do DOS que eu usava no trabalho há 15 anos atrás.)

O que me chamou a atenção foi que, primeiro, isto pareceu-me uma coisa que valia a pena ser feita, com o grande bónus de você poder fazer o seu trabalho a partir de casa, de pijama, se quiser, em qualquer altura que possa dispensar. Eu pensava que, sendo um daqueles programadores minuciosos, eu iria gostar disso e ser bastante bom - na verdade, sempre tive aptidão para a revisão.

Portanto fui em frente e enviei por e-mail algumas FR&V para desobstrução de direitos autorais e preparei-me para efectivamente produzir o meu texto, um livro de 348 páginas que eu completei em 10 semanas, do princípio ao fim.

Para um livro com uma impressão nítida, com um bom tamanho, calculo que chegue a uma média de 7 ou 8 minutos por página para passar pelo meu processo de produção completo. Alguns dos livros nos quais estou a trabalhar, com impressões mais pequenas ou menos perfeitas (e/ou outras complicações) demoram um pouco (ou muito) mais.

Acho que já tenho o meu processo bem definido por esta altura. Juntei vários programas utilitários caseiros, escritos em FoxPro, que me prestam assistência. (Dediquei algum esforço para tentar adaptar alguns delas para serem eventualmente utilizados por outras pessoas mas o problema é que é preciso muito mais trabalho para polir os programas até ao ponto em que me sinta confortável deixar outras pessoas explorarem-no e o âmbito daquilo que eu pensava que o programa era suposto fazer aumenta de cada vez que trabalho nele e não é nem de perto tão agradável - para alguém que desenvolve programas no trabalho todos os dias - como produzir textos electrónicos.)

O meu processo de produção completo, com os tempos aproximados, é o seguinte:

  1. Digitalizar o livro, duas páginas de cada vez, cerca de 1 minuto por digitalização (30 segundos por página). (Não arranco as páginas do livro, coloco-o simplesmente no digitalizador e carrego na lombada.)
  2. Correr o ficheiro BMP pelo TextBridge Pro, cerca de 30 segundos por página. (Novamente, quando estou a trabalhar com impressões com um bom tamanho e nítidas.) Fico, como resultado, com um texto sem quebras de linha.
  3. Correr um pequeno utilitário FoxPro que eu escrevi e que limpa e formata um pouco o ficheiro.
  4. Fazer uma primeira passagem de revisão, cerca de dois minutos por página, combinando as páginas em capítulos.
  5. Correr outro pequeno utilitário FoxPro, que verifica algumas coisas que me possam ter escapado durante a revisão.
  6. Usar o MS Word para efectuar uma verificação ortográfica e gramatical, mais 30 a 60 segundos por página.
  7. Correr outro pequeno utilitário FoxPro (número 3), que insere quebras de linha, depois correr outro (número 4) que faz mais outra verificação de excepções.
  8. Fazer a minha segunda passagem de revisão, cerca de dois minutos por página.
  9. Combinar os capítulos num único ficheiro grande. Correr mais uns pequenos utilitários FoxPro (números 5 e 6) que fazem algumas formatações finais, verificações e análises.
  10. Enviar o ficheiro para o Jim Tinsley, que graciosamente o corre pelo seu programa GUTCHECK que esquadrinha um monte de erros comuns.
  11. Chamar-lhe texto electrónico e enviá-lo para postagem.

O meu objectivo principal é produzir um texto electrónico de qualidade - não me preocupo propriamente com apressar as coisas. Quero dizer, não quero desperdiçar muito tempo desnecessariamente mas eu vejo isto como um passatempo e gosto de trabalhar nisto, por isso não cronometro o tempo para ver se consigo fazer hoje 20 páginas mais rapidamente do que ontem. (Quando vou correr, então preocupo-me se estou mais rápido hoje do que ontem.) Geralmente, dou talvez cerca de 5 horas de trabalho semanal ao PG - na verdade, é normalmente mais fácil para mim adaptar-me ao trabalho do PG nos dias de semana, ao fim da tarde, do que nos fins-de-semana. E é definitivamente gratificante quando o texto electrónico está acabado e não só é postado no PG, como depois aparecem ligações e cópias em vários sítios como na "Online Books Page", DMOZ.org, Blackmask.com e Bookshare.org.

Até agora ainda não me deparei com nenhuns obstáculos reais. Houve algumas coisas que me demoraram algum tempo para perceber. Por exemplo, quando o meu primeiro texto electrónico estava pronto, tinha quase a certeza que era suposto eu próprio colocar o cabeçalho do PG, mas procurei por todo o sítio do PG e não consegui encontrar nenhuma cópia-mestra. (Na verdade, acho que a mestra, tal como estava/está, está disponível no Lyris, mas eu não subscrevia o Lyris na altura.) Por isso arranquei simplesmente o cabeçalho de um texto electrónico postado muito recentemente mas, depois de ter enviado o texto electrónico, foi postado com um cabeçalho diferente. (Hoje em dia, acho que o "pessoal" do PG preferem serem eles a colocar o cabeçalho.) Também passei algum tempo a procura de códigos de página de 8 bits, mas espero que a nova grande PerFreq forneça um acesso rápido a todas as perguntas de que eu andei à caça na altura. Existem montes de boas informações enterradas em mensagens antigas no painel de voluntários mas não existe nenhuma maneira boa para pesquisar informação sobre um tópico em particular.

Até agora, tenho conseguido satisfazer todas as minhas necessidades relativas aos livros sem ter de gastar muito dinheiro. Encontro os meus livros pelo ABEbooks ou pelo Ebay, para além disso, tenho comprado alguns na baixa na Ohio Book Store na Main Street. Raramente tenho pago mais de 20 dólares por livro, mesmo incluindo os portes de envio. Um dos livros que comprei (mas que ainda não comecei a trabalhar) que custa 1000 dólares ou mais pela edição original, mas que também está disponível em reimpressões de capa mole por cerca de 10 dólares. Há outros livros nos meus planos futuros que parece que serão muito mais caros, mas logo me preocupo com isso na altura.

A minha mulher ainda não consegui compreender porque é que eu passo o meu tempo a digitalizar livros, enquanto os meus filhos (e, acho eu, a maioria das pessoas que conheço) parecem pensar que isto é um comportamento um bocadinho excêntrico mas basicamente aceitável. Pessoalmente, gosto mesmo de produzir textos electrónicos e espero continuar a fazê-lo por muito tempo. Agradeço ao Michael Hart, ao Jim Tinsley, ao Greg Newby e a todos os outros não mencionados por dedicarem tanto tempo a cultivarem o projecto e a olearem-lhe as engrenagens para nós. Viva o Project Gutenberg.

Lynn Hill

Estou envolvida no PG desde 1994, quando comecei a ler pela primeira vez textos em linha durante os tempos mortos no escritório onde trabalhava. (Uma vez tive problemas com uma colega quando ela me descobriu a "processar" o Little Women em vez do relatório da folha de pagamentos semanal.) Fiquei surpreendida, mesmo na altura, de encontrar uma variedade tão grande de materiais nos arquivos do PG. Dei por mim a reler os livros favoritos da minha infância e a deliciar-me por encontrar "novos"--Little Lord Fauntleroy, The Secret Garden, Heidi, os contos de Oz. Não tinham nada a ver com os antigos filmes açucarados que eu tinha visto na televisão. Eram divertidos, de enternecer o coração e absolutamente encantadores. Depois de alguns anos como leitora de textos, dei por mim a pensar: "Gostava de fazer isto."

Quando fui ver pela primeira vez a página na rede dos voluntários, senti-me esmagada. Havia todo o tipo de PergFreqs mas, quando as li, fiquei perplexa com todas as informações sobre tipos de ficheiro, tipos de letra e outros pormenores. Nem sequer sabia onde obter os livros, já para não falar das margens direitas recortadas e das linhas avançadas. Foi frustrante -- eu tinha todo aquele entusiasmo mas não sabia onde o aplicar. Vadiei durante uns tempos e voltei depois e virei-me para o painel de mensagens dos Voluntários do PG para pedir ajuda.

A ajuda chegou de muitos lados. Encontrei alguém que precisava de rever um ficheiro e ofereci-me para o ler. Isto funcionou bem e até encontrei alguns erros tipográficos. Revi mais alguns ficheiros para essa pessoa e depois outros para outras pessoas do painel.

Depois de algum tempo, estava pronta para tentar um livro inteiro e, da Dianne Bean, recebi o meu primeiro livro para o PG, "The Golden Slipper" de Anna Katharine Green. Quando abri a caixa, saiu de lá de dentro um cheiro a mofo e depois encontrei lá dentro um livro grosso com a capa verde mais feia que alguma vez vi em alguma coisa. A data era de 1915 e o livro estava a começar a desfazer-se nas pontas. A minha primeira reacção foi "Mas quem é que alguma vez quereria ler isto???". Mas uma vez que tinha prometido produzi-lo comecei, por dever, a digitalizar e a ler à medida que ia avançando. O livro era uma colectânea de contos de mistério/suspense acerca de uma adolescente que combatia o crime chamada Violet Strange. (Sentia sempre que o Scooby Doo e os seus amigos podiam aparecer a qualquer momento.) À medida que ia lendo, comecei a gostar da Violet e a reparar no quanto o seu mundo parecia diferente em relação ao nosso. Quando cheguei ao fim do livro, senti-me orgulhosa por ter "salvo" alguns bons contos para o futuro e pronta para experimentar outro livro.

A minha sugestão para os novos voluntários do PG é darem um salto em frente e não terem vergonha de se voluntariarem. O PG é um grande grupo de pessoas que se preocupam mas elas não sabem que você existe até que você diga alguma coisa. Assim que você se manifestar, eles farão qualquer coisa, cambalhotas duplas, ou triplas, para o ajudar.

Há muitas maneiras de os novos voluntários se envolverem, desde ir em busca de livros velhos em vendas de garagem até rever ficheiros ou digitalizar e transcrever livros inteiros. Quando enviar a sua primeira cópia da folha de rosto e verso, seja paciente -- a sua pesquisa de direitos autorais demora tempo a fazer. Isto é uma óptima altura para fazer revisões em linha num dos sítios de revisão distribuída.

Eu obtenho os meus livros a partir de vendas de bibliotecas, vendas de quintal, de amigos que encontro no painel de Voluntários do PG e até mesmo de vizinhos mais idosos que querem emprestar-me os meus livros favoritos que eles têm guardados. Quando você quer livros velhos, diga a toda a gente que conhece. Eles podem aparecer-lhe com montes de livros de que você não estaria à espera.

Quando encontrar um livro velho, o meu conselho é não ser muito apressado a decidir se o quer ler ou não. Os livros antigos estão datados, naturalmente, mas podem mostrar-lhe coisas sobre avida no passado que você não consegue apanhar num documentário no A&E. Interesso-me particularmente pela forma como as mulheres e as crianças são retratadas nesses livros antigos--nem todas as mulheres são necessariamente umas senhoras, nem todas as crianças são anjinhos doces. (Se você ainda não leu Little Lord Fauntleroy, está a perder uma série de gargalhadas.) Estas ideias e visões interiores podem mantê-lo entretido durante muitas noites escuras de Inverno, e são úteis para reconsiderar a sua opinião quando dá com um capitulo ou cena ocasionalmente enfadonho.

O texto mais difícil de fazer para mim foi o See America First, de Orville Heistand. O autor convida o leitor a juntar-se a ele numa viagem do Ohio ao Massachusetts, na qual ele visita vários pontos de referência e locais históricos e o entretém durante todo o caminho com poesia e provérbios obscuros e pequenos sermões morais acerca de cada pedra e tordo que encontra. Eu disse ao meu marido, o Chris, que o estilo (literalmente) vagueante do autor estava a dar comigo em doida. O Chris reviu alguns capítulos por mim e depois comentou: "Bolas, não se vê ninguém divertir-se tanto sem sair do mesmo sítio hoje em dia!"

Por esta altura, já completei os meus próprios livros e tenho caixas de outros livros para fazer. Descobri que os livros infantis são os meus preferidos mas tento fazer tudo se for suficientemente nítido para ser lido. Não trabalho no PG todos os dias, nem mesmo todas as semanas, se estiver muito ocupada com outras coisas, mas continuo sempre a voltar. Acho os projectos do PG muito relaxantes, uma forma de utilizar o meu computador e as minhas capacidades de escrita/leitura, e também uma mudança refrescante do meu trabalho diário. Também é uma óptima desculpa e motivação para ler montes de livros!

Sandra Laythorpe

Como Comecei como Voluntária do Gutenberg

Ouvi falar no Project Gutenberg pela primeira vez numa revista de computadores e, portanto, procurei-o na Internet e encontrei todos aqueles livros clássicos que há anos queria ler e eles eram gratuitos! Nessa altura, eu tinha lido uma edição de capa mole do The Heir of Redclyffe, de Charlotte M Yonge. Achei que era um livro fantástico - de facto, ainda penso que é o melhor romance que saiu do século dezanove. Depois de ler os ficheiros dos Como-Fazer no sítio do Gutenberg, pensei talvez poder produzir os livros de Miss Yonge com o equipamento que eu tinha. Escrevi ao Michael Hart e perguntei-lhe, e obtive dele uma resposta muito positiva e montes de informação.

Atirei-me de cabeça! Comprei uma cópia muito antiga do The Heir of Redclyffe, enviei as fotocópias da folha de rosto para o Michael e sentei-me ao computador, aprendi a utilizar as minhas ferramentas de OCR e continuei nisso, aprendendo com os meus erros. Os ficheiros das Instruções disseram-me quase tudo o que eu precisava saber e o Michael apresentou-me ao David Price, um Gutenbergador experimentado, que me poderia ajudar. Ele não tem tido preço a explicar-me as coisas; não acho que eu tivesse conseguido produzir a minha primeira tentativa sem a sua mão a servir-me de guia.

Eu compro muitos livros na Internet ou em vendedores locais. A maioria das obras de Miss Yonge aonda está disponível em alfarrabistas e eu vivo alegremente num local onde eles não são muito escassos. Tenho colegas do Gutenberg, agora, a ajudarem-me na CMY e envio-lhes os livros pelo correio-lesma se eles não os conseguem comprar nos seus próprios países.

É Assim Que Eu Faço.

Uso o programa de OCR PrimaPage; estava no disco que veio com o meu digitalizador Primax Colorado Direct e faço o trabalho no meu PC. Antes de começar, abro o programa do digitalizador e ajusto as definições para fazer fotos a preto e branco e o brilho mais ou menos abaixo dos 35 ou 40. Isto é crucial porque eu nem sequer vou conseguir ver a página até a ter bem. Quando comecei pela primeira vez, foram precisos muitos ajustes para o pôr bem. Devem ficar tão poucos erros quanto possível no resultado do OCR. Se a fotografia estiver muito clara, o OCR lê as palavras mal. Se a fotografia estiver muito escura, fica com sombras que criam manchas pretas nas páginas. Se não me conseguir ver livre dessas manchas pretas, tenho de arrancar as páginas do livro e fazer uma de cada vez. Importante: não compre primeiras edições!

Uso o digitalizador para tirar uma fotografia de duas páginas. A fotografia aparece no monitor. Então, fecho a fotografia, à qual o meu computador chama 'semtitl1'. A seguir abro o meu programa de OCR, pesquiso por 'semtitl1' e abro-o. Depois pessoa ao programa que o limpe e a seguir clico no botão que 'lê' a fotografia e a converte de píxeis para letras = Reconhecimento Óptico de Caracteres!

Quando obtenho o resultado do OCR (que demora apenas alguns segundos) salvo o ficheiro de texto 'lido' para os meus documentos, numerando o ficheiro com o mesmo número da página do livro. Criei uma pasta chamada 'Gutenberg' e guardo-o aí no formato só de texto. Então vou à minha pasta Gutenberg, abro o novo ficheiro, crio um ficheiro Capítulo 1 e salvo-o e às páginas subsequentes que preparei para construir todo o livro. Depois de ter revisto o resultado do OCR, colo o texto terminado num documento do Microsoft Word, definindo o tipo de letra para Courier New tamanho 10. Isto coloca as linhas com o comprimento correcto para o Gutenberg. Quando termino todo o livro no Word, guardo-o como texto com quebras de linha para obter o ficheiro de texto final, que envio para que seja postado no sítio do Gutenberg. Revejo o meu próprio trabalho duas ou três vezes, dependendo da qualidade do resultado do OCR, e faço uma verificação ortográfica final com o MS Word. Não peço a outras pessoas para reverem os meus textos, porque é provável que as idiossincrasias de Miss Yonge fossem apagadas na edição, a não ser que o revisor tenha o livro à mão.

Demorei 6 meses a preparar o meu primeiro texto, The Heir of Redclyffe, mas consigo fazer 10 páginas por hora agora.

Na minha pasta do Gutenberg, tenho outros ficheiros úteis para referência, sobretudo ficheiros descarregados com as Instruções do Gutenberg. Portanto se eu precisar de encontrar algo, posso ver esses ficheiros--é muito mais fácil do que pesquisar na Internet. Se precisar de saber algo que não encontro nesses ficheiros, posso coloca uma pergunta no Painel WWW de Voluntários, embora eu tente não o fazer porque as respostas se encontram quase sempre nos ficheiros.

Tento processar 2 folhas de páginas em 16 octavo por dia, demorando cerca de 3 ou 4 horas. Faço os meus trabalhos domésticos e jardinagem de manhã, depois sento-me para uma tarde feliz de Gutenbergação :-).

Porque é que eu Gutenbergo?

Quando fiquei pré-reformada, quis fazer algum trabalho voluntário na Internet. Coincidentemente comecei a ler as obras de Charlotte M Yonge, e descobri que a maioria das suas obras já não são editadas. Senti que elas mereciam um público muito mais vasto, por isso decidi que o meu trabalho voluntário seria precisamente isso. A Miss Yonge viveu numa aldeia a apenas alguns quilómetros de mim por isso eu também tinha um interesse local. Na minha página na rede, http://www.menorot.com/cmyonge.htm, encontrará um pouco sobre ela e Otterbourne, a aldeia em que ela viveu toda a sua vida e encontrará ligações para outros sítios sobre ela.

Descobri a Charlotte M Yonge Fellowship http://www.cmyf.org.uk/ e estou agora em contacto com outras pessoas que apreciam a sua obra, incluindo académicos que escrevem coisas inteligentes sobre ela. Os seus livros são acerca das famílias, as suas interacções entre si e como elas, em termos Cristãos, crescem em estado de graça. Ela era Tractarianam uma Cristã que, no século XIX, acreditava que as pessoas podiam ser definitivamente influenciadas por aquilo que liam. Por esta razão, as pessoas do século XX acharam as suas personagens muito moralistas e a sua prosa muito túrgida. Penso que os seus romances são deliciosos, as suas personagens adoráveis e a sua prosa é minuciosamente descritiva. Diz-se acerca dela que ela era 'capaz de tornar a bondade excitante'. Isto é um talento raro, que talvez apenas se possa encontrar apenas em outros escritores Cristãos como John Bunyan ou Charles Kingsley.

Através do sítio do Gutenberg, as obras de Miss Yonge estão mais facilmente disponíveis do que nunca. Ele escrevia originalmente para mulheres de classe alta e média. Pese embora eu viver um século e meio mais tarde, posso reconhecer as suas personagens nas suas 'descendentes' que vivem em meu redor, mas às vezes pergunto-me o que os leitores Chineses, Africanos, ou mesmo os escritores modernos Americanos, pensarão dela, tendo experiências tão diferentes da dos Ingleses Vitorianos.

Gosto de fazer textos para o Gutenberg, o trabalho é simples, assim que você sabe como o fazer. Preferia, contudo, vê-los apresentados em HTML. Os livros electrónicos modernos precisam todos de estar em formato HTNL para serem apresentados de uma forma bonita nas suas páginas pequeninas. Acredito que o Gutenberg irá publicar ficheiros em HTML, gostaria de aprender a fazê-lo. Penso que os ficheiros do Gutenberg acabarão por estar disponíveis em formatos que permitirão que funcionem em todos os PC, portáteis, de bolso e livros electrónicos;--mas ainda não sei qual é esse formato e não penso que os editores já tenham decidido entre si quais serão os padrões.

Finalmente, sim, encontro erros nos meus textos publicados. Quando tiver terminado todos os mais de 200 livros de Miss Yonge, relê-los-ei a todos pela segunda vez e removerei os erros. Portanto, o meu trabalho está planeado para demorar ainda muitos anos. . . .

Suzanne Shell

Durante vários anos, visitei o sítio do Project Gutenberg ocasionalmente, vi o que envolvia dar uma contribuição significativa para o esforço e ia-me embora depois de descarregar alguns livros--o PG era um projecto que teria de esperar até que eu me aposentasse.

No Verão e Outono de 2002, estava a fazer uma pesquisa sobre livros electrónicos (fontes, aparelhos, custos) para a minha biblioteca e dei de caras com o Distributed Proofreaders. Descobri o Blackmask.com por volta da mesma altura e também segui uma ligação dali para o Distributed Proofreaders. Por mero acaso! Depois de ceder por algumas vezes, atirei-me de cabeça e registei-me a 5 de Novembro e comecei a rever depois. O compromisso de rever as páginas que eu quisesse era perfeito para me deixar perceber o processo e para me pôr a pensar nas maneiras pelas quais eu podia explorar todo este trabalho grátis para fazer com que os livros que eu queria acabassem no PG.

Sentia-me bastante eficaz por rever as minhas 10-20 páginas por dia quando visitei o sítio, a 8 de Novembro, e NENHUM dos livros nos quais estava interessada estavam disponíveis. Também existia um número perfeitamente absurdo listado como o número de voluntários que tinham revisto pelo menos uma página (tinha quase quadruplicado). Eu SABIA que o sítio tinha sido violado. Na verdade, o sítio tinha sido mencionado no slashdot.org. Os fóruns de discussão estavam tão activos que era difícil encontrar tempo para ler todas as mensagens, perguntas, sugestões e queixas; isto levou-me rapidamente a mais documentação e directrizes de revisão. Os livros começaram a avançar no sítio tão rapidamente que puxaram todas as "coisas difíceis" do fundo da pilha por fazer, e as pessoas CONTINUAVAM desesperadas por conteúdos. Eu já era relativamente uma "veterana" após alguns dias por isso ajudei um pouco a responder a algumas perguntas mas ainda era uma iniciada. Tinha alguns sonhos do DP de que o DP poderia mudar a realidade, mas primeiro precisava de me pôr a par das coisas.

Algumas das minhas ambições giravam em tordo de objectivos profissionais--existem alguns domínios em domínio público que, se disponibilizados em formato electrónico, poderiam ser extremamente úteis para os utilizadores da minha biblioteca. Também existem alguns livros de referência e índices-modelo--o Index to Poetry de Granger é um exemplo--que têm edições pré-1923 que ainda poderiam ser recursos importantes. Para aprender o que precisava de saber acerca de como fornecer conteúdos, contudo, decidi começar com algo menos esmagador (querer lê-lo no meu leitor de livros electrónicos foi apenas uma coincidência). Fui à minha prateleira e tirei as minhas reimpressões de P. G. Wodehouse. Descarreguei e li as PerFreqs de digitalização e envio do sítio do DP, pedi e recebi a desobstrução para o primeiro livro (Uneasy Money) em finais de Dezembro e comecei a aprender a aprender a controlar do meu digitalizador. Primeiro tentei o Omnipage Pro, mas descobri que o ABBYY Finereader Pro fazia um trabalho de OCR significativamente melhor. Ofereci-me para ser um gestor "de bastidores" do livro enquanto ele ia avançando pelo sítio, mas em vez disso fizeram-me oficialmente "Gestora de Projecto". Apesar do primeiro frenesi depois da invasão do slashdot ter acalmado, o DP ainda sentia necessidade de ter mais conteúdos e mais mãos para gerirem os projectos.

A 5 de Janeiro, o Uneasy Money começou a ser revisto; passou por duas rondas de revisão em menos de 20 horas. Fiquei como um boi a olhar para o palácio mas sentei-me no meu computador e observei o número de páginas a diminuir. Por esta altura, já tinha digitalizado e feito o OCR de mais algumas reimpressões de Wodehouse e um pequeno livro de poesia. Eu estava presa! A Juliet Sutherland e outros administradores do sítio recrutaram alguns voluntários do DP para ajudarem a treinar os novos pós-processadores na tarefa de prepararem os textos finais para o PG. Eu fui entregue aos cuidados de um. Depois de vários projectos, "licenciei-me" e foi-me dada permissão para carregar os meus próprios projectos. A minha intenção era fazer 3 ou 4 projectos por mês, não mais dos que eu aguentava pós-processar. Planeei processar um livro de referência ocasional, a acrescentar a todos os Wodehouse em que eu conseguisse meter as mãos. Tantos planos...

Uma das preocupações recorrentes de muitos Distributed Proofreaders era como treinar os novos voluntários no estilo de revisão do DP. (É algo idiossincrático devido à natureza distribuída do processo.) Ainda nos estávamos a debater com os efeitos secundários do afluxo massivo de utilizadores do slashdot--melhorou a quantidade, mas a qualidade piorou. Super7, um dos maiores revisores, sugeriu pôr-se de parte um projecto sem formatações complexas para os "Novatos" e que se pedisse aos revisores da segunda ronda (dos quais, todos deveriam ser veteranos) para enviarem um retorno e encorajamento aos recém-chegados. Isto foi tentado com sucesso e com algumas variantes. Uma vez que eu tinha planeado fazer passar pelo sítio uma variedade de livros de ficção, voluntariei-me para gerir estes projectos para novatos enquanto a oferta se mantivesse. De repente, com início em Fevereiro de 2003, a quantidade de tempo que eu precisava de passar a localizar, digitalizar, fazer o OCR e a gerir os livros aumentou drasticamente, e a quantidade de tempo que eu podia dedicar ao pós-processamento diminuiu. Por sorte, os "veteranos" intervieram para responderem às perguntas dos recém-chegados e para servirem de "Mentores" na segunda ronda de revisão. Recentemente, outras pessoas apareceram a fornecer "projectos para novatos", para ajudarem a manter a procura de um número crescentemente maior de novos voluntários. Estes projectos também são bons para ajudarem os novos pós-processadores a aprenderem a fazer o trabalho.

Ainda tenho planeados alguns projectos ambiciosos; o Index to Poetry de Granger, a versão não adaptada do The Golden Bough, o The North American Indian de Curtis, e o Book Review Digest (volumes para 1905-1921). Alguns volumes já estão à espera para serem revistos, outros estão à espera para serem digitalizados no digitalizador tablóide do PG. Mas, nos entretantos, estão 23 novos livros de Wodehouse no PG graças ao Distributed Proofreaders, já para não falar nos refugos da cultura popular do início do século XX como The Sheik.

Acredito que a maior proeza do Distributed Proofreaders tem sido a criação de uma forma de treino "no terreno" para os voluntários do PG. Um aumento sustentado na quantidade e qualidade das técnicas e documentação de treino, melhorias na funcionalidade para o utilizador do sítio, e acesso rápido a uma experiência e conselhos colectivos de um largo leque de voluntários nos Fóruns resultou num núcleo crescente de voluntários activos e experientes em todas as facetas da produção de livros electrónicos. Tenho a certeza que não poderia ter progredido de uma completa novata para uma contribuidora regular do PG num período de 5 meses sem esta estrutura de apoio. A comunicação regular e a colaboração com amantes de livros electrónicos de todo o mundo enriqueceu a minha vida. O facto de ser mais fácil ter tempo livres no meu trabalho do que o DP provavelmente não interessa para aqui...

Tony Adam

Como soube do PG?

Foi há tanto tempo que não me lembro! Provavelmente li acerca dele na lista de correspondência de uma biblioteca (sou bibliotecário) e, uma vez que disponibilizar livros antigos sempre foi uma preocupação minha, envolvi-me logo.

Como é que foi o seu primeiro contacto?

Óptimo! Sempre foi fácil falar com o Mike Hart por e-mail, embora nunca tenhamos falado pessoalmente. Ele e a equipa do dia direccionaram-me para as FAQ e eu segui a partir daí.

Qual foi o primeiro trabalho que fez para o PG? Como correu?

O meu primeiro trabalho é capaz de ter sido o Turn of the Screw de James (acabo de encontrar uma mensagem de Setembro de 1993 com uma desobstrução de direitos autorais para ele). Uma vez que na encarnação anterior eu fui assistente editorial da Henry James Review, achei que podia ser um bom começo. Sempre transcrevi os ficheiros (sou um digitador rápido) e penso que tivemos poucos problemas pelo caminho.

Como é que desenvolveu a sua experiência no DP a partir daí?

Atabalhoadamente, muito como os meus hábitos de leitura. Eu trabalho numa universidade historicamente negra por isso fazer com que sejam publicadas obras Afro-Americanas do séc. XIX é a minha preocupação principal. Fiz o Clotelle (o porimeiro romance afro-americano) e uma autobiografia de Henry O. Flipper, o cadete de West Point, e estou sempre à procura de algo novo nesse campo. Algures pelo caminho fui desviado para os documentos históricos de Sir Walter Scott com um colega Gutenbergador do Ohio e para documentos em Chinês com outro contacto no Japão. Há alguns anos, vi alguém de São Francisco com os Apócrifos de Shakespeare e isso tem-me ocupado, intermitentemente, o tempo desde então. Há sempre algo!

Pode falar-nos do primeiro texto que produziu?

Penso que foi o The Turn of the Screw, que foi um bom ponto de partida--não muito longo, de leitura fácil, etc. Trabalhar afincadamente no texto algumas páginas por dia fez com que o processo avançasse rapidamente.

Como passa as suas horas quando está a contribuir para o PG?

Adoro a ideia de disponibilizar todo o conhecimento que tenho sobre impressão para todas as pessoas. Trabalhar numa biblioteca que tem sofrido problemas de orçamento ao longo dos anos abriu-me os olhos para a necessidade de aquisição de tantas coisas grátis quanto possível para os nossos estudantes e faculdade. Para além disso, de uma forma perversa, é divertido!

Especializa-se em algum tipo em particular de livros? ou textos?

Provavelmente tenho-me centrado mais em peças de teatro, documentos históricos e obras do séc. XIX dos EUA do que em qualquer outra coisa.

O que é que mais gosta ao fazer um texto para o PG?

Fazer com que um texto chegue à fase da fruição--ver finalmente um texto quase esquecido ganhar novamente vida.

O que é que menos gosta ao fazer um texto para o PG?

Por vezes, o trabalho pode ser entediante, dependendo do autor. Mas por vezes você precisa de abrir caminho para que algo significativo seja postado. Por exemplo, provavelmente deveríamos ter mais filósofos representados, mas que coisa horrível não seria digitalizar Kant!

Onde é que você obtém os seus livros elegíveis?

Principalmente a partir do acervo da minha biblioteca, apesar de eu finalmente ter comprado a minha própria do Shakespeare Apocrypha (é muito difícil de encontrar, o que faz com que seja muito conveniente para postagem). Já pedi alguns itens pelo empréstimo inter-bibliotecário mas isso também tem sido raro.

Você digita ou digitaliza? Que tipo de Digitalizador/ OCR / Editor/Processador de Texto prefere?

Continuo a digitar tudo--descobri que é mais fácil quando se está a trabalhar com uma peça de teatro. Mas vou comprar um digitalizador num futuro próximo e vou produzir mais com ele.

Como é que verifica o seu texto? Algumas ferramentas especiais? Corrector ortográfico? Imprime-o e lê-o? Põe-lo no seu PDA e lê-o? Tem um programa sintetizador de voz para o ler em voz alta para si a partir do seu PC?

Normalmente passo-o pelo corrector ortográfico apesar de, dependo do trabalho, eu o ler linha por linha por uma segunda vez.

Tem algumas dicas e truques ou rotinas especiais pelas quais passa quando prepara um texto?

A melhor coisa a fazer é criar um plano de trabalho para si mesmo--faça um conjunto de páginas todos os dias e ficará surpreendido com quão rapidamente chega ao fim. Também faço uma marca especial com um lápis no livro num ponto de paragem e até leio o parágrafo ao contrário para confirmar duas vezes o que introduzi pela última vez.

Quanto tempo lhe demora a preparação de um texto?

Depende do meu plano de trabalho, de outras tarefas, da época do ano, etc. Uma peça pode demorar duas semanas, mas um romance de Walter Scott pode demorar seis meses. Penso que o meu recorde é um dia para um ensaio, mas isso é fora do normal.

Trabalha sozinho ou partilha o seu trabalho em cada texto? Alguém o ajuda regularmente a rever o texto?

Já trabalhei sozinho e em equipas, dependendo do texto. Ninguém me ajuda regularmente a rever o texto mas, ocasionalmente, alguém ajuda.

Faz trabalhos para o PG regularmente ou vai e vem consoante a oportunidade o permite ou quando lhe apetece?

Considero-me um participante regular, quando o tempo o permite. Por outras palavras, não saí de cena mas por vezes posso não acrescentar nada durante um mês.

Quantos tipos de trabalhos ou livros diferentes já fez?

Não tenho a certeza de quantos livros diferentes fiz mas tem sido uma grande variedade: romances de James e de Scott, ensaios de Whittier, uma colecção inteira de documentos Americanos primitivos (sobretudo da New Netherlands), Shakespeare (o cânone reconhecido e as obras apócrifas), algumas obras estanhas (vem-me à cabeça The Psychology of Beauty)--a lista segue por aí adiante. Até já me tinha esquecido que fiz tantos títulos.

O que é que você gosta mais no processo do PG?

O ser flexível--se acho que algo deve ser postado não tenho de andar às voltas para obter uma permissão (para além da desobstrução de direitos autorais).

Do que é que não gosta no processo do PG?

Não consigo lembrar-me nada assim de repente.

Há algo que gostasse de ver o PG fazer de modo diferente?

Eu sei que isto é um pomo de discórdia, mas provavelmente teremos de explorar a possibilidade de nos afastarmos do ASCII.

Se um dos seus amigos chegasse ao pé de si a pedir-lhe conselhos sobre como começar a contribuir para o PG, o que lhe diria?

Começa por algo divertido, que te diga mais respeito e trabalha afincadamente em um bocado de cada vez.

O que é que espera que o PG seja daqui a cinco anos? E daqui a dez?

Provavelmente seremos muito maiores (textos e pessoas), com uma aparência dos textos diferente. Talvez tenhamos mesmo mais versões áudio dos textos, usando alguns dos programas que estão a aparecer.

Tonya Allen

Descobri o Project Gutenberg por volta de 1997. Depois de vários anos a apreciar os textos do PG, em Junho de 2002 decidi que era tempo para começar a contribuir. Através do sítio do PG vi que a forma mais fácil de o fazer era ajudar na revisão através do sítio do Charles Franks, o Distributed Proofreaders. No dia em que me registei, revi nove páginas completas de um livro infantil chamado Curly and Floppy Twistytail e senti-me muito orgulhosa por ter contribuído.

Nessa altura, existiam provavelmente apenas 40 voluntários activos no sítio diariamente. Muitas vezes, revi um livro inteiro quase sozinha durante uma semana ou isso. As coisas progrediam a passo lento; as directrizes eram poucas e simples; e eu divertia-me a ler livros antigos e a descobrir novos autores.

Passados alguns meses, foi feito um pedido aos voluntários para que pós-processassem textos em Francês. Voluntariei-me para ajudar nisto e foi assim que me tornei pós-processadora (PPer). Pouco depois, a página que listava os textos disponíveis para pós-processamento e os destacados estava limpa. Lembro-me de verificar várias vezes e de ficar desapontada porque não estava nada disponível naquela altura (agora é difícil de imaginar, quando estão sempre pelo menos 40 textos em espera).

Um dia, em Novembro, abri um texto que parecia promissor na da página de revisão e sentei-me para uma hora de leitura. Tanto quanto me lembro, era o The Greek View of Life, um texto relativamente grande do qual apenas algumas páginas tinham sido revistas até então, e que eu pensei que iria durar para várias semanas pelo menos. Por volta dessa altura, enviaram-me um e-mail a dizer que o DP tinha sido "/.ado." "O que é que isso quer dizer?", respondi eu. Descobri em breve.

Tinha estado a rever em paz durante algum tempo quando, de repente, em vez da página seguinte, calhou-me uma página quase vinte páginas à frente. Continuou a acontecer a mesma coisa repetidamente e, subitamente, todas as páginas tinham desaparecido; todo o texto tinha sido completado. O DP tinha sido mesmo slashdotado.

(Nota PT:' 'A Tonya refere-se à vez em que o DP foi referido no sítio www.slashdot.org--em Inglês, "/" lê-se "slash"). Em resultado disso, milhares de visitantes entraram no sítio do DP.)

Desde então, aconteceram um monte de coisas fantásticas. O número de voluntários activos por dia aumentou em 1000%. O número de textos que passam pelo sítio aumentou exponencialmente. Foram desenvolvidos todos os tipos de ferramentas de revisão e formatação. Agora passo a maior parte do meu tempo a verificar os textos que os outros pós-processaram e a enviá-lo para o PG a uma média de quatro por dia--um grande salto desde nove páginas no Curly and Floppy Twistytail. E estou ansiosa por tudo o que nos espera à medida que o DP evolui.

Walter Debeuf

Tomei conhecimento do PG por acaso quando estava a navegar e à procura de sítios interessantes. Sabia vagamente o nome porque tinha ouvido falar do Projecto há muito tempo. Depois de ler a "História e Filosofia do PG" tornei-me imediatamente um grande entusiasta dele. Era disto que eu estive à procura durante anos, uma utilização útil para o meu PC, e porque sou um fervoroso amante de boa literatura, não hesitei em contactar os fundadores do Projecto. Sugeri trabalhar em textos electrónicos em Francês e Holandês. No mesmo exacto dia, recebi uma resposta do PC na qual me disseram que ficavam muito felizes com a minha contribuição mas que eu tinha de ter sempre em mente que todos os livros deviam estar livres de direitos autorais e deviam ter sido publicados antes de 1923.

Isto não era assim tão bom... Depois de ter navegado pela "Ajuda e PergFreq" do sítio do PG, descobri que não tinha de me preocupar com isso tudo, porque eles estavam dispostos a fazer toda a desobstrução!

Na minha prateleira encontrei um livro antigo de Jules Renard, "Poil de Carotte". Pareceu-me suficientemente antigo, mas eu não conseguia encontrar nenhumas cláusulas de direitos autorais. Portanto, enviei pelo correio ao Sr. Hart todas as informações que encontrei nas páginas de rosto e verso e perguntei-lhe o que é que ele achava disso. No dia seguinte recebi uma resposta na qual ele respondia: "Ainda temos de provar que esta edição é anterior a 1923 por isso estou a reenviar o pedido para uma autoridade em pesquisa de direitos autorais." Esta autoridade era a Menina Dianne Bean que me enviou uma carta alguns dias mais tarde muito alegremente dizendo que eu podia começar a digitar porque os problemas de direitos autorais tinham sido resolvidos. Ela pediu-me pare enviar uma FR&V (uma fotocópia da folha de rosto e verso) do livro ao Sr. Hart porque precisavam disso por razões legais.

Mas havia algo que não estava muito claro para mim no que dizia respeito ao formato que eu devia utilizar. Nas "PergFreq" eles falavam acerca do "plain vanilla ASCII", de que eu nunca tinha ouvido falar na minha vida! No "Como-Fazer dos Voluntários, Painel dos Voluntários do PG" o Sr. Jim Tinsley respondia a todo o tipo de perguntas sobre todo o tipo de problemas que as pessoas têm quando começam a voluntariar-se. Por isso eu fiz o mesmo e enviei-lhe a minha pergunta. Recebi uma resposta extensa acerca de todo o tipo de formatos na "Sopa de Letras ISO 8859" e ele recomendou-me que utilizasse o "Codepage 1252", que é muito comum no Windows. Aqui ficam os endereços que o Jim me enviou:

"Se está interessado nas diferenças, recomendo a excelente página

http://aspell.com/charsets/codepages.html

Eu escolhi um livro em Francês primeiro porque já o tinha na minha prateleira e em segundo porque queria aperfeiçoar os meus conhecimentos de Francês e transcrever pareceu-me uma boa maneira de o fazer. Quando está a copia um texto de um autor, você está muito próximo dele. Também tem de prestar completa atenção à ortografia das palavras. Gradualmente, você fica envolvido pelo feitiço da história e esquece-se que está a digitar... Não obstante, é um trabalho árduo, especialmente quando não é a sua língua nativa e, portanto, você não deve apressar-se. No início, comecei com duas ou trâs páginas por dia, o que significa que você precisaria de cerca de dois meses de digitação para um livro médio. Mas os bons digitadores podem fazê-lo mais rapidamente.

Eu apenas posso aplaudir o objectivo do PG, disponibilizar livros na Internet tanto quanto possível, sem custos, para qualquer pessoa em todo o mundo. Adoro colaborar com ele.

Entretanto, existem milhares e milhares de livros no acervo do PG e isso torna um bocadinho difícil encontrar outros exemplares que estejam livres de direitos autorais porque têm de ser de antes de 1923. Uma vez que apanhei a "doença do PG", é para mim um desafio encontrar cópias que sirvam, e procuro-o para cima e para baixo. Posso comprar alguns livros por uma pechincha e trago-os como um troféu, ansioso pelo trabalho que me espera . . .

Nas bibliotecas, você consegue encontrar publicações que não consegue encontrar em qualquer outro lugar.

É fantástico como os livros antigos podem ser fascinantes e o quanto você pode aprender com eles. De momento estou a trabalhar no "Pecheur d'Islande" de Pierre Loti, no qual travei contacto com uma tradição antiga dos pescadores muito interessante. Sem o PG, provavelmente nunca teria lido isto. Ainda devem existir montes de pequenos tesouros em alguns sótãos velhos e poeirentos, à espera para renasceram pelo toque mágico de um voluntário do PG.

Se o fizer, não está à sua espera nenhuma compensação nem pagamento mas... fazer algo desinteressada e não egoisticamente deixa-lhe uma sensação boa.