3 de out de 2010

Leia artigos Wikipedia em Texto Plano com wikipedia2text

Christian  Brabandt escreveu um interessante programa ao bom estilo CL que permite a leitura de artigos da Wikipedia [1] de forma limpa e clara, através da linha de comando do Linux (provávelmente em outros sabores Unix). O wikipedia2text [2] apresenta em tela mas também permite redirecionamentos para arquivo de qualquer tipo de texto encontrado sobre uma determinada pesquisa e naturalmente pode ser utilizado juntamente com o | (pipe) e neste, tudo é possível. Segue algumas dicas que podem ser interessante:
Instalação:
#aptitude install wikipedia2text

Exemplos de uso (explicação do comando abaixo):
$wikipedia2text -l pt debian | more  
Apresenta informações sobre o Projeto Debian no idioma (-l pt) Português;
$wikipedia2text -c aptitude debian 
Apresenta  a pesquisa e destaca a palavra "aptitude" de forma case-sensitive;
$wikipedia2text -o debian
Apresenta a pesquisa em um browser também textual;
$wikipedia2text -p debian
Apresenta a pesquisa paginando
$wikipedia2text -u debian
http://en.wikipedia.org/wiki/debian
Apresenta somente a url do artigo indicado;

Esta dica pode ser útil especialmente se você recorre às consultas de domínio público, permitindo, assim reprodução rápida e limpa dos textos encontrados. Não esqueça de indicar suas fontes.

Referências:
man wikipedia2text