Exemplo de filtro de URL do Apache Nutch
De Basef
Ir para:
navegação
,
pesquisa
Especial:Páginas afluentes/Interceptando métodos no Java
>
Definindo properties
>
Crypto Currency
>
Inserindo dados no Elastic Search
>
Exemplo de filtro de URL do Apache Nutch
O filtro abaixo permite que o site do UOL seja indexado:
+^http:
//
(
[
a-z0-
9
]
*
\.
)
*
uol.com.br
/
Deve ser inserido no arquivo em
/conf/regex-urlfilter.txt
.
Categoria
:
Apache Nutch
Menu de navegação
Ferramentas pessoais
português do Brasil
216.73.216.112
Discussão para este IP
Entrar
Espaços nominais
Página
Discussão
Variantes
Visualizações
Ler
Ver código-fonte
Ver histórico
Mais
Pesquisar
Navegação
Página principal
Mudanças recentes
Página aleatória
Ajuda
MediaWiki Markup
GeSHi
Ferramentas
Páginas afluentes
Alterações relacionadas
Páginas especiais
Versão para impressão
Link permanente
Informações da página