NAME
Lingua::PT::Segmentador - Perl extension for Portuguese segmentation
SYNOPSIS
use Lingua::PT::Segmentador;
my @frases = sentences($texto);
my $frases = separa_frases($texto);
DESCRIPTION
This module is intended to be for Portuguese audience. So, sorry but I will switch to Portuguese.
Este módulo é uma extensão Perl para a segmentação de textos em linguagem natural. O objectivo principal será a possibilidade de segmentação a vários níveis, no entanto esta primeira versão permite apenas a separação em frases (fraseação) usando uma de duas variantes:
- Projecto Natura
-
@frases = sentences($texto);
Esta é a implementação do Projecto Natura, que retorna uma lista de frases.
- Linguateca
-
$frases = separa_frases($texto);
Esta é a implementação da Linguateca, que retorna um texto com uma frase por linha.
Estas duas implementações irão ser testadas e aglomeradas numa única que permita ambas as funcionalidades.
AUTHOR
Linguateca (http://www.linguateca.pt -- contacto@linguateca.pt)
COPYRIGHT AND LICENSE
Copyright (C) 2003 by Linguateca
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself, either Perl version 5.8.1 or, at your option, any later version of Perl 5 you may have available.
Esta biblioteca é software livre; pode distribuí-la e/ou modificá-la nos mesmos termos do Perl, quer versão 5.8.1 ou, na sua opinião, qualquer outra versão de Perl 5 que tenha disponível.
1 POD Error
The following errors were encountered while parsing the POD:
- Around line 528:
Non-ASCII character seen before =encoding in 'módulo'. Assuming CP1252