Aqui está a nossa ferramenta "Trends" que, como você deve se lembrar, pode ser acessada direta e isoladamente através desta URL: https://voyant-tools.org/?corpus=fb27886554e534456cdc8add248f06d0&view=Trends
A ferramenta Trends, como se vê no módulo de ajuda do Voyant Tools:
é uma visualização que representa as frequências de termos em documentos de um corpus ou em segmentos de um documento, dependendo do modo. Cada série do gráfico é colorida de acordo com a palavra que representa, no topo do gráfico uma legenda mostra quais palavras estão associadas a quais cores.
Você pode clicar nas palavras da legenda para alternar sua visibilidade. Passar o mouse sobre qualquer ponto do gráfico faz com que uma caixa de texto explicativo apareça com informações sobre o ponto, incluindo a palavra, a frequência (bruta ou relativa dependendo do modo), o documento ou segmento do documento.
As marcações em amarelo são minhas e guiam as explicações a seguir.
Frequência de Termos
A frequência de termos é exatamente o que parece: um indicador de quantas vezes determinado termo aparece. No entanto, há dois tipos de medida de frequências: a frequência bruta (ou raw frequency em inglês) e a frequência relativa (ou relative frequency).
A frequência bruta é a contagem absoluta do númeto de vezes que o termo ocorre em cada segmento do documento. Já a frequência relativa é a frequência de ocorrência do termo em relação ao total de termos no segmento ou documento em questão.
Corpus, Documento(s) e Segmentos
Corpus é o termo técnico utilizado em análise de textos para designar o conjunto completo de material textual que se vai analisar. Este conjunto pode ser pequeno (por exemplo, uma página de texto) ou imenso (por exemplo, todos os livros publicados durante os séculos XVII, XVIII e XIX, na Europa), monolíngue (todos os textos em uma única língua) ou multilígue (textos em várias línguas), homogêneos (todos escritos ou falados) ou heterogêneos (alguns escritos, outros falados), e assim por diante. Documento se refere à unidade de análise, que no caso do Voyant costuma corresponder a um "arquivo" digital fornecido para análise. Finalmente um segmento é uma fração do documento, fatiada por critérios formais: por exemplo, se um documento é segmentado em 10 partes, cada parte corresponde a 10% do documento. Ou seja, não há uma correspondência com a "estrutura" do documento, a menos que o texto tenha sido formalmente marcado (com uso de XML) para este tipo de segmentação. Esta marcação é um tema bastante avançado que poderá ser endereçado mais adiante. No momento, se for de seu interesse saber mais, indico estes documentos:
A janela de opções da ferramenta "Trends" oferece, além de frequências e segmentos, três outros parâmetros para sua escolha: Stopwords ("Lista de Exclusão"), Categorias ("Categories") e Paleta ("Palette").

Começando por esta última, a "paleta" é o que o nome de fato sugere: uma paleta de cores para "colorir" o gráfico que a ferramenta exibe. Há várias opções, que podem inclusive ser editadas para você alcançar o efeito visual desejado. Já as "Categorias" são um recurso muito poderoso e mais complexo, que discutimos numa página separada. Já sobre as listas de exclusão, temos uma página inteira dedicada a elas.
E mais
Além das opções e parâmetros acima, a ferramenta "Trends" ainda oferece outros parâmetros. No canto inferior esquerdo do quadro da ferramenta aparecem os seguintes controles (veja numeração na figura): (1) campo para preenchimento de termos que se quer analisar (a imagem deliberadamente utiliza um símbolo especial, o "*", que substitui qualquer cadeia de caracteres - saiba mais sobre expressões regulares); (2) um botão reset para restituir a configuração inicial da ferramenta; e (3) uma caixa de opções com diferentes tipos de gráficos que podem ser escolhidos para representar as frequências de termos nos diferentes segmentos do documento ou corpus. É também possível marcar a opção de mostrar os rótulos com os termos e frequências associadas nos diferentes pontos assinalados no gráfico.




