Podcast
Questions and Answers
Qual a finalidade da normalização adicional de tokens em um texto?
Qual a finalidade da normalização adicional de tokens em um texto?
- Eliminar a ordem das palavras no texto
- Facilitar a contagem de tokens no texto
- Proporcionar um melhor desempenho em modelos de classificação de texto (correct)
- Reduzir o número de tokens extraídos
O que são os n-gramas quando se fala em Bag of Words?
O que são os n-gramas quando se fala em Bag of Words?
- Palavras marcadoras presentes no texto
- Uma técnica para normalizar as palavras
- Pares ou grupos de tokens consecutivos (correct)
- Tokens que estão fora do contexto do texto
Por que é importante remover n-gramas de alta frequência das características em modelos de classificação de texto?
Por que é importante remover n-gramas de alta frequência das características em modelos de classificação de texto?
- Para evitar o aumento do número de tokens
- Para reduzir o tamanho do vocabulário
- Para eliminar termos sem relevância na classificação (correct)
- Para garantir uma representação mais fiel do texto
Qual a principal desvantagem dos enormes vetores esparsos gerados pelo modelo Bag of Words?
Qual a principal desvantagem dos enormes vetores esparsos gerados pelo modelo Bag of Words?
Em modelos baseados em SVM para análise de sentimentos, o que são as características utilizadas para tomada de decisão?
Em modelos baseados em SVM para análise de sentimentos, o que são as características utilizadas para tomada de decisão?
Como a TF-IDF pode auxiliar na representação dos tokens em um modelo de classificação?
Como a TF-IDF pode auxiliar na representação dos tokens em um modelo de classificação?
O que significa uma saída sigmoide de 0,5 em um modelo de análise de sentimentos?
O que significa uma saída sigmoide de 0,5 em um modelo de análise de sentimentos?
Como a introdução de 2-ngramas impactou o modelo mencionado no texto?
Como a introdução de 2-ngramas impactou o modelo mencionado no texto?
Quais são algumas formas sugeridas para melhorar o modelo de análise de sentimentos mencionado no texto?
Quais são algumas formas sugeridas para melhorar o modelo de análise de sentimentos mencionado no texto?
Qual é a principal vantagem dos modelos lineares e Bag of Words para análise de texto, conforme mencionado no resumo?
Qual é a principal vantagem dos modelos lineares e Bag of Words para análise de texto, conforme mencionado no resumo?
Por que a abordagem de mapeamento de n-gramas para índices de características se torna problemática em grandes conjuntos de dados?
Por que a abordagem de mapeamento de n-gramas para índices de características se torna problemática em grandes conjuntos de dados?
Qual é uma solução alternativa proposta para lidar com grandes conjuntos de dados ao trabalhar com n-gramas e índices de características?
Qual é uma solução alternativa proposta para lidar com grandes conjuntos de dados ao trabalhar com n-gramas e índices de características?
Qual é o principal objetivo da tokenização de texto?
Qual é o principal objetivo da tokenização de texto?
Qual problema a normalização de tokens visa resolver?
Qual problema a normalização de tokens visa resolver?
O que é lematização?
O que é lematização?
O que é stemização na análise de texto?
O que é stemização na análise de texto?
Qual é a diferença entre stemização e lematização?
Qual é a diferença entre stemização e lematização?
O que se busca alcançar com a token normalization na análise de texto?
O que se busca alcançar com a token normalization na análise de texto?