Podcast
Questions and Answers
Qual a finalidade da normalização adicional de tokens em um texto?
Qual a finalidade da normalização adicional de tokens em um texto?
O que são os n-gramas quando se fala em Bag of Words?
O que são os n-gramas quando se fala em Bag of Words?
Por que é importante remover n-gramas de alta frequência das características em modelos de classificação de texto?
Por que é importante remover n-gramas de alta frequência das características em modelos de classificação de texto?
Qual a principal desvantagem dos enormes vetores esparsos gerados pelo modelo Bag of Words?
Qual a principal desvantagem dos enormes vetores esparsos gerados pelo modelo Bag of Words?
Signup and view all the answers
Em modelos baseados em SVM para análise de sentimentos, o que são as características utilizadas para tomada de decisão?
Em modelos baseados em SVM para análise de sentimentos, o que são as características utilizadas para tomada de decisão?
Signup and view all the answers
Como a TF-IDF pode auxiliar na representação dos tokens em um modelo de classificação?
Como a TF-IDF pode auxiliar na representação dos tokens em um modelo de classificação?
Signup and view all the answers
O que significa uma saída sigmoide de 0,5 em um modelo de análise de sentimentos?
O que significa uma saída sigmoide de 0,5 em um modelo de análise de sentimentos?
Signup and view all the answers
Como a introdução de 2-ngramas impactou o modelo mencionado no texto?
Como a introdução de 2-ngramas impactou o modelo mencionado no texto?
Signup and view all the answers
Quais são algumas formas sugeridas para melhorar o modelo de análise de sentimentos mencionado no texto?
Quais são algumas formas sugeridas para melhorar o modelo de análise de sentimentos mencionado no texto?
Signup and view all the answers
Qual é a principal vantagem dos modelos lineares e Bag of Words para análise de texto, conforme mencionado no resumo?
Qual é a principal vantagem dos modelos lineares e Bag of Words para análise de texto, conforme mencionado no resumo?
Signup and view all the answers
Por que a abordagem de mapeamento de n-gramas para índices de características se torna problemática em grandes conjuntos de dados?
Por que a abordagem de mapeamento de n-gramas para índices de características se torna problemática em grandes conjuntos de dados?
Signup and view all the answers
Qual é uma solução alternativa proposta para lidar com grandes conjuntos de dados ao trabalhar com n-gramas e índices de características?
Qual é uma solução alternativa proposta para lidar com grandes conjuntos de dados ao trabalhar com n-gramas e índices de características?
Signup and view all the answers
Qual é o principal objetivo da tokenização de texto?
Qual é o principal objetivo da tokenização de texto?
Signup and view all the answers
Qual problema a normalização de tokens visa resolver?
Qual problema a normalização de tokens visa resolver?
Signup and view all the answers
O que é lematização?
O que é lematização?
Signup and view all the answers
O que é stemização na análise de texto?
O que é stemização na análise de texto?
Signup and view all the answers
Qual é a diferença entre stemização e lematização?
Qual é a diferença entre stemização e lematização?
Signup and view all the answers
O que se busca alcançar com a token normalization na análise de texto?
O que se busca alcançar com a token normalization na análise de texto?
Signup and view all the answers