Podcast
Questions and Answers
O que a saída sigmoide igual a 0,5 indica em relação à probabilidade de uma avaliação positiva?
O que a saída sigmoide igual a 0,5 indica em relação à probabilidade de uma avaliação positiva?
- Probabilidade de 25%
- Probabilidade de 75%
- Probabilidade de 100%
- Probabilidade de 50% (correct)
Qual é uma estratégia mencionada para melhorar a tokenização na análise de texto?
Qual é uma estratégia mencionada para melhorar a tokenização na análise de texto?
- Aumentar a complexidade dos tokens
- Remover n-gramas
- Descartar completamente o BOW
- Adicionar stemming ou lematização (correct)
Quando se trata de grandes conjuntos de dados, por que o mapeamento n-grama → índice de característica pode se tornar problemático?
Quando se trata de grandes conjuntos de dados, por que o mapeamento n-grama → índice de característica pode se tornar problemático?
- Torna a computação mais eficiente
- Facilita a vetorização
- Não cabe na memória de uma máquina (correct)
- É fácil de sincronizar
Qual é um modelo mencionado como alternativa ao Bag Of Words (BOW) e aos modelos lineares para a análise de texto?
Qual é um modelo mencionado como alternativa ao Bag Of Words (BOW) e aos modelos lineares para a análise de texto?
O que significa utilizar hashing para lidar com grandes conjuntos de dados na análise de texto?
O que significa utilizar hashing para lidar com grandes conjuntos de dados na análise de texto?
Qual é a principal limitação apontada em relação à aprendizagem profunda na classificação de sentimentos de textos?
Qual é a principal limitação apontada em relação à aprendizagem profunda na classificação de sentimentos de textos?
Qual é a principal razão pela qual os utilizadores de webmail são muitas vezes preguiçosos na rotulagem dos e-mails?
Qual é a principal razão pela qual os utilizadores de webmail são muitas vezes preguiçosos na rotulagem dos e-mails?
Por que motivo os tokens são duplicados e tornados únicos com um identificador de utilizador?
Por que motivo os tokens são duplicados e tornados únicos com um identificador de utilizador?
Por que razão um classificador global treinado em todos os utilizadores foi escolhido como linha de base?
Por que razão um classificador global treinado em todos os utilizadores foi escolhido como linha de base?
Qual a importância de grandes conjuntos de dados na criação de modelos?
Qual a importância de grandes conjuntos de dados na criação de modelos?
O que a vectorização de palavras envolve na criação de uma coluna de caracterı́sticas para cada palavra?
O que a vectorização de palavras envolve na criação de uma coluna de caracterı́sticas para cada palavra?
Por que a amostragem de conjuntos de dados menores resulta em uma diminuição da precisão?
Por que a amostragem de conjuntos de dados menores resulta em uma diminuição da precisão?
Qual método é utilizado para reduzir o número de características originais?
Qual método é utilizado para reduzir o número de características originais?
O que permite controlar o número de características na saída do processo de hashing?
O que permite controlar o número de características na saída do processo de hashing?
Qual é a função do preditor específico (u) desenvolvido para cada utilizador?
Qual é a função do preditor específico (u) desenvolvido para cada utilizador?
Qual é a fonte dos dados rotulados utilizados para desenvolver o preditor específico para cada utilizador?
Qual é a fonte dos dados rotulados utilizados para desenvolver o preditor específico para cada utilizador?
Qual é a função das ferramentas como sklearn.feature_extraction.text.HashingVectorizer e a biblioteca vowpal wabbit?
Qual é a função das ferramentas como sklearn.feature_extraction.text.HashingVectorizer e a biblioteca vowpal wabbit?
Qual é a principal desvantagem mencionada sobre o método de redução de características baseado em hashing?
Qual é a principal desvantagem mencionada sobre o método de redução de características baseado em hashing?
Flashcards are hidden until you start studying