Podcast
Questions and Answers
O que a saída sigmoide igual a 0,5 indica em relação à probabilidade de uma avaliação positiva?
O que a saída sigmoide igual a 0,5 indica em relação à probabilidade de uma avaliação positiva?
Qual é uma estratégia mencionada para melhorar a tokenização na análise de texto?
Qual é uma estratégia mencionada para melhorar a tokenização na análise de texto?
Quando se trata de grandes conjuntos de dados, por que o mapeamento n-grama → índice de característica pode se tornar problemático?
Quando se trata de grandes conjuntos de dados, por que o mapeamento n-grama → índice de característica pode se tornar problemático?
Qual é um modelo mencionado como alternativa ao Bag Of Words (BOW) e aos modelos lineares para a análise de texto?
Qual é um modelo mencionado como alternativa ao Bag Of Words (BOW) e aos modelos lineares para a análise de texto?
Signup and view all the answers
O que significa utilizar hashing para lidar com grandes conjuntos de dados na análise de texto?
O que significa utilizar hashing para lidar com grandes conjuntos de dados na análise de texto?
Signup and view all the answers
Qual é a principal limitação apontada em relação à aprendizagem profunda na classificação de sentimentos de textos?
Qual é a principal limitação apontada em relação à aprendizagem profunda na classificação de sentimentos de textos?
Signup and view all the answers
Qual é a principal razão pela qual os utilizadores de webmail são muitas vezes preguiçosos na rotulagem dos e-mails?
Qual é a principal razão pela qual os utilizadores de webmail são muitas vezes preguiçosos na rotulagem dos e-mails?
Signup and view all the answers
Por que motivo os tokens são duplicados e tornados únicos com um identificador de utilizador?
Por que motivo os tokens são duplicados e tornados únicos com um identificador de utilizador?
Signup and view all the answers
Por que razão um classificador global treinado em todos os utilizadores foi escolhido como linha de base?
Por que razão um classificador global treinado em todos os utilizadores foi escolhido como linha de base?
Signup and view all the answers
Qual a importância de grandes conjuntos de dados na criação de modelos?
Qual a importância de grandes conjuntos de dados na criação de modelos?
Signup and view all the answers
O que a vectorização de palavras envolve na criação de uma coluna de caracterı́sticas para cada palavra?
O que a vectorização de palavras envolve na criação de uma coluna de caracterı́sticas para cada palavra?
Signup and view all the answers
Por que a amostragem de conjuntos de dados menores resulta em uma diminuição da precisão?
Por que a amostragem de conjuntos de dados menores resulta em uma diminuição da precisão?
Signup and view all the answers
Qual método é utilizado para reduzir o número de características originais?
Qual método é utilizado para reduzir o número de características originais?
Signup and view all the answers
O que permite controlar o número de características na saída do processo de hashing?
O que permite controlar o número de características na saída do processo de hashing?
Signup and view all the answers
Qual é a função do preditor específico (u) desenvolvido para cada utilizador?
Qual é a função do preditor específico (u) desenvolvido para cada utilizador?
Signup and view all the answers
Qual é a fonte dos dados rotulados utilizados para desenvolver o preditor específico para cada utilizador?
Qual é a fonte dos dados rotulados utilizados para desenvolver o preditor específico para cada utilizador?
Signup and view all the answers
Qual é a função das ferramentas como sklearn.feature_extraction.text.HashingVectorizer e a biblioteca vowpal wabbit?
Qual é a função das ferramentas como sklearn.feature_extraction.text.HashingVectorizer e a biblioteca vowpal wabbit?
Signup and view all the answers
Qual é a principal desvantagem mencionada sobre o método de redução de características baseado em hashing?
Qual é a principal desvantagem mencionada sobre o método de redução de características baseado em hashing?
Signup and view all the answers