Podcast
Questions and Answers
¿Cuál de los siguientes NO es un objetivo principal al aprender sobre Google Cloud Platform (GCP)?
¿Cuál de los siguientes NO es un objetivo principal al aprender sobre Google Cloud Platform (GCP)?
- Explorar el catálogo de servicios que ofrece GCP.
- Conocer GCP como un proveedor de servicios en la nube.
- Estudiar servicios IaaS de GCP aplicables a Big Data.
- Convertirse en un experto certificado en todas las áreas de GCP en una semana. (correct)
¿Cómo surgió Google Cloud Platform (GCP)?
¿Cómo surgió Google Cloud Platform (GCP)?
- Como un proyecto de código abierto liderado por la comunidad de desarrolladores.
- Como una plataforma para gestionar internamente las aplicaciones de Google a gran escala. (correct)
- Como una iniciativa para competir directamente con Microsoft Office.
- Como una colaboración entre Google y Amazon Web Services.
¿Qué se enfatiza en Google Cloud Platform (GCP) en términos de recursos en la nube?
¿Qué se enfatiza en Google Cloud Platform (GCP) en términos de recursos en la nube?
- Disponibilidad limitada, seguridad avanzada y servicios enfocados en almacenamiento.
- Disponibilidad regional, seguridad estándar y servicios básicos de computación.
- Baja disponibilidad, seguridad limitada y servicios especializados.
- Alta disponibilidad, buena seguridad y una amplia variedad de servicios. (correct)
¿Cuáles son los tres niveles en los que GCP organiza sus servicios globalmente?
¿Cuáles son los tres niveles en los que GCP organiza sus servicios globalmente?
¿Cuál de los siguientes factores es MENOS crítico al seleccionar la ubicación para desplegar servicios en GCP?
¿Cuál de los siguientes factores es MENOS crítico al seleccionar la ubicación para desplegar servicios en GCP?
¿Qué modelo sigue GCP en relación con la seguridad y gestión de datos?
¿Qué modelo sigue GCP en relación con la seguridad y gestión de datos?
¿Cuál de los siguientes servicios permite al usuario elegir configuraciones personalizadas de máquina virtual en GCP?
¿Cuál de los siguientes servicios permite al usuario elegir configuraciones personalizadas de máquina virtual en GCP?
¿Qué proporciona Google Cloud Virtual Private Cloud (VPC)?
¿Qué proporciona Google Cloud Virtual Private Cloud (VPC)?
¿Cuál de los siguientes NO es un tipo de almacenamiento ofrecido por GCP?
¿Cuál de los siguientes NO es un tipo de almacenamiento ofrecido por GCP?
¿Qué servicio de base de datos de GCP es adecuado para consultas transaccionales?
¿Qué servicio de base de datos de GCP es adecuado para consultas transaccionales?
¿Cuál es el modelo de inferencia de esquemas de datos utilizado por BigQuery?
¿Cuál es el modelo de inferencia de esquemas de datos utilizado por BigQuery?
¿Qué servicio de GCP permite la comunicación asíncrona entre publicadores y suscriptores?
¿Qué servicio de GCP permite la comunicación asíncrona entre publicadores y suscriptores?
¿Cuál de los siguientes servicios de GCP se basa en Apache Beam?
¿Cuál de los siguientes servicios de GCP se basa en Apache Beam?
¿Cuál es la función principal de Cloud Dataprep?
¿Cuál es la función principal de Cloud Dataprep?
¿Cuál de las siguientes NO es una ventaja de usar Dataproc?
¿Cuál de las siguientes NO es una ventaja de usar Dataproc?
¿Cuál de las siguientes afirmaciones describe mejor Cloud Datalab?
¿Cuál de las siguientes afirmaciones describe mejor Cloud Datalab?
¿Qué marco de trabajo de machine learning es líder en el desarrollo de soluciones de deep learning y está integrado con los servicios de Google Cloud?
¿Qué marco de trabajo de machine learning es líder en el desarrollo de soluciones de deep learning y está integrado con los servicios de Google Cloud?
¿Cuál es el propósito principal de AI Platform Data Labeling Service?
¿Cuál es el propósito principal de AI Platform Data Labeling Service?
¿Qué ofrece Cloud AutoML?
¿Qué ofrece Cloud AutoML?
¿Cuál de los siguientes servicios de AI Platform se utiliza para optimizar los hiperparámetros de los modelos de machine learning?
¿Cuál de los siguientes servicios de AI Platform se utiliza para optimizar los hiperparámetros de los modelos de machine learning?
¿Qué tipo de servicio son Cloud AI Building Blocks?
¿Qué tipo de servicio son Cloud AI Building Blocks?
¿Cuál de las siguientes APIs permite la conversión de texto a voz?
¿Cuál de las siguientes APIs permite la conversión de texto a voz?
En el contexto de GCP, ¿qué significa que BigQuery use un modelo 'schema-on-read'?
En el contexto de GCP, ¿qué significa que BigQuery use un modelo 'schema-on-read'?
Dentro de los servicios de computación de GCP, ¿cuál ofrece la mayor flexibilidad en términos de configuración de hardware, permitiendo al usuario definir desde la CPU hasta el tipo de disco?
Dentro de los servicios de computación de GCP, ¿cuál ofrece la mayor flexibilidad en términos de configuración de hardware, permitiendo al usuario definir desde la CPU hasta el tipo de disco?
Supongamos que necesitas implementar un sistema de procesamiento de datos en tiempo real que pueda manejar grandes volúmenes de información proveniente de múltiples fuentes. ¿Qué servicio de GCP sería el más adecuado para desacoplar los sistemas de envío y recepción de mensajes, garantizando la persistencia de los datos?
Supongamos que necesitas implementar un sistema de procesamiento de datos en tiempo real que pueda manejar grandes volúmenes de información proveniente de múltiples fuentes. ¿Qué servicio de GCP sería el más adecuado para desacoplar los sistemas de envío y recepción de mensajes, garantizando la persistencia de los datos?
Tienes un conjunto de datos masivo y desordenado que necesita ser limpiado, transformado y enriquecido antes de poder ser analizado. Buscas una herramienta que te permita realizar estas tareas de manera visual e interactiva, permitiéndote definir reglas complejas de transformación sin necesidad de escribir código extenso. ¿Qué servicio de GCP sería el más apropiado para esta tarea?
Tienes un conjunto de datos masivo y desordenado que necesita ser limpiado, transformado y enriquecido antes de poder ser analizado. Buscas una herramienta que te permita realizar estas tareas de manera visual e interactiva, permitiéndote definir reglas complejas de transformación sin necesidad de escribir código extenso. ¿Qué servicio de GCP sería el más apropiado para esta tarea?
Estás diseñando una aplicación que requiere una base de datos NoSQL con alta disponibilidad y escalabilidad global. Necesitas un servicio que pueda manejar grandes volúmenes de datos y ofrecer baja latencia para consultas en tiempo real. Además, la base de datos debe ser capaz de adaptarse automáticamente a las fluctuaciones en la carga de trabajo. ¿Qué servicio de GCP sería el más adecuado para este escenario?
Estás diseñando una aplicación que requiere una base de datos NoSQL con alta disponibilidad y escalabilidad global. Necesitas un servicio que pueda manejar grandes volúmenes de datos y ofrecer baja latencia para consultas en tiempo real. Además, la base de datos debe ser capaz de adaptarse automáticamente a las fluctuaciones en la carga de trabajo. ¿Qué servicio de GCP sería el más adecuado para este escenario?
Como arquitecto de soluciones en la nube, necesitas diseñar una plataforma de machine learning que abarque todo el ciclo de vida de los modelos, desde la preparación de datos hasta el despliegue y el monitoreo continuo. La plataforma debe permitir a los científicos de datos experimentar con diferentes algoritmos y optimizar los hiperparámetros de los modelos, mientras que al mismo tiempo debe garantizar la reproducibilidad y la escalabilidad de los experimentos. Dentro de los servicios ofrecidos por Google Cloud, ¿cuál de las siguientes opciones es la más completa y adecuada para satisfacer estos requisitos?
Como arquitecto de soluciones en la nube, necesitas diseñar una plataforma de machine learning que abarque todo el ciclo de vida de los modelos, desde la preparación de datos hasta el despliegue y el monitoreo continuo. La plataforma debe permitir a los científicos de datos experimentar con diferentes algoritmos y optimizar los hiperparámetros de los modelos, mientras que al mismo tiempo debe garantizar la reproducibilidad y la escalabilidad de los experimentos. Dentro de los servicios ofrecidos por Google Cloud, ¿cuál de las siguientes opciones es la más completa y adecuada para satisfacer estos requisitos?
Un científico de datos está experimentando con un modelo de deep learning y necesita optimizar los hiperparámetros para mejorar la precisión. Ha configurado un pipeline en AI Platform para entrenar el modelo con diferentes combinaciones de hiperparámetros, pero el proceso es lento y costoso. ¿Qué servicio específico de AI Platform podría utilizar para automatizar y acelerar la optimización de hiperparámetros, reduciendo así el tiempo y el costo del experimento?
Un científico de datos está experimentando con un modelo de deep learning y necesita optimizar los hiperparámetros para mejorar la precisión. Ha configurado un pipeline en AI Platform para entrenar el modelo con diferentes combinaciones de hiperparámetros, pero el proceso es lento y costoso. ¿Qué servicio específico de AI Platform podría utilizar para automatizar y acelerar la optimización de hiperparámetros, reduciendo así el tiempo y el costo del experimento?
¿Cuál de estos servicios en GCP está diseñado para proporcionar una plataforma de cómputo efímero que se adapta automáticamente a la demanda, escalando a cero cuando no hay tareas en ejecución, y es ideal para ejecutar microservicios en arquitecturas sin servidor?
¿Cuál de estos servicios en GCP está diseñado para proporcionar una plataforma de cómputo efímero que se adapta automáticamente a la demanda, escalando a cero cuando no hay tareas en ejecución, y es ideal para ejecutar microservicios en arquitecturas sin servidor?
Imagina que eres el arquitecto principal de una startup que está desarrollando una aplicación innovadora para análisis predictivo en el sector financiero. La aplicación necesita:
- Ingerir datos de múltiples fuentes (sensores IoT, APIs bancarias, etc.).
- Transformar los datos en tiempo real para eliminar ruido y anomalías.
- Almacenar los datos transformados de manera segura y escalable.
- Ejecutar modelos de ML complejos con un time-to-market extremadamente corto.
Dado el contexto y RESTRICTIONES de esta startup, ¿cuál es la combinación óptima de servicios GCP que minimiza la complejidad y maximiza la velocidad de desarrollo?:
Imagina que eres el arquitecto principal de una startup que está desarrollando una aplicación innovadora para análisis predictivo en el sector financiero. La aplicación necesita:
- Ingerir datos de múltiples fuentes (sensores IoT, APIs bancarias, etc.).
- Transformar los datos en tiempo real para eliminar ruido y anomalías.
- Almacenar los datos transformados de manera segura y escalable.
- Ejecutar modelos de ML complejos con un time-to-market extremadamente corto.
Dado el contexto y RESTRICTIONES de esta startup, ¿cuál es la combinación óptima de servicios GCP que minimiza la complejidad y maximiza la velocidad de desarrollo?:
Flashcards
¿Qué es Google Cloud Platform (GCP)?
¿Qué es Google Cloud Platform (GCP)?
Plataforma de Google para gestionar aplicaciones a gran escala, ofreciendo servicios al público con pago por uso.
¿Qué es una región en GCP?
¿Qué es una región en GCP?
Área geográfica que contiene zonas, que actúan como dominios de fallo independientes.
¿Qué es el modelo de responsabilidad compartida en GCP?
¿Qué es el modelo de responsabilidad compartida en GCP?
Modelo donde GCP y el usuario comparten responsabilidades en la seguridad y gestión de datos.
¿Qué es Google Cloud Virtual Private Cloud (VPC)?
¿Qué es Google Cloud Virtual Private Cloud (VPC)?
Signup and view all the flashcards
¿Qué es Persistent Disk?
¿Qué es Persistent Disk?
Signup and view all the flashcards
¿Qué es Cloud Storage?
¿Qué es Cloud Storage?
Signup and view all the flashcards
¿Qué es Cloud SQL?
¿Qué es Cloud SQL?
Signup and view all the flashcards
¿Qué es Bigtable?
¿Qué es Bigtable?
Signup and view all the flashcards
¿Qué es Dataproc?
¿Qué es Dataproc?
Signup and view all the flashcards
¿Qué es Dataflow?
¿Qué es Dataflow?
Signup and view all the flashcards
¿Qué es BigQuery?
¿Qué es BigQuery?
Signup and view all the flashcards
¿Qué es Cloud Pub/Sub?
¿Qué es Cloud Pub/Sub?
Signup and view all the flashcards
¿Qué es Cloud Datalab?
¿Qué es Cloud Datalab?
Signup and view all the flashcards
¿Qué es Cloud Dataprep?
¿Qué es Cloud Dataprep?
Signup and view all the flashcards
¿Qué es AI Platform?
¿Qué es AI Platform?
Signup and view all the flashcards
¿Qué es AI Platform Data Labeling Service?
¿Qué es AI Platform Data Labeling Service?
Signup and view all the flashcards
¿Qué es Cloud AutoML?
¿Qué es Cloud AutoML?
Signup and view all the flashcards
¿Qué es AI Platform Notebooks?
¿Qué es AI Platform Notebooks?
Signup and view all the flashcards
¿Qué es AI Platform Training?
¿Qué es AI Platform Training?
Signup and view all the flashcards
¿Qué es Explainable AI?
¿Qué es Explainable AI?
Signup and view all the flashcards
¿Qué es AI Platform Vizier?
¿Qué es AI Platform Vizier?
Signup and view all the flashcards
¿Qué es AI Platform Prediction?
¿Qué es AI Platform Prediction?
Signup and view all the flashcards
¿Qué es Cloud AI Building Blocks?
¿Qué es Cloud AI Building Blocks?
Signup and view all the flashcards
¿Qué es Vision API?
¿Qué es Vision API?
Signup and view all the flashcards
¿Qué es Video Intelligence API?
¿Qué es Video Intelligence API?
Signup and view all the flashcards
¿Qué es Translation API?
¿Qué es Translation API?
Signup and view all the flashcards
¿Qué es Natural Language API?
¿Qué es Natural Language API?
Signup and view all the flashcards
¿Qué es Dialogflow?
¿Qué es Dialogflow?
Signup and view all the flashcards
¿Qué es Cloud Text-to-Speech API?
¿Qué es Cloud Text-to-Speech API?
Signup and view all the flashcards
¿Qué es Cloud Speech-to-Text API?
¿Qué es Cloud Speech-to-Text API?
Signup and view all the flashcards
Study Notes
Introducción y objetivos
- El capítulo se enfoca en Google Cloud Platform (GCP), examinando su estructura, recursos, servicios IaaS y ofertas relacionadas con big data, analítica y machine learning.
- Los objetivos son conocer GCP como proveedor de servicios en la nube, explorar su catálogo, estudiar sus servicios IaaS para big data, y conocer alternativas PaaS y SaaS para estas tecnologías.
Google Cloud Platform
- GCP se originó para gestionar las aplicaciones de Google a gran escala y se expandió para ofrecer servicios al público bajo un modelo de pago por uso.
- Proporciona recursos accesibles globalmente, centrados en alta disponibilidad, seguridad y una variedad de servicios como almacenamiento, procesamiento y tecnologías específicas como analítica de datos e inteligencia artificial.
- Permite desplegar modelos en la nube o de forma híbrida, facilitando migraciones según las necesidades del usuario.
Regiones y zonas
- GCP ofrece disponibilidad global, dividiendo sus servicios en regiones y zonas para asegurar baja latencia y alta disponibilidad.
- Una región es un área geográfica con zonas que actúan como dominios de fallo únicos; los recursos pueden ser zonales, regionales o multirregionales.
- Al elegir dónde desplegar servicios en GCP, se consideran factores como latencia, coste, legislación y disponibilidad.
Servicios transversales: seguridad y gestión
- La seguridad es una prioridad en GCP, con un enfoque en la privacidad del usuario y medidas de protección en varias capas.
- Ofrece herramientas para la detección de amenazas y vulnerabilidades, y presta especial atención a las leyes de protección de datos.
- GCP sigue un modelo de responsabilidad compartida que especifica las obligaciones del proveedor y del usuario en seguridad y gestión de datos.
Servicios de computación
- GCP ofrece servicios gestionados para aplicaciones (PaaS) e instancias virtuales (IaaS) donde el usuario controla el hardware.
- Google Compute Engine (GCE) permite elegir configuraciones personalizadas de máquina virtual.
- Otras opciones incluyen instancias preemptibles, nodos de tenant único y servicios de contenedores como Google Kubernetes Engine (GKE) y Google Run para microservicios.
Servicios de red
- Google Cloud Virtual Private Cloud (VPC) interconecta recursos y permite el control de tráfico mediante reglas de firewall.
- Cada VPC contiene subredes, asociadas a una región, para mayor seguridad y control del tráfico.
- La gestión de tráfico eficiente se logra mediante balanceadores de carga y la creación de redes compartidas entre diferentes proyectos.
Servicios de almacenamiento
- GCP ofrece almacenamiento para bloques, objetos y archivos adaptándose a distintas necesidades.
- Persistent Disk ofrece almacenamiento persistente para instancias VM, mientras que Cloud Storage proporciona almacenamiento para objetos con alta durabilidad.
- Las opciones de almacenamiento (estándar, acceso frecuente, archivo) varían según la frecuencia de acceso.
Bases de datos
- GCP ofrece bases de datos relacionales (Cloud SQL), NoSQL (Bigtable, Cloud Firestore) y en memoria (Cloud Memorystore).
- Cloud SQL gestiona bases de datos relacionales para consultas transaccionales.
- Cloud Spanner ofrece disponibilidad y escalabilidad global.
- Bigtable y Firestore son soluciones NoSQL diseñadas para necesidades específicas de velocidad, flexibilidad y arquitectura. Cloud Memorystore provee soluciones para bases de datos en memoria con alta disponibilidad y velocidad de respuesta.
Servicios de big data y analítica
Introducción
- GCP ofrece servicios gestionados para big data y analítica, incluyendo clústeres Hadoop y herramientas propietarias, similares a AWS.
- Las tecnologías de big data pueden instalarse en instancias VM de Google Cloud Engine o en contenedores GKE.
Dataproc
- Dataproc permite desplegar clústeres Hadoop gestionados por GCP, con tecnologías como HDFS, MapReduce, YARN, Zookeeper, Hive, Pig y Spark, usando Google Cloud Storage.
- Dataproc permite autoescalado, ajustando nodos worker durante la ejecución de tareas, y se integra con BigQuery y Cloud Storage.
Dataflow
- Dataflow es un sistema ETL que usa Apache Beam para procesar datos en batch y streaming a través de pipelines (grafos dirigidos acíclicos - DAG).
- Los pipelines en Dataflow encapsulan procesos desde la adquisición hasta la producción de resultados, permitiendo flexibilidad en el manejo de fuentes y sumideros de datos.
BigQuery
- BigQuery es un sistema de almacenamiento de datos que permite consultas SQL sobre grandes volúmenes, optimizando el procesamiento sin operaciones transaccionales (OLTP).
- Usa un modelo schema-on-read, que permite inferir esquemas de datos durante el acceso; los datasets están organizados en tablas, tanto 'nativas' como 'externas'.
Cloud Pub/Sub
- Cloud Pub/Sub es un sistema de mensajería asíncrona entre publicadores y suscriptores usando topics, facilitando el desacoplamiento entre los sistemas.
- Proporciona persistencia en los mensajes y se integra con otras tecnologías GCP, siendo útil para el balanceo de carga, procesamiento asíncrono, y gestión de logs.
Cloud Datalab
- Cloud Datalab ofrece Jupyter notebooks en contenedores en instancias VM, permitiendo la exploración y transformación de datos, integrándose con BigQuery y Dataflow.
- Facilita la interacción mediante el navegador web, simplificando el análisis de datos y el uso de herramientas de machine learning.
Cloud Dataprep
- Cloud Dataprep, gestionado por Trifacta, limpia y transforma grandes volúmenes de datos en bruto para generar conjuntos de datos estructurados y listos para análisis.
- Puede leer datos de fuentes GCP y externas y es clave para el procesamiento y almacenamiento eficiente de información para su posterior análisis.
Casos de uso
- Los servicios de GCP en analítica y big data permiten construir casos de uso como procesamiento de tareas batch, exploración de datos, entrenamiento de modelos de machine learning y data warehousing.
- Se destaca la arquitectura y combinación de servicios en el desarrollo de soluciones escalables y eficientes en el manejo de datos.
Aprendizaje automático e inteligencia artificial
Servicios de machine learning en Google Cloud
- Google Cloud ofrece servicios de machine learning e inteligencia artificial, incluyendo TensorFlow, para el desarrollo de soluciones de machine learning y deep learning.
- La gama de servicios de machine learning se adapta a los conocimientos del usuario y se divide en AI Platform y Cloud AI Building Blocks.
AI Platform
- AI Platform cubre todo el ciclo de vida de los modelos de machine learning, desde la preparación de datos hasta el mantenimiento, requiriendo conocimientos técnicos.
- AI Platform Data Labeling Service permite contratar personas para etiquetar datos, asegurando que los modelos se entrenen con datos precisos.
- BigQuery Datasets ofrece conjuntos de datos masivos para el entrenamiento de modelos, tanto generados por el usuario como públicos.
- Cloud AutoML ofrece modelos preconstruidos personalizables para usuarios con poca experiencia en machine learning, con versiones para traducción, tablas, texto, video y visión.
- AI Platform Notebooks proporciona instancias de JupyterLab preconfiguradas con Deep Learning VM, optimizadas para el desarrollo y entrenamiento de modelos de deep learning.
- AI Platform Training permite entrenar modelos en la nube utilizando contenedores, mejorando la eficiencia del proceso.
- Explainable AI permite interpretar y validar los resultados de los modelos, ayudando a mejorar las predicciones.
- AI Platform Vizier optimiza los hiperparámetros de los modelos, y AI Platform Prediction gestiona el despliegue de modelos entrenados ofreciendo soporte para predicciones en tiempo real y por lotes.
- AutoML Vision Edge permite el despliegue de modelos creados con AutoML Vision.
- TensorFlow Enterprise ofrece soporte empresarial para TensorFlow, mientras que AI Platform Pipelines automatiza flujos de trabajo de machine learning utilizando Kubernetes.
- Continuous evaluation vigila el rendimiento de los modelos, y Deep Learning VM Image y Deep Learning Containers dan soporte de computación avanzada para el desarrollo de deep learning.
Cloud AI Building Blocks
- Cloud AI Building Blocks ofrece APIs que permiten resolver problemas sin conocimientos previos en machine learning.
- Vision ayuda en la clasificación de imágenes y detección de objetos.
- Video ofrece capacidades similares para el contenido de video.
- Translation permite traducir entre varios idiomas, mientras que Natural Language clasifica textos y extrae significados y entidades.
- Dialogflow facilita la creación de chatbots.
- Las APIs de Cloud Text-to-Speech y Cloud Speech-to-Text permiten la conversión de texto a voz y de voz a texto, respectivamente.
- Recommendations AI genera recomendaciones basadas en análisis de datos.
- Cloud Inference API ayuda a identificar correlaciones en datos de series temporales.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.