Introducción a la Inteligencia Artificial (PDF)
Document Details
Uploaded by Deleted User
Tags
Summary
Este documento proporciona una introducción a la inteligencia artificial (IA). Se examina la perspectiva histórica y los diferentes enfoques, incluyendo la importancia de la conferencia de Dartmouth. Se resumen ideas sobre la inteligencia artificial, desde su concepto inicial hasta las últimas aproximaciones estadísticas, como el aprendizaje profundo, y áreas de aplicación como la robótica y el procesamiento del lenguaje natural.
Full Transcript
Introducción 1 Contenidos ¿Qué es la Inteligencia Artificial? Perspectiva histórica Nacimiento: – Neurona artificial – Test de Turing – Conferencia de Dartmouth Evolución – Entusiasmo y éxitos iniciales – Años difíciles: el invierno de la IA – 1969-79...
Introducción 1 Contenidos ¿Qué es la Inteligencia Artificial? Perspectiva histórica Nacimiento: – Neurona artificial – Test de Turing – Conferencia de Dartmouth Evolución – Entusiasmo y éxitos iniciales – Años difíciles: el invierno de la IA – 1969-79: sistemas expertos – 1980-88: explotación comercial – Logros recientes y aplicaciones Hipótesis del sistema físico de símbolos Agentes inteligentes 2 Bibliografía Stuart Russell y Peter Norvig, Inteligencia Artificial – Un enfoque moderno, Prentice Hall, 2004. (capítulo 1, partes de los capítulos 2 y 26) Existen ediciones posteriores, del 2007 (en biblioteca hay dos ejemplares con código 007.52RUSint) y del 2014 (hay un ejemplar de la versión en inglés, con código 007.52RUSart). 3 ¿Qué es la Inteligencia Artificial? 4 ¿Qué es la Inteligencia Artificial? Una posible definición: La inteligencia artificial es el estudio de las computaciones que permiten percibir, razonar y actuar. Es difícil definir la IA: – Existen gran cantidad de técnicas agrupadas bajo ese término genérico: Machine Learning, Data Mining (Supervised Learning, Unsupervised Learning), Soft Computing (Genetic Algorithms, Genetic Programming, Artificial Neural Networks, Swarn Intelligence, Ant Colonies, …), Knowledge Engineering. Existen corrientes históricamente contrapuestas (aunque la tendencia actual es a la fusión de técnicas): – IA simbólica versus IA subsimbólica. – IA fuerte versus IA débil. 5 ¿Qué es la Inteligencia Artificial? La inteligencia artificial es el estudio de las computaciones que permiten percibir, razonar y actuar. Dos enfoques distintos: Ingenieril (ciencia de la computación): Crear máquinas que simulen un comportamiento inteligente (se centra en la utilidad; qué se hace). Llamado también ingeniería del conocimiento. – Objetivo: resolver problemas reales actuando como un armamento de ideas acerca de cómo representar y utilizar el conocimiento, y de cómo ensamblar sistemas. – Método: estudio de estructuras y procesos simbólicos que se puedan implementar en un ordenador. Científico (ciencia del conocimiento): Modelar y comprender la inteligencia (se centra en el método; cómo se hace). – Objetivo: determinar qué ideas acerca de la representación del conocimiento, del uso que se da a éste, y del ensamble de sistemas explican diversas clases de inteligencia. – Método: modelar la inteligencia mediante programas. Uso del ordenador para experimentar con dichos modelos y corroborar su validez. 6 ¿Qué es la Inteligencia Artificial? Russell y Norvig proponen una clasificación de las distintas definiciones usando dos dimensiones: – Una que distingue entre procesos mentales y razonamiento por un lado, y conducta por el otro. – Otra en la que por un lado se considera el comportamiento humano y por el otro el comportamiento racional (entendiendo este como comportamiento ideal). 7 ¿Qué es la Inteligencia Artificial? Comportamiento Comportamiento humano racional (ideal) S. QUE PIENSAN S. QUE PIENSAN Procesos mentales y COMO RACIONALMENTE razonamiento HUMANOS (el enfoque de las (el enfoque del modelo leyes del cognoscitivo) pensamiento – enf. logicista) S. QUE ACTÚAN S. QUE ACTUAN Conducta COMO RACIONALMENTE HUMANOS (el enfoque del agente (el enfoque del test de racional) Turing) 8 ¿Qué es la Inteligencia Artificial? Piensan como la gente Piensan racionalmente Actúan como la gente Actúan racionalmente UC Berkeley CS188 Intro to AI 9 ¿Qué es la Inteligencia Artificial? Sistemas que actúan como humanos (el enfoque del test de Turing): – «El arte de crear máquinas con capacidad de realizar funciones que realizadas por personas requieren de inteligencia» (Kurzweil, 1990) – «El estudio de cómo lograr que las computadoras realicen tareas que, por el momento, los humanos hace mejor» (Rich y Knight, 1991) 10 ¿Qué es la Inteligencia Artificial? Sistemas que piensan como humanos (el enfoque del modelo cognitivo): – «[La automatización de] actividades que vinculamos con procesos de pensamiento humano, actividades tales como toma de decisiones, resolución de problemas, aprendizaje…» (Bellman, 1978) – «Los objetivos de la IA son imitar por medio de máquinas, normalmente electrónicas, tantas actividades mentales como sea posible, y quizá llegar a mejorar las capacidades humanas en estos aspectos» (Roger Penrose, 1989) 11 ¿Qué es la Inteligencia Artificial? Sistemas que piensan racionalmente (el enfoque de las leyes del pensamiento): – «La interesante tarea de lograr que las computadoras piensen …máquinas con mente, en su amplio sentido literal» (Haugeland, 1985) – «El estudio de las facultades mentales mediante el uso de modelos computacionales» (Charniak y McDermott, 1985) – «El estudio de los cálculos que permiten percibir, razonar y actuar» (Winston, 1992) – «La IA es la parte de la ciencia de los ordenadores que investiga procesos simbólicos, razonamientos no algorítmicos y representaciones simbólicas del conocimiento usados en máquinas inteligentes» (Feigembaun y Buchanan, 1982) 12 ¿Qué es la Inteligencia Artificial? Sistemas que actúan racionalmente (el enfoque del agente racional): – «Un campo de estudio que se enfoca a la explicación y emulación de la conducta inteligente en función de procesos computacionales» (Schalkoff, 1990) – «La rama de la ciencia de la computación que se ocupa de la automatización de la conducta inteligente» (Luger y Stubblefield, 1993) 13 ¿Qué es la Inteligencia Artificial? La IA como herramienta ante la incertidumbre: – «La inteligencia artificial es una técnica para la gestión de la incertidumbre.» (Sebastian Thrun, 2011). – «La inteligencia artificial es la disciplina que se aplica cuando se quiere saber como hacer algo que no se sabe como hacer.» (Sebastian Thrun, 2011). 14 Perspectiva histórica 15 Antecedentes La IA tiene relación con multitud de disciplinas de las que ha heredado ideas y técnicas: Filosofía: teorías sobre el razonamiento y el aprendizaje, y concepción de la mente como dispositivo físico que razona con el conocimiento que contiene. – ¿Se pueden utilizar reglas formales para extraer conclusiones válidas? – ¿Cómo se genera la inteligencia mental a partir de un cerebro físico? – ¿De dónde viene el conocimiento? – ¿Cómo se pasa del conocimiento a la acción? Matemáticas: teorías de la lógica, la probabilidad, la toma de decisiones y la computación. – ¿Qué reglas formales son las adecuadas para obtener conclusiones válidas? – ¿Qué se puede computar? – ¿Cómo razonamos con información incierta? 16 Antecedentes Economía: teorías sobre las decisiones racionales. – ¿Cómo se debe llevar a cabo el proceso de toma de decisiones para maximizar el rendimiento? – ¿Cómo se deben llevar a cabo acciones cuando otros no colaboren? – ¿Cómo se deben llevar a cabo acciones cuando los resultados se obtienen en un futuro lejano? Informática: ordenadores, sistemas operativos y lenguajes de programación. – ¿Cómo se puede construir un computador eficiente? Teoría de control: construcción de sistemas autoregulados. – ¿Cómo pueden los artefactos operar bajo su propio control? 17 Antecedentes Neurociencia: teorías sobre funcionamiento del sistema neurológico, y en especial del cerebro. – ¿Cómo procesa información el cerebro? Psicología: herramientas para investigar la mente y comportamiento humano. – ¿Cómo piensan y actúan los humanos y los animales? Lingüística: teorías de la estructura y significado del lenguaje. – ¿Cómo está relacionado el lenguaje con el pensamiento? 18 Nacimiento 19 Nacimiento Hay 3 hitos que se considera que marcan el inicio de la IA. 1. La aparición de las redes neuronales artificiales: Warren, McCulloch y Pitts, (1943). – Neurona artificial. y = f(w1x1 + w2x2 +... + wnxn) – Perceptrón 2. La propuesta del test de Turing: Alan Turing, «Computing Machinery and Intelligence», 1950 – ¿Pueden pensar las máquinas? – Sustituye la cuestión por una prueba empírica (práctica). 3. La celebración de la «Conferencia de Dartmouth» (1956). – Se acuña el término «Inteligencia Artificial» – Pone en contacto a los investigadores que liderarán la disciplina los siguientes 20 años. 20 Redes neuronales artificiales Las redes neuronales toman como inspiración la neurona biológica. 21 Redes neuronales artificiales El modelo de McCulloch-Pitts Se trata de un modelo simplificado de neurona en el que ésta es considerada como un dispositivo binario con n entradas x1,... , xn, una salida y, un valor umbral , y n pesos sinápticos w1,..., wn, que miden la eficiencia con que las sinapsis afectan el potencial de la neurona. Este modelo se resume en las siguientes fórmulas: – 𝑦 = 𝑓 σ𝑛𝑖=1 𝑤𝑖𝑥𝑖 − 𝜃 Donde los wi están entre 1 y -1 (en el modelo más básico son simplemente 1 y -1) y los xi 1 o 0 y f() se puede definir como: 1 𝑠𝑖 𝑧 ≥ 0 𝑓 𝑧 = ቊ 0 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 22 Redes neuronales artificiales Otras posibles funciones de activación f() son: 1 1 𝑠𝑖 𝑧 > 0 𝑓 𝑧 = 𝑓 𝑧 = ቊ 1 + 𝑒 −𝑎𝑧 0 𝑠𝑖 𝑧 < 0 𝑓 𝑧 = tanh(z) 1 𝑠𝑖 𝑧 > 0 𝑓 𝑧 = ቊ −1 𝑠𝑖 𝑧 < 0 23 Perceptrón 24 Test de Turing Turing definió una conducta inteligente como la capacidad de lograr eficiencia a nivel humano en todas las actividades de tipo cognoscitivo, suficiente para engañar a un evaluador. El test de Turing consistía en que un evaluador humano interrogase a un humano o una computadora por medio de un terminal; la prueba se consideraba aprobada si el evaluador era incapaz de determinar si una computadora o un humano era quien había respondido las preguntas en el otro extremo de la terminal. 25 Test de Turing Para pasar el test de Turing un ordenador debería: procesar el lenguaje natural, para así poder establecer comunicación satisfactoria representar el conocimiento, para así guardar toda la información que se le haya dado antes o durante el interrogatorio razonar automáticamente, con el fin de utilizar la información guardada al responder preguntas y obtener nuevas conclusiones aprender, para que se adapte a nuevas circunstancias y para detectar y extrapolar esquemas determinados En el test total de Turing, donde el evaluador puede mostrar vídeos y pasar objetos al interrogado sobre los que hacer preguntas, se requeriría además: vista, que le permita percibir objetos y robótica, para desplazar éstos. 26 Test de Turing Ventajas: Proporciona una noción objetiva de la inteligencia Evita cuestiones relativas a la consciencia de la máquina y procesos internos que utiliza Evita la tendencia a asociar la inteligencia con seres vivos Limitaciones: Asume que la inteligencia de las máquinas es del mismo tipo que la humana Orientado a problemas que sólo exigen manipulación simbólica, descuida los aspectos como la percepción y la manipulación. 27 Conferencia de Dartmouth New Hampshire, Agosto 56 Objetivo de la conferencia: – «Examinar la posibilidad de que cada aspecto del aprendizaje o cualquier otra característica de la inteligencia pudiera ser descrita con tanta precisión que se pudiera construir una máquina que la simulase» Financiación: Fundación Rockefeller La organizan: J. McCarthy (MIT, Stanford), M. Minsky (MIT), Rochester y Shannon Participan: A. Newell y H. A. Simon (CMU, Teórico Lógico), A. L. Samuel (damas) y Berstein (ajedrez) Predicción: «Al cabo de 25 años los ordenadores harán todo el trabajo de los seres humanos» 28 Conferencia de Dartmouth Procesamiento simbólico + búsqueda heurística Método de solución de problemas: – representar simbólicamente el estado inicial – aplicar una secuencia de operaciones de transformación de símbolos hasta obtener una configuración que representa la solución del problema – la solución vendrá dada por la secuencia de operadores o por la configuración final alcanzada Heurística: – «Una heurística para un problema dado es un procedimiento que puede resolver dicho problema, pero que no ofrece garantías de hacerlo» 29 Conferencia de Dartmouth Principales logros: lógica y juegos – problemas bien definidos – número relativamente pequeño de configuraciones Desarrollos principales: – Teórico Lógico (Principia Mathematica) – General Problem Solver (GPS) 30 Evolución 31 1952–1969: Entusiasmo y éxitos iniciales Las afirmaciones de que «una máquina no podía hacer X» eran contestadas por la IA consiguiendo hacer una X tras otra. Algunos investigadores de IA se refieren a esta época como la de «Mira, mamá, ahora sin manos». Algunos logros: – El solucionador general de problemas de Newell y Simon. – Demostrador de teoremas de geometría de Herbert Gelenter. – Programa que aprendía a jugar a las damas de A. Samuel. – Definición del lenguaje de alto nivel Lisp por McCarthy. – Programa de integración simbólica de James R. Slagle. – STUDENT, un programa Lisp para resolver problemas de álgebra de Daniel Bobrow. Ver: The Thinking Machine (Artificial Intelligence in the 1960s) http://www.youtube.com/watch?v=aygSMgK3BEM 32 1966–1974: Años difíciles Fracaso al abordar «problemas reales». Ejemplo: Traducción Automática. – Inicio trabajos: 49. – ¿Resultado? Traductor Ruso-Inglés 1954. – Retirada fondos 1966 ante la escasez de resultados. – Motivo: Problemas demasiado complejos. Consecuencias: La investigación se limita a los entornos universitarios. Investigación: – Procesamiento del lenguaje natural. – Robótica. 33 DENDRAL. El primer sistema experto Heuristic Programming Project, Stanford (Feigenbaum, 1965-1975) Principal resultado: DENDRAL Programa que ayudaba a determinar la estructura de compuestos orgánicos a partir de datos experimentales: composición química y salida del espectrógrafo de masas Importancia de DENDRAL: era tan eficaz como cualquier químico profesional Característica diferenciadora: DENDRAL usa conocimiento sobre química orgánica, codificado de forma explícita. 34 1969–1979: Sistemas expertos Nuevo enfoque – para que un ordenador pueda resolver un problema complejo, ha de disponer del conocimiento necesario para resolver el problema Principales campos de investigación: – Desarrollo de lenguajes de representación del conocimiento. – Sistemas Expertos: Dendral (química), MYCIN (medicina), PROSPECTOR (prospección), XCON (configuración de equipos informáticos), … Realización: universidades y centros gubernamentales 35 1980–1988: Explotación comercial Introducción en el mercado de los productos IA (SE) Investigación: – Representación y uso conocimiento – Técnicas adquisición conocimiento – Aprendizaje – Percepción Realización: universidades, centros gubernamentales, empresas privadas. 36 1990–: Aproximaciones estadísticas Surge el concepto de agente inteligente. La IA adopta el método científico y se vuelve más rigurosa y formal. Aplicación de la probabilidad para afrontar la incertidumbre y surgimiento de las redes bayesianas (1987-). Disponibilidad de grandes conjuntos de datos (2000-), florecimiento del machine learning y los inicios del big data. Algoritmo de backpropagation para entrenar redes neuronales (re-inventado por varios investigadores a mediados de los 80). De hecho, la aparición de GPU potentes y baratas y mejoras añadidas han permitido aplicarlo a redes con numerosas capas, el aprendizaje profundo (2011-), con multitud de nuevas arquitecturas: CNN, GRU, LSTM, GAN, … y modelos pre-entrenados listos para su uso: BERT, InceptionV3, ResNet, … 37 Logros en los 20 últimos años 1997 Deep Blue se convierte en el primer ordenador en derrotar a un campeón mundial de ajedrez. 2005 Stanley, un vehículo robotizado de la universidad de Stanford, es el vencedor del DARPA Grand Challenge al ser capaz de conducir de forma autónoma durante casi 211 km a través de una ruta por el desierto por la que navegaba por primera vez. 2005 Creación de Big Dog (https://youtu.be/cNZPRsrwumQ). 2007 Tartan racing, un equipo de la Carnegie Mellon University, es el ganador del DARPA Urban Challenge consiguió conducir 88 km por un circuito urbano respondiendo a las circunstancias imprevistas del tráfico y respetando las normas de circulación. 2011 En una edición de exhibición del concurso Jeopardy!, el sistema de respuesta de preguntas de IBM, Watson, derrota a los actuales campeones del concurso. 2015 AlphaGo se convierte en el primer programa en derrotar a un jugador profesional de Go en un tablero 19 x 19. 38 Frontera de investigación Aprendizaje Automático y Minería de Datos. Big Data. Deep Learning (Generative Adversarial Networks, Convolutional Neural Networks, Deep Belief Networks, …). Reinforcemente Learning. Las aplicaciones en robótica, bioinformática, medicina de precisión, … 39 Áreas de aplicación Juegos. Como laboratorios de ideas, pero también para dar soporte al millonario negocio de la industria de los videojuegos. Demostración automática de teoremas. Usada en la industria electrónica para el diseño y verificación de circuitos integrados. Sistemas expertos. Supusieron la entrada de la IA en la empresa. Se siguen utilizando en la actualidad, entre otras cosas, para la gestión de reglas de negocio, un ejemplo es Drools. Procesamiento del lenguaje natural. Este campo engloba tanto las aplicaciones para hacer traducciones entre idiomas, como los interfaces hombre-máquina que permitan interrogar una base de datos o dar órdenes a un sistema operativo de manera que l a comunicación sea más amigable. 40 Áreas de aplicación Robótica. Navegación de robots móviles, control de brazos de robots, ensamblaje de piezas, etc. Problemas de percepción: visión y habla. Reconocimiento de objetos y del habla, detección de defectos en piezas por medio de visión, … Conducción automática de vehículos. No sólo coches, también barcos y aviones. Buscadores web. Sistemas de recomendación. Asistentes personales. Detección de spam. 41 Áreas de aplicación Biología: determinar la forma 3D de una proteína a partir de la secuencia de aminoácidos. La forma 3D determina cómo funciona una proteína y qué hace – ‘la estructura es la función’ 42 Áreas de aplicación 43 Hipótesis del sistema físico de símbolos 44 Hipótesis del sistema físico de símbolos Un sistema de símbolos físicos consiste en un conjunto de entidades llamadas símbolos que pueden existir como componentes de otro tipo de entidad llamada expresión (o estructura de símbolos, o patrón). Así, una estructura de símbolos está compuesta por un número de ocurrencias de símbolos relacionados de alguna forma física (por ejemplo, estando uno a continuación de otro). En cualquier momento, el sistema contendrá una colección de estas estructuras de símbolos. Además de estas estructuras, el sistema contiene también una colección de procesos que operan sobre expresiones para producir otras expresiones: procesos de creación, modificación, reproducción y construcción. Un sistema de símbolos físicos es una máquina que produce a lo largo del tiempo una colección evolutiva de estructuras de símbolos Este sistema existe en un mundo de objetos más amplio que las propias expresiones simbólicas Newell y Simon, ACM Turing Award Lecture, 1975 45 Hipótesis del sistema físico de símbolos Hipótesis del sistema físico de símbolos: La condición necesaria y suficiente para que un sistema físico exhiba acciones inteligentes generales es que sea un sistema de símbolos físicos. Comentarios Sólo es una hipótesis de trabajo Su aceptación establece como elementos básicos de la IA – Representación: uso de símbolos para describir el mundo – Búsqueda: examinar paso a paso las distintas posibilidades de manipular expresiones simbólicas hasta encontrar la solución 46 Agentes Inteligentes 47 Agentes inteligentes Un agente es un sistema informático, situado en algún entorno, dentro del cual es capaz de realizar acciones de forma autónoma y flexible para así cumplir sus objetivos. Un agente recibe entradas sensibles de su entorno y a la vez ejecuta acciones que pueden cambiar ese entorno. Los agentes deben poseer conocimientos y debería ser capaz de aprender de la experiencia 48 Agentes inteligentes Tipo de Percepciones Acciones Metas Entorno Agente Análisis de Píxeles de Clasificación de Clasificación Imágenes envia- imágenes intensidad la escena correcta das desde un de satélite y colores diversos satélite en órbita Robot Píxeles de Recoger partes y Poner las partes en Banda transpor- clasificador intensidad clasificarlas el bote que les tadora sobre la de partes variable poniéndolas corresponda que se encuen- en botes tran las partes Controlador Lecturas de Abrir y cerrar vál- Lograr pureza, Refinería de una temperatura vulas; ajustar la rendimiento y refinería y presión temperatura seguridad máximos Asesor Palabras escritas Ejercicios impre- Que el estudiante Grupo de interactivo sos, sugerencias obtenga la máxima estudiantes de inglés y correcciones calificación en una prueba 49 Agentes inteligentes El carácter de racionalidad de un agente depende de cuatro factores: 1. De la medida con la que se evalúe el grado de éxito logrado. 2. De la secuencia de percepciones, entendiendo por tal todo aquello que hasta ese momento haya percibido el agente. 3. Del conocimiento que el agente posea del entorno. 4. De las acciones que el agente puede emprender. Un agente racional debe emprender todas aquellas acciones que favorezcan obtener el máximo de su medida de rendimiento, basándose en las evidencias aportadas por la secuencia de percepciones y en todo el conocimiento incorporado. 50 Propiedades de los entornos Accesibles (fully observable) y no accesibles (partial observable). – Si los sensores de un agente le permite tener acceso al estado total de un entorno, se dice que éste es accesible al agente. Deterministas (deterministic) y no deterministas (stochastic) – Si el estado siguiente de un entorno se determina completamente mediante el estado actual y las acciones escogidas por los agentes, se dice que es determinista. – Un agente no tiene por qué preocuparse sobre la incertidumbre en un entorno accesible y determinista. – Si el entorno es inaccesible, entonces podría parecer que es no determinista. Episódicos y secuenciales – En un entorno episódico, la experiencia del agente se divide en «episodios». Los episodios subsecuentes no dependerán de las acciones producidas en episodios anteriores. – En entornos secuenciales, las decisiones pueden afectar al futuro. 51 Propiedades de los entornos Estáticos y dinámicos – Si existe la posibilidad de que el entorno sufra modificaciones mientras el agente se encuentra deliberando, se dice que tal entorno se comporta en forma dinámica en relación con el agente. – Si el entorno no cambia con el paso del tiempo, pero si se modifica la calificación asignada al desempeño de un agente, se dice que el ambiente es semidinámico. Discretos y continuos. – Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se dice que el ambiente es discreto. Benigno y antagonista – El entorno es benigno si no compite en contra de los objetivos del agente. 52 Clases de agentes inteligentes Agente reflejo simple: utiliza reglas de condición-acción para decidir la acción a realizar dadas las percepciones actuales (ignora el historial de percepciones). Sólo tiene sentido en entornos accesibles. No tiene en cuenta las consecuencias de sus acciones. Agente Cómo es el Sensores entorno ahora Entorno Reglas Qué acción debo Efectores condición/acción emprender 53 Clases de agentes inteligentes Agente reflejo simple 54 Clases de agentes inteligentes Agente reflejo simple function SIMPLE-REFLEX-AGENT(percept ) returns an action persistent: rules, a set of condition–action rules state←INTERPRET-INPUT(percept ) rule←RULE-MATCH(state, rules) action ←rule.ACTION return action 55 Clases de agentes inteligentes Agente basado en modelo (Agente reflejo con estado interno): puede desenvolverse en un entorno parcialmente observable manteniendo cierto tipo de estado interno, que se actualiza con información de cómo evoluciona el entorno independientemente del agente y de cómo las acciones del agente afectan al entorno. Agente Estado Cómo es el Sensores Como evoluciona el entorno entorno ahora Entorno Qué consigo con mis acciones Reglas Qué acción debo Efectores condición/acción emprender 56 Clases de agentes inteligentes Agente basado en modelo function MODEL-BASED-REFLEX-AGENT(percept ) returns an action persistent: state, the agent’s current conception of the world state model, a description of how the next state depends on current state and action rules, a set of condition–action rules action, the most recent action, initially none state←UPDATE-STATE(state, action, percept ,model ) rule←RULE-MATCH(state, rules) action ←rule.ACTION return action 57 Clases de agentes inteligentes Agente basado en metas: no le basta con conocer el estado del mundo, para decidir qué hacer requiere información sobre su meta, información que detalle las situaciones deseables, puede utilizar técnicas de búsqueda y planificación. Hace consideraciones futuras teniendo en cuenta el efecto de las acciones. Agente Cómo es el Estado Sensores entorno ahora Como evoluciona el entorno Entorno Qué consigo con mis acciones Cómo será si ejecuto la acción A Qué acción debo Metas Efectores emprender 58 Clases de agentes inteligentes Agente basado en metas 59 Clases de agentes inteligentes Agente basado en utilidad: las metas no bastan para generar una conducta adecuada y la utilidad es una función que a cada estado le asocia un grado de utilidad. Agente Cómo es el Estado Sensores entorno ahora Como evoluciona el entorno Qué consigo con mis acciones Cómo será si Entorno ejecuto la acción A Cómo seré de feliz Utilidad en el nuevo entorno Qué acción debo Efectores emprender 60 Clases de agentes inteligentes Agente de aprendizaje, con 4 componentes: elemento de aprendizaje (responsable de las mejoras), elemento ejecutor (elije las acciones, es un agente completo de alguno de los tipos previos), crítico (proporciona información sobre qué tal está siendo el desempeño), generador de problemas (propone la exploración de soluciones alternativas a la óptima hasta el momento). Estándar de desempeño Crítico Agente Sensores Retroalimentación Cambios Entorno Elemento de aprendizaje Elemento ejecutor Conocimiento Metas de aprendizaje Generador de problemas Efectores 61