Introduccion a la Robotica PDF

Introducción a la robótica Antecedentes generales de la robótica De niciones y clasi caciones Funcionalidades de un robot Otras consideraciones Referencias Lección 1 de 5 Antecedentes generales de la robótica Al comenzar el módulo 1, citamos a Hans Moravec (1993), uno de los investigadores más prestigiosos de la IA, quien, al presentar su libro El hombre mecánico: el futuro de la robótica y la inteligencia humana, planteó una serie de ideas interesantes sobre la posibilidad de que robots inteligentes nos sustituyan en el futuro y sean ellos los destinatarios de la evolución de las especies. En esa misma lectura y algo más adelante, se presentó a la robótica como una de las disciplinas que tuvo fuerte impacto en la inteligencia artiﬁcial: de hecho, contribuyó a su nacimiento juntamente con la cibernética y la ciencia cognitiva. Y desde entonces hemos citado a la entidad robot un sinnúmero de veces. Naturalmente, no es necesario volver a hacerlo, pero sí lo es abordar con mayor profundidad este importante tema. Y para ello vale la pena revisar más detalladamente los antecedentes de este concepto. El propio término robot proviene de la obra Los robots universales de Rossum (Karel Capek, 1921) y se consolidó en los años 40 con los relatos de ciencia ﬁcción de Isaac Asimov, aunque, dejando de lado la propia denominación, el concepto de robot se pierde en la historia de la humanidad. La robótica estuvo asociada a la construcción de "artefactos" que procuraron hacer realidad el deseo humano de crear seres semejantes, capaces de reemplazar al hombre en ciertas tareas, con la ﬁnalidad tanto para potenciarlo como para liberarlo de ellas. Quizás las referencias más antiguas son la de un pájaro de madera impulsado con vapor que fue capaz de volar (Arquitas de Tarento, 420 a. C.), descripciones de numerosas máquinas neumáticas y de vapor (Herón de Alejandría, Siglo I a. C.), primeros autómatas humanoides (Al Jazarí, 1206), un robot humanoide (Leonardo da Vinci, 1495), animales mecánicos capaces de desplazarse (Jacques de Vaucanson, 1738) y otras numerosas propuestas basadas en mecanismos de relojería, presentados entre esta fecha y el siglo siguiente. Volviendo a la literatura, se considera que la primera novela de ciencia ﬁcción moderna es Frankenstein o el moderno Prometeo (Mary Shelley, 1851). Luego se destacan el ya citado libro Los robots universales de Rossum (Karel Capek, 1921), Robbie (Asimov, 1940), Yo robot (Asimov, 1950), La revolución de los robots (Erler, 1956) y Los robots (PierrJean Richard, 1979), entre otros. Estando presentes en la literatura, fue natural incorporar los robots al cine. Puede decirse que, a lo largo de la historia del cine, toda película de ciencia-ﬁcción que se precie cuenta en su reparto con algún robot, además de mutantes o extraterrestres. Aquí los robots eran inicialmente creados de manera artesanal y sufrieron una evolución natural conforme se presentaban y difundían nuevas tecnologías. Evolución paralela a la que había en la propia inteligencia artiﬁcial. Se sostiene que la primera película en la historia del cine que incluyó un personaje artiﬁcial mecánico fue Metrópolis (1927). Luego se presentó El día que paralizaron la Tierra (1951); El planeta prohibido (1956); 2001, una odisea del espacio (1968) y Alien (1978), a la que habría que agregar una larguísima lista de títulos que llega hasta la actualidad. ("La condición poshumana – Reseña de Irene Cambra Badii", s.f.). Un aspecto para destacar tanto en la literatura como en el cine es el hecho que, con frecuencia, ambos han anticipado progresos de la tecnología que en el momento de su presentación eran claramente fantasiosos, propios de la ciencia ﬁcción. Por lo expuesto, es indudablemente la robótica la vertiente más antigua de la inteligencia artiﬁcial y a la vez un término muy amplio que se reﬁere a sistemas automáticos de complejidad y naturaleza muy variada: desde un simple manipulador preprogramado hasta aparatos autónomos con poder de decisión. Estos últimos son los que interesan desde el punto de vista de la inteligencia artiﬁcial. También debe aceptarse que este término engloba no solo aquellos que se materializan como elementos reales, sino también aquellos otros de concepción abstracta que se mantienen en el plano intelectual. Se encuentra aquí un claro punto de contacto entre la robótica y la teoría de la computación, con los modelos conceptuales elaborados por Turing y Von Neumann entre los años 30 y ﬁnes de los 50. En efecto, vuelve a aparecer Alan Turing como un precursor en este campo, ya que la máquina presentada en 1936 que lleva su nombre puede ser vista como un antecedente conceptual de un robot. No en vano la máquina de Turing es denominada un autómata. Pasando al plano de la electromecánica, en 1954 el inventor George Devol patentó el brazo de robot programable y en 1961 comenzó a funcionar el primer robot industrial en la General Motors. Estos trabajos mostraron un gran avance tanto en los campos de la cinemática y dinámica de mecanismos como en los de teoría de control y procesamiento de señales en tiempo real. Sin embargo, representaban muy escaso valor agregado en las áreas de interés de la inteligencia artiﬁcial. Ocurre que la conducta de estos dispositivos estaba completamente predeterminada y respondían a una concepción de “máquina de estados”, pero carecían de cualquier forma de verdadera inteligencia. Así, los trabajos sobre robótica en institutos de investigación y en la industria recorrieron por mucho tiempo caminos paralelos con muy pocos puntos de contacto. Recién los estudios sobre robots que se hacían en las universidades empezaron a tener inﬂuencia sobre el diseño de los robots industriales cuando se dieron un cúmulo de circunstancias, entre las que se destacaron las siguientes: 1 Una sustancial reducción de costos experimentada en los dispositivos “inteligentes”. 2 La necesidad de los centros de investigación de disponer de nuevas fuentes de ﬁnanciamiento. 3 Los signiﬁcativos avances en algunos campos, tales como el de la visión artiﬁcial. 4 El impulso que la exploración del espacio, la industria bélica y las industrias altamente contaminantes (nuclear) dieron a estas aplicaciones. A partir de allí los trabajos de robótica encontraron un cauce común y las necesidades industriales han ejercido una signiﬁcativa inﬂuencia en la orientación de las líneas de investigación de las universidades. Volviendo a las primeras materializaciones concretas, en 1969 se completó la construcción del robot Shakey en la Universidad de Stanford. Este fue el primer y único robot móvil de esa fecha que era controlado por programas con razonamiento. Medía 1,5 m, se movía impulsado por dos motores, llevaba una cámara de televisión y se comunicaba por radio con un computador que alojaba su inteligencia. Además, era conceptualmente impresionante, pero muy limitado en sus posibilidades reales, en parte, debido a los elevados tiempos de proceso que demandaban sus “razonamientos” y toma de decisiones. Nótese aquí que esta máquina era un claro exponente de la escuela denominada tradicional o de diseño descendente, que inicialmente dominó la inteligencia artiﬁcial. Shakey fue un buen ejemplo de que con esta escuela fue posible hacer impresionantes avances teóricos y para aplicaciones de dimensiones reducidas, pero al poco tiempo demostró severas limitaciones. A partir de aquel primer “robot inteligente” se sucedió una proliferación de artefactos cada vez más soﬁsticados, entre los que se destacaron aquellos que fueron especíﬁcamente diseñados para la exploración del espacio. Cabe ahora acotar el hecho de que la robótica reúne la contribución de dos disciplinas o corrientes del conocimiento que tienen su propia identidad e historia: la mecánica y la misma inteligencia artiﬁcial, que se pone claramente de maniﬁesto al estudiarse la robótica más en detalle. El lector lo comprobará en los apartados y lecturas siguientes. Lección 2 de 5 Deﬁniciones y clasiﬁcaciones Por tratarse de un tema de amplia difusión y habiéndose anticipado tanta información a lo largo del curso, es recomendable consolidarla a partir de una serie de deﬁniciones y clasiﬁcaciones con respecto a su signiﬁcado y alcance. Se busca así despejar toda posibilidad de duda, comenzando por la deﬁnición de la terminología habitual: Robot: Dispositivo electromecánico capaz de percibir señales del medio exterior y actuar sobre este a partir de pautas o consignas preestablecidas (conducta automática) o a partir de su propio criterio (conducta autónoma). Robótica: Se trata de la disciplina que se ocupa del estudio, diseño, construcción u operación de robots. Androide: Robot con aspecto, movimientos y algunas funciones propias de un ser humano, de locomoción bípeda. Autómata: "Máquina automática programable capaz de realizar determinadas operaciones de manera autónoma y sustituir a los seres humanos en algunas tareas" (Sinterpack, 2017, https://bit.ly/3mNCiqK). Sensor: Interfaz capaz de reconocer y medir cierta señal especíﬁca proveniente del entorno. Aquí se incluyen luz, sonido, dimensión lineal, ángulo, temperatura, presión, fuerza lineal y torque entre las principales. Sensores activos: Aportan energía a través de señales que normalmente son emitidas, reﬂejadas y devueltas al sensor. Puede citarse el caso de barreras ópticas, láser y ultrasonido, entre otras. Sensores pasivos: Se limitan a observar y capturar información, tal como nivel sonoro, desplazamiento, temperatura, luz o imágenes. Estímulo: Señal externa capaz de ser percibida a través de sensores apropiados y que afecta el comportamiento del robot. Percepción: La capacidad de interpretar un estímulo, representado por visión, sonido, olor, tacto u otros. En la práctica, o hasta el momento, los dos canales sensoriales más importantes en la robótica son la visión y audición. Acción: Manifestación que brinda como resultado movimiento, cambio de estado o situación. Proceso en el que ordenadamente se aplica energía al entorno durante un intervalo limitado de tiempo. Actuador: Dispositivo destinado a deﬁnir una acción de control a partir de la percepción. Efector: Dispositivo físico comandado por un actuador y destinado a aplicar la acción de control sobre el medio exterior. Grados de libertad: Cantidad mínima de parámetros independientes necesarios para determinar la posición y orientación de un objeto en el espacio. Suelen llamarse grados de libertad efectivos. Ejemplos: 1. Un punto (adimensional) en el espacio tiene tres grados de libertad, ya que no es orientable. 2. Un cuerpo rígido en el espacio tiene seis grados de libertad: tres de posición y tres de orientación. 3. La posición de una barra ﬂexible de dimensiones uniformes y homogéneas que vincula dos puntos tiene doce grados de libertad: seis en cada extremo. 4. Una barra ﬂexible queda completamente deﬁnida a través de inﬁnitos grados de libertad, seis por cada uno de los puntos que la componen. Robot holonómico: Cuando la cantidad de grados de libertad efectivos es igual a la cantidad de grados de libertad controlados. Normalmente, es el caso de los brazos manipuladores. Robot no holonómico: Cuando la cantidad de grados de libertad efectivos es mayor a la cantidad de grados de libertad controlados. Es el caso de la mayoría de los robots móviles. Control de dirección diferencial: Cuando se trata de un vehículo que controla independientemente las velocidades de las ruedas para mantener o cambiar la dirección. Estabilidad estática: Cuando el robot puede permanecer en equilibrio sin moverse. Estabilidad dinámica: Cuando el robot puede permanecer en equilibrio mientras se desplaza. Aquí cabe aclarar que se ha dejado pendiente la terminología referida a cinemática y dinámica de mecanismos para cuando sea tratado el tema en la lectura siguiente. En ese momento, se presentarán esquemas que facilitarán la interpretación de esos conceptos. En cuanto a las clasiﬁcaciones, se presentan las siguientes: Categorías de robots: Se reconocen las siguientes tres categorías, también reconocidas como arquitecturas básicas: 1. Manipuladores: También llamados poliarticulados. Se trata de brazos robotizados que operan en el entorno de un punto ﬁjo. Es el caso de la mayoría de los robots industriales. 2. Robots móviles: Disponen de capacidad de desplazamiento en su entorno, normalmente, utilizando ruedas. Son usados para trasladar cargas o realizar tareas exploratorias en ambientes agresivos o inaccesibles (contaminados, profundidades marinas o fuera de la atmósfera). 3. Robots humanoides: Se trata de un robot móvil equipado con manipuladores, es decir, es capaz de desplazarse y manipular objetos. Generaciones de robots: Al margen de la clasiﬁcación de los robots por categorías, resulta interesante hacerlo también según su evolución, es decir, por generación, reconociéndose las siguientes: 1.ª generación: Fueron presentados como “manipuladores” en la clasiﬁcación por categorías. Su nivel mecánico y de control es muy rudimentario. 2.ª generación: Son también manipuladores y se caracterizan por un nivel perfeccionado tanto mecánico como de control, exhiben una coordinación de movimientos más compleja y precisa. Pueden reproducir secuencias de operaciones “aprendidas”. 3.ª generación: Suman a la generación anterior una capacidad limitada de percepción del entorno, los que les brinda un primer nivel de inteligencia. 4.ª generación: Se trata de dispositivos manipuladores o móviles con mejor percepción del entorno, disponiendo de capacidad de planiﬁcación o razonamiento. 5.ª generación: Fueron identiﬁcados como humanoides en la clasiﬁcación anterior por categorías, exhiben conductas inteligentes de aprendizaje y razonamiento. Disponen, además, de muy buenas capacidades de percepción y acción. Cuando la navegación se basa en la locomoción bípeda, suelen ser denominados androides. Clasiﬁcación IFR (Federación Internacional de Robótica): También es reconocida como clasiﬁcación AFRI (Asociación Francesa de Robótica Industrial) y considera las siguientes cuatro categorías: 1. Manipulador o comando remoto con control manual o telemando. 2. Manipulador automático con ciclos preajustados, regulación mecánica precisa, control computarizado, accionamiento eléctrico, neumático o hidráulico. 3. Dispositivo programable con trayectoria continua o “punto a punto”. No dispone de conocimiento sobre su entorno. 4. Dispositivo con capacidad con percepción de su entorno y la posibilidad de adecuar su conducta con base en ella. Tipos de percepción: En realidad, hay tantos tipos de percepción como haya sensores disponibles que permitan identiﬁcar señales físicas y se tenga interés o necesidad de interpretarlas como un estímulo. En un robot podrían identiﬁcarse estas dos principales: 1. Visión. 2. Audición. Visión: Dan lugar a la escala de complejidad en la interpretación que sigue: Clasiﬁcación de la visión: La escala de capacidad creciente de identiﬁcación e interpretación de complejidad incluye señales (tipo 1) e imágenes (tipo 2), y es la que se detalla a continuación: 1. Identiﬁcación de presencia luminosa (1) 2. Interpretación de señales (1) 3. Análisis dimensional (1 y 2) 4. Reconocimiento de patrones (2) 5. Comprensión de imágenes (2) Clasiﬁcación de imágenes: En el tratamiento de imágenes, es fundamental reconocer sus atributos de representación, donde los principales son los siguientes: 1. Tipo de representación: Vectorial o matriz de puntos. 2. Dimensiones: 2D o 3D. 3. Color: B&W o color. En este último debe deﬁnirse la resolución cromática (cantidad de colores). 4. Representación de almacenamiento: Para el caso vectorial, la estructura de datos especíﬁca; de lo contrario, el formato establecido (GIF, PNG, JPG, etc.) o mapa de bits. Audición: Dan lugar a la escala de complejidad en la interpretación que sigue: Clasiﬁcación de la audición: En la capacidad de interpretación sonora hay dos tipos: reconocimiento de señales (tipo 1) y reconocimiento del habla (tipo 2). En una escala de complejidad creciente, es habitual considerar como mínimo los siguientes niveles: 1. Identiﬁcación de presencia sonora (1). 2. Interpretación de señales sonoras codiﬁcadas (1). 3. Reconocimiento de órdenes (1). 4. Reconocimiento del lenguaje natural (2). 5. Nivel de dependencia del orador (2). 6. Capacidad de interpretación de discurso continuo (2). 7. Capacidad de interpretación en tiempo real (2). 8. Nivel de limitación impuesta por el tamaño del vocabulario (2). 9. Nivel de limitación impuesta por la complejidad gramatical (2). Tipos de acción: Se reconocen dos formas principales de acción por parte del robot: 1. Navegación: Se reﬁere a la capacidad de desplazarse en el entorno de trabajo planiﬁcando la ruta para llegar a destino con el menor esfuerzo y evitando obstáculos ﬁjos o móviles. 2. Manipulación: Se reﬁere a la capacidad de identiﬁcar un objeto, tomarlo, trasladarlo, posicionarlo y abandonarlo. Capacidad de desplazamiento 1. Dirección diferencial: Ya descripta en las deﬁniciones de terminología. 2. Conducción sincronizada: Cada rueda se puede orientar y rotar independientemente en su propio eje. 3. Locomoción bípeda: Traslado de los seres humanos. La principal diﬁcultad es el control estático y dinámico del desplazamiento en tiempo real, manteniendo simultáneamente el equilibrio del robot. Es utilizada en los androides. 4. Zoomórﬁcos caminadores: Se caracterizan por disponer de un sistema de locomoción “multípeda” que imita a los diversos seres vivos. 5. Zoomórﬁcos no caminadores: Disponen de formas especiales de traslado a través de orugas y otros dispositivos que también buscan reproducir los recursos de los seres vivos. Todavía están poco evolucionados. Tipos de navegación: 1. Puntual (trayectoria): Se recorre una secuencia de puntos deﬁnidos por (X, Y, Z). 2. Dimensional (posicional): Se recorre una secuencia de posiciones deﬁnidas por puntos (X, Y, Z) y sus respectivas orientaciones (α, β, δ). Tipos de manipulación: 1. Insensible: Los objetos tomados no presentan restricciones. 2. Sensible: Los objetos presentan restricciones en fuerzas o presiones soportadas. Requerimientos de la manipulación: Las condiciones que deben cumplirse son las siguientes: 1. Trayectorias prescriptas. 2. Coordinación de movimientos. 3. Posicionamiento preciso. 4. Sujeción con esfuerzo apropiado. C O NT I NU A R Lección 3 de 5 Funcionalidades de un robot La utilización de los robots muestra un sostenido crecimiento en todos los campos, incluyendo el industrial, comercial, militar y médico. Además, a cada momento se comprueba su utilización en nuevas aplicaciones, tanto por incursionar en nuevos campos como también por su permanente perfeccionamiento, que les permite ofrecer nuevos y más precisos desempeños. La clave de su aceptación es la posibilidad de realizar tareas de forma más precisa, a menor costo o que no pueden desempeñar los seres humanos. En la actualidad, los robots se usan en plantas de manufactura, montaje, embalaje y transporte. También en laboratorios, ámbito militar, ámbito médico y producción masiva de bienes industriales o de consumo. Otra ventaja de su utilización es hacer posible la incursión en ámbitos que están fuera del alcance del hombre o son inapropiados, como es el caso de las grandes profundidades marinas, el espacio extraterrestre y los lugares severamente contaminados por radiactividad, presencia de elementos tóxicos o intensos campos magnéticos. Habiéndose revisado los escenarios en que operan con ventaja los robots y habiéndolos clasiﬁcado, aparecen totalmente naturales y justiﬁcadas las tres categorías presentadas al comenzar las clasiﬁcaciones en el apartado anterior. Se identiﬁcaron las siguientes: 1 Robots manipuladores o poliarticulados: Se trata de brazos robotizados que operan en el entorno de un punto ﬁjo, es decir, que están destinados a seleccionar, manipular e instalar objetos, pero tienen el alcance de su brazo y no se desplazan. Variantes: Cantidad de grados de libertad controlados, dimensiones y exactitud en el posicionamiento requerido. Aplicaciones: Un amplio espectro que va desde diminutos trabajos de alta precisión en cirugía médica hasta la instalación de piezas en líneas de montaje. 2 Robots móviles: Disponen de capacidad de desplazamiento en su entorno, normalmente, utilizando ruedas. Su ventaja es la posibilidad de desplazarse por diversas trayectorias según el caso. Variantes: La principal es si solo están destinados a mover cargas o deben también sumar la capacidad de carga y descarga. En este último caso, se trata de un robot móvil con manipulador, llamados también híbridos. Y deben considerarse los requerimientos del manipulador, al igual que en el caso anterior. Aplicaciones: Sus dos aplicaciones extremas son el traslado de material entre dos puntos (descarga de buques, abastecimiento de líneas de montaje, etc.), donde no suele requerirse manipulación (la carga y descarga está a cargo de grúas) y la operación en ambientes hostiles, donde además de desplazarse en un medio inaccesible al hombre (fondo marino, superﬁcie marciana, ambiente contaminado, etc.), deben realizar tareas de manipulación de objetos y su montaje. 3 Humanoides: Se trata de un robot móvil equipado con manipuladores, es decir, capaces de desplazarse y manipular objetos, también denominados androides. Son los tipos de robots más exigidos en cuanto a su nivel de inteligencia y diversidad de percepciones, las que deben ser acordes a las prestaciones esperadas. Variantes: A partir de una ﬁsonomía similar a la humana, deben deﬁnirse las cualidades requeridas en cuanto a su capacidad de comunicación, percepción de otros estímulos, capacidad de traslado y posicionamiento de objetos, velocidad de traslado, coordinación de movimientos, equilibrio y otras cualidades asociadas con la inteligencia. Aplicaciones: Reemplazo del ser humano en el desempeño de actividades físicas e intelectuales. Como puede apreciarse, la apropiada selección de un robot requiere de una detallada especiﬁcación de: requerimientos funcionales, consecuencia de los servicios que debe prestar; requerimientos no funcionales, que son emergentes del sistema en su conjunto como consecuencia de las prestaciones esperadas y el tipo de actividad por desempeñar. Figura 1: Manipulador, robot móvil y humanoide Fuente: elaboración propia basada en "Robots industriales", s.f., https://bit.ly/3gcrZLz MiR 200, s.f., https://bit.ly/32gYuAb C O NT I NU A R "Robot NAO para empresa y educación", s.f., https://bit.ly/3tou4b3 Lección 4 de 5 Otras consideraciones Con la ﬁnalidad de familiarizarse con la robótica desde una perspectiva diferente, se sugiere hacer en la web una búsqueda sobre uno de los siguientes tres temas: “Robótica educativa”, “Robot Battle” y “Real Time Battle”. Desafío propuesto a partir de las notas anteriores Este último módulo de la materia se ocupa de la robótica, que como ya se anticipó reúne la contribución de dos disciplinas o corrientes del conocimiento que tienen su propia identidad e historia: la mecánica y la misma inteligencia artiﬁcial. Los robots sin la inteligencia artiﬁcial estarían limitados al desempeño de autómatas (de hecho, ya ocurrió) y estas entidades sin la mecánica no tendrían forma de expresarse eﬁcazmente en el mundo real, estarían destinadas a ser simuladas en el computador. Cosa que también ocurrió. Es decir, ambos constituyen un perfecto complemento que nos ocupará las cuatro lecturas de este módulo. Completada esta lectura, te invito a responder los interrogantes que se presentan a continuación. Luego, el siguiente paso será consultar el capítulo 25 de Russell (páginas 1023 a 1028) en el que se trata este asunto. Cabe aclarar que la lectura procura ser orientativa en cuanto al alcance y profundidad con que se espera tratar el tema en el libro, ya que en particular el libro de Russell tiene mucho más material del que estamos en condiciones de abordar en el curso. Por último, te invito a volver sobre las preguntas aquí formuladas y las respuestas propuestas con un espíritu de autocontrol ﬁnal. La intención es estimular una mirada crítica al trabajo realizado desde una posición de mayores conocimientos sobre los temas tratados. Se reitera que estas preguntas tienen como única ﬁnalidad contribuir a que el estudiante compruebe por sí mismo sus conocimientos. No se trata de una instancia de evaluación. Las consignas son las siguientes: 1. Ensaya una deﬁnición propia de robot. 2. Identiﬁca los tres términos (a excepción de la deﬁnición presentada de robot) que consideraste más esclarecedores. 3. Identiﬁca 4. A las tres clasiﬁcaciones vinculadas a robots que consideras las más necesarias y esclarecedoras. partir de la clasiﬁcación de los robots en generaciones, asocia cada uno de los niveles de inteligencia con los modelos de agentes de Russell y Nilsson. 5. Identiﬁca las capacidades de percepción y acción que, a tu juicio, son esenciales para que un robot pueda tener una mínima interacción con los seres humanos. C O NT I NU A R Lección 5 de 5 Referencias La condición poshumana – Reseña de Irene Cambra Badii. (s.f.). Recuperado de https://www.kubernetica.com/2013/07/18/la-condicion-poshumana-resena-de-irene-cambra-badii/ MiR 200. (s.f.). Recuperado de https://www.mtstech.eu/project/mir-200/ Moravec, H. (1993). El hombre mecánico: el futuro de la robótica y la inteligencia humana. Barcelona: Salvat. Robot NAO para empresa y educación. (s.f.). Recuperado de https://revistaderobots.com/robots-y-robotica/robotnao-caracteristicas-y-precio/ Robots industriales. (s.f.). Recuperado de http://www.mekkam.com/project-type/robots-industriales/ Sinterpack. (2017). Robótica colaborativa. Recuperado de http://sinterpack.com/es/noticias/106/roboticacolaborativa C O NT I NU A R Aspecto mecánico de la robótica De niciones de los términos mecánicos de la robótica Análisis cinemático de un manipulador Estudio de un manipulador plano Otras consideraciones cinemáticas Referencias Lección 1 de 5 Deﬁniciones de los términos mecánicos de la robótica Al completarse la lectura 1, se reiteró la presencia en la robótica de dos disciplinas con su propia identidad e historia, ambas indispensables para alcanzar el estado actual de desarrollo de este tema. Surge entonces la necesidad de justiﬁcar ante el lector, estudiante de Sistemas, la presentación de conceptos propios de la mecánica. Naturalmente, se lo hará en forma introductoria y conducirá a ejemplos integradores de ambas corrientes del conocimiento. También se anticipó que quedaba pendiente la terminología referida a cinemática y dinámica de mecanismos, así como también sus clasiﬁcaciones. En consecuencia, se comienza por presentar estos términos y sus signiﬁcados. Cinemática: Ciencia que trata el movimiento sin considerar las fuerzas que lo ocasionan, incluyendo el estudio de posiciones, velocidad, aceleración y sus derivadas de mayor orden con respecto al tiempo. Manipulador: Brazo conformado por vínculos casi rígidos conectados entre sí por articulaciones, las que permiten movimientos relativos entre elementos adyacentes. Es la base del brazo robotizado. Cinemática directa: Representa el problema básico de conocer el movimiento ﬁnal de un manipulador a partir de ciertos ángulos girados por las sucesivas articulaciones del brazo. Cinemática inversa: Conocida una posición y orientación ﬁnal deseada para un manipulador, es el problema de determinar las rotaciones que deberán ser aplicadas en las sucesivas articulaciones para obtenerlos. Deﬁne el espacio de articulaciones internas del robot y es normalmente el principal problema por resolver. Su determinación no es sencilla, puede no tener solución o inclusive haber múltiples soluciones. Punto operacional: El punto del extremo del manipulador cuya posición y movimiento interesa a los efectos de la función especíﬁca del robot. Trayectoria: Representa el lugar geométrico de las sucesivas posiciones alcanzadas por el punto operacional de un manipulador cuando se realiza una secuencia de variantes (rotaciones) en el espacio de articulaciones internas del brazo. Dinámica: Ciencia que trata las fuerzas requeridas para provocar determinados movimientos, permitiendo una rápida respuesta compatible con las posibilidades del mecanismo. En este caso, se procura obtener aceleraciones iniciales y ﬁnales suaves y progresivas, considerando las fuerzas gravitatorias y fuerzas de inercia. Torque: Fuerza aplicada a cierta distancia de un eje, también denominado momento. Coordenadas: Conjunto ordenado de tres valores que deﬁnen unívocamente un punto en el espacio. Se adopta aquí como referencia el sistema de coordenadas cartesianas ortogonales. Posición: Es la ubicación de un punto en el espacio y queda deﬁnido por las tres coordenadas. Normalmente, se las reúne en un vector denominado vector posición {P}. Orientación: La deﬁnición de un cuerpo sólido en el espacio requiere la posición de uno de sus puntos y también la orientación de tres ejes ortogonales asociados al sólido. Para esto último se describen los vectores unitarios de los tres ejes principales en términos del sistema de referencia, conformando una matriz de rotación. A los componentes de esta matriz de rotación se los denomina cosenos directores. Trama: Para especiﬁcar completamente dónde se encuentra el extremo operativo de un manipulador es necesaria una posición y una orientación, que lleva el nombre propio de Trama. Transformada homogénea: Matriz de orden 4 que incluye la información de posición y orientación y cumple la función de un operador de transformación. Si bien se está poniendo el foco en la mecánica del robot, debe tenerse en cuenta que los requerimientos en cuanto a desempeño estarán directamente relacionados con la autonomía del robot, distinguiéndose los siguientes tres casos: 1 Robot preprogramado: Las trayectorias están incorporadas al robot a través de un lenguaje de programación, pudiendo seguir diferentes trayectorias a partir de la identiﬁcación de objetivos. Se trata de un problema de cinemática directa. 2 Robot con aprendizaje: El robot “aprende” (memoriza) sus trayectorias a partir de operaciones “manuales” del brazo y sucesivos ajustes. También es cinemática directa. 3 Robot autónomo: El robot debe reconocer las rotaciones requeridas en cada articulación para seguir trayectorias apropiadas a ﬁn de resolver un problema. Se trata de una solución que puede no ser conocida y requiere de cinemática inversa. Lección 2 de 5 Análisis cinemático de un manipulador Para interpretar con claridad el problema, se presenta en la ﬁgura 1 el esquema de un brazo manipulador. Figura 1: Esquema del brazo manipulador de 7 grados de libertad del robot Kuka LWR 4+ Fuente: Zaplana, Claret y Basanez, 2018, p. 194. Estos brazos están compuestos de elementos teóricamente rígidos (no hay material completamente rígido, se lo considera así si sus deformaciones son pequeñas) que están vinculados entre sí por articulaciones, las que permiten movimientos relativos entre componentes adyacentes. Su ﬁnalidad es permitirle al brazo alcanzar los puntos necesarios en el dominio de operación y posibilitar la orientación apropiada para la tarea asignada (sujeción, manipulación, traslado, montaje, etc.). Sobre la base de la función especíﬁca prevista, en el diseño del brazo se deﬁnen las dimensiones de los vínculos rígidos, su forma y la cantidad de rotaciones requeridas. Al actuar, el punto operacional del manipulador debe seguir una cierta trayectoria con el extremo en una determinada orientación establecida (trama) para cumplir su función. Para ello, en el caso del ejemplo de la ﬁgura 1, se deben deﬁnir los siete ángulos requeridos para la trama en cada punto de la trayectoria. Estas secuencias de rotaciones estarán completamente preestablecidas en manipuladores automáticos (cinemática directa) y deben ser deﬁnidas durante la operación en el caso de robots autónomos. La deﬁnición de las rotaciones necesarias a partir de la trayectoria deseada ya fue citada como cinemática inversa. Para reconocer la real complejidad del problema, debe agregarse que la deﬁnición cinemática es solo una parte de la solución. Las variaciones en las rotaciones dan lugar a que todos los puntos del brazo experimenten distintas velocidades y aceleraciones, las que deben estar dentro de ciertos límites compatibles con la función realizada y la resistencia de los materiales. Debe recordarse aquí que las aceleraciones son sinónimo de fuerzas que deben ser aplicadas o soportadas. Por ese motivo, en el diseño de mecanismos, adquiere especial importancia el jerk, que representa la rapidez con que cambia la aceleración. Es decir, el jerk es la derivada tercera del desplazamiento con respecto al tiempo (la aceleración es la derivada segunda). Los métodos generales para la obtención de los modelos cinemáticos se basan en asociar un sistema de referencia a cada articulación. Se presentará a continuación la transformación que relaciona los sistemas de referencia de dos eslabones consecutivos. Es decir, la posición y orientación del sistema de referencia de la articulación j con respecto al sistema de referencia de la articulación j-1 queda representada por una matriz de transformación de orden cuatro en la que se destacan otras tantas particiones, tal como la siguiente: Las dos particiones operativas son: Rj que es la matriz de rotación y Pj un vector posición, ambos de orden tres. La matriz de rotación Rj deﬁne la orientación del sistema j respecto del j-1. Aquí cabe acotar que Rj representa una transformación ortogonal, por lo que su transpuesta es igual a su inversa. Por su parte el vector Pj deﬁne el origen del sistema j respecto del j1. Esto signiﬁca que un brazo manipulador puede ser completamente deﬁnido desde el punto de vista cinemático asociando una matriz Tj a cada articulación. Por lo tanto, al considerarse un brazo con n articulaciones, la relación entre ambos extremos está dada por: Se dice que un manipulador tiene n grados de libertad si su conﬁguración debe ser especiﬁcada, como mínimo, por n variables independientes. En un manipulador, la cantidad de articulaciones simples determina el número de grados de libertad y sus valores deﬁnen las conﬁguraciones. Por otra parte, la solución de la cinemática inversa de los robots manipuladores consiste en obtener las conﬁguraciones asociadas a una secuencia de tramas del elemento terminal (trayectoria). Las posibles soluciones de la cinemática inversa se clasiﬁcan en tres grupos: 1 Analítica: Se obtienen las expresiones generales que deﬁnen las rotaciones a partir de secuencias de tramas, las que son resueltas analíticamente. 2 Numérica: El planteo es similar en el sentido que se identiﬁcan las expresiones que gobiernan el problema, pero se las resuelve numéricamente por métodos algorítmicos o iterativos. 3 Modelo neuronal: A partir de la relación entrada/salida (rotaciones --> tramas) se entrena un modelo neuronal artiﬁcial que permita conocer las rotaciones que corresponden a cada punto de una trayectoria (tramas --> rotaciones), alcanzando el mismo desempeño que el de la expresión que gobierna el problema, a pesar de que en este caso esta es altamente compleja y completamente desconocida. Como ya se ha comentado a lo largo del curso, los modelos neuronales artiﬁciales demostraron ser un excelente recurso para reproducir el desempeño de funciones altamente complejas, solo conocidas a través de sus desempeños entrada/salida, siendo este uno de esos casos. También ya fue anticipado que en estos casos se utilizan modelos multicapa de perceptrones, es decir, redes supervisadas no recurrentes. La diﬁcultad aquí reside en identiﬁcar la arquitectura apropiada para obtener un buen desempeño y entrenar el modelo. Lección 3 de 5 Estudio de un manipulador plano Se propone un ejemplo en dos dimensiones a efectos de hacer un análisis detallado de una solución de cinemática directa e inversa, ya que al usar un mecanismo plano se facilita su interpretación sin quitar generalidad a los procedimientos. En la ﬁgura 2 se presenta el esquema del brazo manipulador, que tiene la ﬁnalidad de tomar piezas de un reservorio y montarlas con precisión sobre equipos que circulan por una línea de montaje. El manipulador es pequeño, con un brazo con tres segmentos, que extendido es de una longitud de 90 cm. Figura 2: Manipulador posicionado con los tres ángulos αA = αB = αC = 30o Fuente: elaboración propia. El brazo del manipulador al que se hace referencia está formado por tres segmentos denominados AB, BC y CD con largos de 40 cm, 30 cm y 20 cm respectivamente. El punto D representa el lugar donde es montada la herramienta de trabajo. En la ﬁgura 2 se presenta el brazo con sus tres segmentos girados 30º respecto de sus referencias a efectos de simpliﬁcar el cálculo. Tal como fue anticipado, las tres matrices de transformación responden a una forma general que incluye a la matriz de rotación Rj y al vector posición Pj, ambos de orden tres. Debe observarse que la matriz de rotación de orden tres incluye las transformaciones que corresponden a los tres ejes en cada articulación, aunque aquí el tercero no es transformado porque en las tres articulaciones son paralelos (eje Z). A partir de las matrices de transformación de cada segmento del brazo, se obtiene la matriz de transformación que vincula sus dos extremos. Puede observarse que los parámetros de la submatriz de posición P se corresponden con la ubicación del punto D respecto del sistema de referencia principal, con origen en A. Las coordenadas son PD = {50,72, 66,21, 0,00} y la distancia AD = 83,40. Si a partir de los sucesivos conjuntos de tres ángulos se reitera el cálculo anterior, se obtendrá la trayectoria del punto D desde el inicio hasta la ﬁnalización del movimiento del brazo. Es lo que ya se deﬁnió como cinemática directa y los resultados se muestran en la ﬁgura 3. Figura 3: Manipulador en su posición inicial (A-B-C-D) y ﬁnal (A-B’-C’-D’) Fuente: elaboración propia. En la ﬁgura 3 se presenta a la derecha un esquema del brazo en su posición inicial, en la que toma la pieza (A-B-C-D) y a la izquierda su posición ﬁnal, en la que monta la pieza (A-B’-C’-D’). En el eje de las abscisas se representan las componentes horizontales de cada posición del punto D y en el eje de las ordenadas las componentes verticales, luego la curva 1 (azul) representa la trayectoria del punto D, desde la posición inicial hasta la ﬁnal. Se aprovecha la ﬁgura para representar con la curva 2 (verde) el largo efectivo del brazo entre sus dos extremos (distancia AD). Obsérvese que cuando la curva 2 pasa por un máximo el brazo está casi completamente extendido (L ≈ 90; αB ≈ 0o; αC ≈ 0o). Dado que esta trayectoria proviene de las sucesivas rotaciones de tres articulaciones, resulta también interesante representar su evolución y para ello se lo hace nuevamente tomando como abscisas los componentes horizontales (X) de cada posición del punto D. Se utilizan las mismas abscisas para facilitar las comparaciones y se muestran las curvas en la ﬁgura 4, representándose nuevamente el brazo en sus dos posiciones extremas. Figura 4: Evolución de los ángulos de las articulaciones del brazo Fuente: elaboración propia. Antes que nada, cabe aclarar que para facilitar la interpretación del gráﬁco se representan los ángulos respecto del sistema de referencia global (ejes coordenados asociados al punto A), a los que se denominan Ω en lugar de α. Como puede observarse, los ángulos iniciales son ΩA = 60º, ΩB = -30º y ΩC = -90º, arribándose a los valores ﬁnales en la posición A-B’-C’-D’, donde son ΩA = 120º, ΩB = 150º y ΩC = 180º. Obsérvese que los ángulos muestran (ΩA, 3 / azul, ΩB, 4 / verde y ΩC, 5 / rojo) que nunca los tres segmentos del brazo están completamente alineados. El punto en el que están más próximos de hacerlo corresponde a X = -14,581 y los ángulos son ΩA = 102º, ΩB = 96º y ΩC = 99º. Por ese motivo la distancia AD nunca llega a 90, su valor máximo es 89,906 cm. Como se puede apreciar, la cinemática directa es totalmente analítica y requiere de mucha observación. El objetivo siguiente es la cinemática inversa, es decir, obtener los tres ángulos necesarios para posicionar los segmentos del brazo, de manera que la posición del punto D (deﬁnido por las coordenadas X e Y) correspondan a uno cualquiera de los puntos de la trayectoria. Como se anticipó, se utilizará aquí un modelo neuronal de perceptrones multicapa, donde las entradas serán los valores de cierta posición de la trayectoria (X e Y), y la salida esperada, los valores de los tres ángulos (ΩA, ΩB y ΩC). Para ello se comienza por ordenar los datos a ﬁn de disponer de los pares de entrada/salida para el entrenamiento del modelo, que en este caso consiste en 21 juegos y son representados en la ﬁgura 5. Figura 5: Coordenadas de puntos de la trayectoria del brazo y ángulos girados Fuente: elaboración propia. Es importante aclarar que el hecho de que los datos de entrenamiento sean 21 es algo totalmente arbitrario. Conocidos los valores extremos de ΩA, ΩB y ΩC asociados a las posiciones iniciales y ﬁnales del brazo, lo que en este caso se hizo fue reconocer veinte intervalos angulares iguales a lo largo de la trayectoria. Surge así que: El paso siguiente es completar la arquitectura del modelo, que como ya se anticipó tiene dos entradas (coordenadas X e Y) y tres salidas (ángulos de las articulaciones). Mediante un proceso exploratorio de prueba y error se deben ajustar la cantidad de capas ocultas y las cantidades de unidades en cada capa. Aquí se trabajó con una capa oculta y se hicieron pruebas con diferentes cantidades de unidades. En la ﬁgura 6 se muestra un esquema del modelo adoptado. Figura 6: Esquema del modelo de perceptrones multicapa Fuente: elaboración propia. Al igual que en los casos presentados en el módulo 3, para el entrenamiento del modelo neuronal se usó una aplicación de desarrollo propio que, a medida que realiza el ajuste de pesos, representa en un gráﬁco la evolución del error y también el valor del módulo de un vector que es la resultante de la totalidad de los pesos sinápticos. Ambas curvas son de mucha utilidad por facilitar la evaluación del proceso de ajuste y su convergencia. En este caso, el proceso de ajuste del modelo fue laborioso y probablemente haya que probar alternativas con más capas ocultas. No obstante, ﬁnalmente, se alcanzó un muy buen resultado con 25 unidades sobre la única capa oculta utilizada. En la ﬁgura 7 se muestra la pantalla de aplicación una vez concluido el ajuste de pesos después de 1600 ciclos y la representación de una ventana que contiene los ángulos correspondientes a los datos de entrenamiento y los calculados por el modelo. Puede apreciarse que estos últimos son muy próximos a los primeros, con errores que son muy pequeños. La curva roja es el módulo del vector pesos y la verde el error obtenido. Figura 7: Pantalla de la aplicación utilizada para entrenar el modelo Fuente: elaboración propia. Los resultados obtenidos muestran la factibilidad de dejar a cargo de un modelo neuronal las predicciones de cinemática inversa. Es decir, una vez que se decide avanzar según cierta trayectoria, el modelo neuronal determina los ángulos necesarios en cada articulación para alcanzar los sucesivos puntos. Cabe aclarar que la propia decisión del camino elegido es ajena a este modelo, que se limita a hacerla posible. Se trata de diferentes niveles de decisión. En el nivel superior, el estratégico, se habrá evaluado la conveniencia de la trayectoria elegida, así como su factibilidad de acuerdo con las velocidades, aceleraciones y jerks involucrados. C O NT I NU A R Lección 4 de 5 Otras consideraciones cinemáticas La cinemática acompaña a la inteligencia artiﬁcial desde que se concretaron los primeros robots con movimiento, es la base de la manipulación, por lo que es imposible no incluirla en un curso de robótica. También está presente, aunque probablemente en menor medida, en la navegación. El probablemente obedece a que, si bien en su mayoría el traslado de los robots recurre a la convencional “rueda”, hay excepciones cuando se debe transitar sobre superﬁcies muy irregulares y se adoptan soluciones muy elaboradas y originales desde el punto de vista cinemático. Ambas, la manipulación y la navegación, reúnen la capacidad de acción de un robot, la posibilidad de manifestarse físicamente. Y aquí hay que destacar que la complejidad implícita de los recursos previstos en la acción de un robot es totalmente independiente de su nivel de autonomía. En su gran mayoría, tanto los robots manipuladores como los móviles son autómatas, dispositivos completamente automáticos, a la vez que con mucha frecuencia responden a diseños muy complejos y elaborados desde el punto de vista cinemático. No es casualidad que la inteligencia artiﬁcial haya recurrido a la mecánica cuando tuvo que dotar sus desarrollos de capacidades físicas apropiadas. Lo que se quiere expresar aquí es que, en la robótica clásica, las trayectorias de los manipuladores y los recorridos de los equipos móviles no son decididos en tiempo real. Ni tampoco por el propio robot. Por el contrario, han sido minuciosamente estudiados con anterioridad para alcanzar tres de los principales requisitos de los procesos de fabricación modernos: rapidez, conﬁabilidad y precisión. Naturalmente, hay numerosas excepciones. Uno de los casos es el representado por los robots que operan en grandes extensiones desconocidas y no estructuradas, en las que deben enfrentarse con signiﬁcativas incertidumbres tanto en la navegación como en la identiﬁcación de objetos, su manipulación y posicionamiento. En efecto, hay casos en que la incertidumbre convierte una actividad relativamente trivial para un manipulador o robot móvil industrial en una tarea de alta complejidad. Como ejemplos pueden citarse tareas realizadas en el fondo marino, profundidad de la tierra o superﬁcies desérticas. Como compensación por tener que enfrentarse con tanta incertidumbre del entorno, no se espera que estos robots sigan trayectorias o alcancen su destino ﬁnal con el mismo nivel de precisión o eﬁciencia que se obtendrían en escenarios bien deﬁnidos. Todo este conocimiento, consolidado en el desarrollo de robots manipuladores y móviles, poco atractivos desde el punto de vista intelectual, es el que está haciendo posible el rápido desarrollo y sorprendentes soluciones que presentan sucesivamente los robots humanoides: cada vez más próximos al hombre en sus habilidades físicas y cognitivas. Es decir, los humanoides representan en la actualidad el cúmulo de la experiencia y conocimiento de la robótica: entidades inteligentes y físicamente hábiles. La percepción y la navegación serán en foco de la siguiente lectura del módulo 4. Desafío propuesto a partir de las notas anteriores Desde hace décadas los robots se han ido incorporando de diferente manera a nuestra cultura, proceso que progresivamente se viene acelerando. Es un proceso que, como ha sido visto, fue anticipado por la literatura y el cine. En el pasado no había dudas de que se trataba de ﬁcción y en el presente cada vez hay menos dudas sobre la posible materialización de estas predicciones fantásticas. No habría motivo para no creer que nos espera un futuro que será compartido con robots de todo tipo. Todo un desafío para el ser humano y un llamado a la reﬂexión. Completada esta segunda lectura sobre robots, te invito a responder los interrogantes que se presentan a continuación. Luego, el siguiente paso será consultar el capítulo 25 de Russell (páginas 1027 a 1028 y 1039 a 1043) en el que se trata este asunto. Cabe aclarar que la lectura procura ser orientativa en cuanto al alcance y profundidad con que se espera tratar el tema en el libro, ya que en particular el libro de Russell tiene mucho más material del que estamos en condiciones de abordar en el curso. Por último, te invito a volver sobre las preguntas aquí formuladas y las respuestas propuestas con un espíritu de autocontrol ﬁnal. La intención es estimular una mirada crítica al trabajo realizado desde una posición de mayores conocimientos sobre los temas tratados. Se reitera que estas preguntas tienen como única ﬁnalidad contribuir a que el estudiante compruebe por sí mismo sus conocimientos. No se trata de una instancia de evaluación. Las consignas son las siguientes: 1. Selecciona las tres deﬁniciones que encontraste novedosas o más importantes y justiﬁca cada una. 2. Identiﬁca los tres tipos de robot según su autonomía y explica las características de cada uno. 3. Identiﬁca las tres soluciones posibles de la mecánica inversa y explica cada una. 4. Identiﬁca el tipo de modelo neuronal más apropiado para implementar un proceso de mecánica inversa y justiﬁca tu respuesta. 5. En el caso de un brazo manipulador que opera en tres dimensiones y dispone de cinco grados de libertad, ¿cuáles serían los elementos de la arquitectura conocidos y cuáles habría que deﬁnir a través de ajustes sucesivos? 6. ¿Qué parámetros de un modelo neuronal son ajustados durante el proceso de entrenamiento? Explica. C O NT I NU A R Lección 5 de 5 Referencias Zaplana, I., Claret, J. A. y Basanez, L. (2018). Análisis cinemático de robots manipuladores redundantes: aplicación a los Robots Kuka LWR 4+ y ABB Yumi. Revista Iberoamericana de Automática e Informática industrial, 15, 192-202. Recuperado de https://upcommons.upc.edu/bitstream/handle/2117/116165/8822-35678-1PB.pdf;jsessionid=E9F3E4C6E9C4A0D108CF2871E701B339?sequence=1 Percepción y navegación robótica Aspectos generales de la percepción La visión arti cial La navegación robótica Otras consideraciones sobre percepción y acción Referencias Lección 1 de 5 Aspectos generales de la percepción La percepción del medioambiente es fundamental para la supervivencia de cualquier ser vivo. Durante millones de años los animales desarrollaron complejos sistemas orgánicos a los efectos de disponer de información sobre el entorno, el medio circundante. Estos sistemas incluyen los indispensables sensores y la capacidad de interpretar sus señales, función que desempeña el cerebro a través de sus respectivos centros sensoriales. El cerebro en la percepción tiene a su cargo varias funciones: la primera de ellas es la de procesar a gran velocidad las enormes cantidades de datos provistos por los sentidos. Luego debe relacionarlos y evaluarlos, para ﬁnalmente integrarlos a otros datos ya incorporados con anterioridad en la estructura de conocimientos. Un aspecto muy importante para tener en cuenta es que, en su evolución, los seres vivos no solo perfeccionaron su capacidad sensorial, sino que también la especializaron, en gran medida acorde al medio en que operan y el rol que cada uno desempeña, con el ﬁn primordial de contribuir a la supervivencia. Siguiendo el ejemplo de la naturaleza, a los androides o robots humanoides habría que dotarlos de sistemas sensoriales equivalentes, acordes a la función por desempeñar y la necesaria capacidad de interacción con el hombre. A los efectos de ser eﬁcientes, es clave el proceso de clasiﬁcación de la información, considerando en cada caso las señales más importantes, disponiendo de criterio para descartar datos irrelevantes o inconsistentes a partir de un modelo jerárquico que permita solo considerar la información indispensable. De lo contrario, solo se lograría saturar la capacidad de interpretación de los centros sensoriales o de almacenamiento de la estructura de conocimientos. Disponer de criterio para saber distinguir lo útil y descartar lo irrelevante o redundante no solo es un desafío, es la clave del éxito. No debe perderse de vista que la naturaleza es cruel, nos brinda solo los ejemplos exitosos, aquellas experiencias poco efectivas se perdieron, ya que sus portadores no sobrevivieron. La percepción en los seres vivos incluye una enorme diversidad de señales. Hay animales que se destacan por su aguda visión (águilas), distinción cromática (abejas), señales eléctricas (algunos peces), ﬁna audición, incluyendo ultrasonido (delﬁnes y murciélagos), olfato (ratones), velocidad (murciélagos), sensibilidad térmica (algunas serpientes), por citar las principales. Planteado este panorama general, se pondrá aquí el foco en la visión por dos motivos primordiales: 1 Su indudable importancia para estimular una interacción hombre – máquina, ágil y natural. 2 Por ser apropiada para un enfoque que, aunque introductorio, permita percibir su alcance y sus posibilidades. C O NT I NU A R Lección 2 de 5 La visión artiﬁcial Con la visión artiﬁcial se busca que una máquina, a través de señales visuales, sea capaz de interpretar una imagen bidimensional, una forma tridimensional o una escena. La ﬁnalidad es interactuar dinámicamente con el entorno. El principal problema por resolver es que, en primera instancia, todos los puntos de una imagen tienen idéntico valor. Es decir, forman parte de esta. Y procesar la totalidad de los datos hasta identiﬁcar algún patrón de interés signiﬁcativo puede fácilmente llegar a representar un esfuerzo de enorme complejidad temporal. Ante esta realidad, es necesario aumentar la eﬁciencia en la interpretación visual, adoptando estrategias similares a las de los seres vivos: dar importancia solo a los elementos más signiﬁcativos de una escena, excluyendo los detalles y excluir también del análisis las formas incompatibles con las primeras, que pueden provenir de sombras o elementos accesorios. En este proceso de selección y ﬁltrado, representa una gran ayuda la disponibilidad de información de alto nivel sobre el objeto de la búsqueda. En este sentido, hay mucha expectativa por las posibilidades que se le adjudican a la integración e interpretación conjunta de diferentes sistemas sensoriales, combinando, por ejemplo, órdenes verbales con interpretación de imágenes del lenguaje corporal, que incluyen expresiones faciales, postura, movimientos de brazos, etc. Pero esto queda fuera del alcance de los objetivos del curso, y la atención se concentrará en la interpretación de imágenes. Deﬁniciones básicas Imagen: Está asociada a una función bidimensional f(x, y) cuya amplitud o valor será el grado de iluminación (intensidad) en el espacio de coordenadas (x, y) de la imagen para cada punto. Imagen digital: La función imagen f(x, y) es digitalizada en la memoria del computador: espacialmente y en amplitud. 1. La digitalización de las coordenadas espaciales está asociada al concepto de muestreo, por lo que una imagen es almacenada en una matriz de orden N × M. El muestreo es la conversión que sufren las dos dimensiones espaciales de la señal analógica para generar la noción de píxel. 2. La digitalización en amplitud es la cuantiﬁcación de los niveles de gris o colores representados. Para ello la señal analógica es convertida en un valor escalar, dando lugar al nivel de gris o intensidad, o a un vector en el caso del color que tiene tres componentes. En resumen, la imagen se comporta como una matriz donde el valor de los elementos es su amplitud (nivel de gris o color) y el par (ﬁla, columna) su posición en el espacio. Espacio RGB: Combinación de tres señales de luminancia cromática distinta: rojo, verde y azul. Un color particular en un punto (x, y) queda deﬁnido por la cantidad de color que se necesita combinar. Ejemplo: f(x, y) = R + G + B (rojo + verde + azul). Gráﬁcamente, el espacio RGB se representa por un cubo cuyos ejes principales son R (x), B (y) y G (z), representando el origen al negro. En la recta que une el origen con el valor máximo se encuentran los grises (los tres componentes son iguales) y el extremo representa al blanco (ﬁgura 1). Figura 1: Espacio RGB Fuente: elaboración propia. Interpretación de imágenes Si bien la atención en el procesamiento de imágenes se remonta a los años 50, coincidiendo con la presentación de los primeros computadores, hubo que esperar al desarrollo de la informática para disponer de recursos que permitan obtener resultados de interés práctico. Estos se obtuvieron durante los 80 con la aparición de las primeras aplicaciones industriales de visión por computador. A partir de allí la visión artiﬁcial es una disciplina en permanente evolución, objeto de una intensa actividad de investigación y fuertemente impactada por las posibilidades que ofrecen los modelos neuronales. Aunque la visión por computador es un campo de estudios muy amplio, íntimamente relacionado con diversas tecnologías, se destacan las siguientes tres aplicaciones: 1. Procesamiento y análisis de imágenes: La ﬁnalidad es transformar una imagen en otra, de la misma o diferente dimensión con distintos objetivos. Uno de ellos es su interpretación y análisis, donde se procura encontrar información abstracta relacionada. 2. Generación de gráﬁcos: La ﬁnalidad es transformar una descripción de objetos en una imagen, en un proceso que podría considerarse inverso al de análisis de imágenes. 3. Reconocimiento de patrones: Clasiﬁcar un objeto entre un conjunto de posibilidades a partir de ciertas características. Figura 2: Visión por computador Fuente: elaboración propia basada en Escalera, A. (2001). En las aplicaciones basadas en visión por computador se reconocen dos etapas y siete actividades, que se muestran en el esquema presentado en la ﬁgura 2. Como puede apreciarse, la información inicial sobre el problema por resolver es esencial, ya que participa en todas las actividades y es sucesivamente perfeccionada en cada una de las actividades cumplidas. En las tres primeras actividades de visión de “bajo nivel”, el objetivo es seleccionar y procesar la imagen, de tal manera que el resultado brinde el conjunto de características que deﬁnen el problema: presencia de colores, texturas, presencia y forma de objetos, movimiento, etc. Las cuatro actividades restantes son de “alto nivel” o “análisis de imágenes”. Utilizan las características ya identiﬁcadas para avanzar en el nivel de abstracción de las descripciones, esencialmente, en el análisis de las formas, el reconocimiento y la descripción de objetos. Se insiste en la importancia de la deﬁnición inicial presentada, donde se precisa el problema por resolver, se deﬁnen los objetivos y las estrategias para alcanzarlos. A continuación, se avanzará con más detalle sobre las siete actividades presentadas en el esquema. 1 Adquisición de la imagen: En la adquisición de una imagen hay tres elementos fundamentales que son fuente de luz, sensor de imagen y módulo de captura de la imagen. La fuente de luz es de vital importancia, ya que debe proporcionar unas condiciones de iluminación uniformes e independientes del entorno, además de facilitar la extracción de los rasgos de interés. El sensor no requiere justiﬁcación, aunque es muy importante que su resolución y cuantización (conversión análogo‑digital) sea compatible con la naturaleza y destino de las imágenes. Finalmente, el módulo de captura de imagen debe permitir transferir con facilidad la imagen de la cámara a la memoria de la computadora con el ﬁn de que esta pueda realizar el procesamiento requerido por cada una. 2 Preprocesamiento: Una vez disponible la imagen mediante cualquier sistema de captura, por lo general, no es directamente utilizable para su procesamiento. La presencia de variaciones en intensidad debidas a ruido, deﬁciencias en la iluminación o la obtención de imágenes de bajo contraste hace necesario un preprocesamiento de la imagen. El objetivo fundamental debe ser corregir estos problemas, además de aplicar aquellas transformaciones a la imagen que acentúen las características que se deseen extraer de estas a ﬁn de facilitar las operaciones de las etapas posteriores. A este campo pertenecen las técnicas de resaltado de bordes, transformaciones geométricas, las basadas en el histograma, el ﬁltrado espacial (convolución) y el ﬁltrado frecuencial (transformada de Fourier). 3 Extracción de características: Estando la imagen ya procesada, el paso siguiente es la detección de los elementos presentes, lo que implica buscar las características de aquellos objetos que se procura encontrar. Una de estas tareas es la detección de bordes, que ya fueron acentuados en la actividad anterior, la detección de líneas y la detección de esquinas. Para ello se hacen mediciones de gradientes, se utilizan operadores de segundo orden, ﬁltros y detectores de borde. Otra detección es la de texturas, para las cuales se realizan análisis estadísticos de primer y segundo orden, así como análisis frecuencial de las texturas. Por último, se analiza la detección de movimientos. Para ello se hacen algunas consideraciones, como que la cámara está ﬁja, no hay cambios de iluminación entre imágenes, y los objetos tratados son rígidos. 4 Segmentación: Cuando se dispone de la imagen capturada y ﬁltrada, es necesario aislar o separar los objetos de interés de la escena. Se busca dividir una imagen en diferentes regiones o, planteado de otra forma, detectar automáticamente los bordes entre los elementos o regiones. Las operaciones de segmentación de una escena dependen de la propia escena y de la información que se busque dentro de la imagen. Por ejemplo, en fotografía aérea se utiliza para separar regiones agrícolas, pobladas, bosques, aguas, etc. En imágenes médicas se usa para aislar anomalías en los órganos y en microscopia para identiﬁcar y contar microorganismos. Industrialmente, se usa como primer paso para la medición de piezas, veriﬁcación de la correcta disposición del etiquetado de envases, medición de irregularidades en superﬁcies homogéneas, detección de cambios de texturas para evaluar posibles defectos, etc. Para la detección de bordes regulares es de mucha ayuda la transformada de Hough, tanto lineal como generalizada. 5 Transformaciones morfológicas: Una vez cumplida la actividad anterior, cada objeto presente en la imagen puede ser analizado en forma individual. Para ello es sometido a transformaciones morfológicas, en las que se modiﬁca su estructura o forma. Estos procesos, además de ser útiles para la extracción de características, permiten también la eliminación de ruido remanente de las actividades anteriores. Con ese ﬁn se aplican técnicas de erosión, dilatación, esqueletización, adelgazamiento, extracción del perímetro y eliminación de ramas, entre otras. 6 Descripción de objetos: Llegado a este punto, la tarea se orienta a la descripción de los objetos identiﬁcados. Estos ya son aptos para brindar una serie de valores numéricos que los describan y que serán de gran utilidad en la actividad siguiente. Se está haciendo referencia a tamaños, perímetros, compacticidad, posición, orientación, proyecciones, indicadores invariantes, descriptores topológicos, códigos encadenados y descriptores de Fourier. 7 Reconocimiento o clasiﬁcación: La última actividad corresponde al reconocimiento de patrones, ﬁn último del proceso. A partir de las características encontradas y de los objetos que el reconocimiento a priori del problema anticipó como posibles, el sistema debe determinar qué objetos están presentes en la imagen. Con este ﬁn se realiza reconocimiento estadístico (clasiﬁcador Bayesiano) y se aplican funciones discriminantes. Detección de bordes La interpretación de imágenes es un tema lo suﬁcientemente vasto como para hacer imposible su estudio detallado, solo es factible una descripción general. Por ese motivo, se seleccionó un tema especíﬁco para ser tratado con mayor detalle: la transformada de Hough. La elección proviene porque es una transformada de aplicación general, muy original e ingeniosa. A diferencia de la mayoría de los métodos de detección de bordes que solo hacen un análisis local, la transformada de Hough considera las relaciones globales entre píxeles de borde, permitiendo encontrar ciertos patrones en la imagen tales como líneas y círculos. Fue propuesta y patentada en 1962 por Paul Hough, inicialmente aplicada a la detección de rectas en una imagen y posteriormente extendida para identiﬁcar otras ﬁguras. El caso más simple para la transformada de Hough es la transformación lineal para detectar líneas rectas. Figura 3a, 3b y 3c: variantes en la deﬁnición de una recta Fuente: elaboración propia. Fuente: elaboración propia. Fuente: elaboración propia. En el espacio de la imagen, una recta se puede representar por su ecuación y = mx + b (ﬁgura 3a) y se puede graﬁcar para cada uno de sus puntos representado por (x, y). En la transformada de Hough (ﬁgura 3b), la recta es representada en otro plano en términos de sus parámetros (m, b). Es decir, lo que en el plano (x, y) representa una recta en el plano (m, b) representa un punto. La limitación está en que, cuando hay rectas verticales, el parámetro m de la recta es indeterminado, por lo que es más conveniente usar los parámetros que describen una recta en coordenadas polares: ρ = x.cos θ + y.sen θ (ﬁgura 3c), es decir, (θ, ρ). En resumen, los puntos que pertenecen a diferentes rectas en una imagen compleja son representados por distintas rectas que se cortarán en puntos claramente deﬁnidos en el plano (m, b), permitiendo identiﬁcar con toda precisión las pendientes de las rectas estudiadas en la imagen. Si la recta es representada en coordenadas polares, la transformada al plano (θ, ρ) da lugar a que los puntos de una recta sean vistos como curvas sigmoidales, permitiendo igualmente su clara identiﬁcación. Una vez que los parámetros de las rectas están claramente deﬁnidos, son representados sobre la imagen original para destacar bordes y singularidades. Es importante destacar que la transformada de Hough no se limita a la detección de rectas, que es su aplicación más utilizada. También es empleada para identiﬁcar otras ﬁguras geométricas, en particular, círculos y arcos. Figura 4: Navegación de un robot apoyado en la transformada de Hough Fuente: Jheferson, S. A., 2013 En la ﬁgura 4 se muestra la identiﬁcación de bordes en la imagen a través de la transformada de Hough con la ﬁnalidad de facilitar la orientación de un robot que busca su camino a lo largo de un pasillo. La identiﬁcación es realizada en tiempo real mientras el robot avanza, es decir, que nuevas referencias deben ser consideradas a cada momento para servir de guía, ya que el escenario reconocido por el robot es el representado por estas líneas. C O NT I NU A R Lección 3 de 5 La navegación robótica Se denomina navegación al arte de guiar el curso de un móvil a través de un entorno con obstáculos. Existen diversos procedimientos, pero todos ellos tienen en común el objetivo de llevar el vehículo a su destino de forma segura y eﬁciente. La principal cualidad para ser considerada debe ser la capacidad de reacción eﬁcaz ante situaciones inesperadas en entornos no estructurados (Martínez, 1995). Según Martínez (1995), las tareas involucradas en la operación de un robot móvil son esencialmente cuatro: 1 La planiﬁcación de una trayectoria conveniente y libre de obstáculos, para alcanzar el punto de destino seleccionado. 2 La percepción del escenario a través de sus sensores, de modo de posibilitar la abstracción del mundo. 3 El guiado efectivo del vehículo a través de una trayectoria deﬁnida. 4 La interacción de manera simultánea con ciertos elementos del entorno. Un robot móvil se caracteriza por realizar una serie de desplazamientos (navegación) y por llevar a cabo una interacción con distintos elementos de su entorno de trabajo (operación) [manipulación], que implican el cumplimiento de una serie de objetivos impuestos [especiﬁcados]. (Martínez, 1995, p. 22) Según Martínez (1995, p. 23), "realizar una tarea de navegación para un robot móvil signiﬁca recorrer un camino que lo conduzca desde una posición inicial hasta otra ﬁnal, pasando por ciertas posiciones intermedias. En el problema de la navegación se identiﬁcan cuatro etapas": 1 Planiﬁcación de la ruta: Crea un objetivo ﬁnal y una secuencia ordenada de objetivos parciales o submetas que deben ser alcanzadas por el vehículo. Esta tarea implica una decisión estratégica y la descripción de la tarea que debe realizarse utilizando el modelo o mapa de entorno. 2 Generación del camino: Se deﬁne una función continua que incluye la secuencia de objetivos parciales construida por el planiﬁcador. Posteriormente, se procede a la discretización de esta a ﬁn de generar el camino. 3 Percepción del entorno: Mediante los datos provenientes de sensores externos, se crea y actualiza un mapa o modelo del entorno donde se desarrolla la tarea de navegación 4 Seguimiento del camino: Según el camino generado y su posición, se deﬁne el movimiento del vehículo a través de los efectores y se deﬁnen las correcciones que puedan ser necesarias (Martínez, 1995). Figura 5: Esquema de la estructura de navegación de un robot móvil Fuente: elaboración propia basada en Martínez (1995). A: Posición, dirección y velocidad. B: Comandos de dirección y velocidad La complejidad del seguidor de caminos puede ser muy variable, dependiendo de que su operación deba o no contemplar la posibilidad de que se presenten imprevistos y que deban ser resueltos sobre la marcha. De ser este el caso, el seguidor de caminos estaría en realidad cumpliendo dos funciones: la suya especíﬁca y la de un módulo que suele presentarse por separado y se denomina de planiﬁcación local. Está destinado precisamente a considerar novedades respecto del conocimiento del entorno que se tenía al momento de realizarse la planiﬁcación de la ruta. Esta planiﬁcación local debe llevarse a cabo en tiempo de ejecución, que es cuando se advierten las desviaciones y otras novedades. Métodos clásicos de planiﬁcación Todos los métodos de planiﬁcación se fundamentan en una primera fase de construcción de algún tipo de esquema sobre el espacio libre, realizado a partir de la información poseída del entorno. Posteriormente, se emplea un algoritmo de búsqueda en el espacio de estados con la ﬁnalidad de deﬁnir el camino apropiado, siendo habitualmente A* el método más efectivo que se considera para esta tarea. Los métodos de la primera fase de planiﬁcación, considerados clásicos, son los siguientes: Planiﬁcación basada en grafos de visibilidad. Planiﬁcación basada en minimización de obstáculos (diagramas de Voronoi). Planiﬁcación basada en modelado del espacio libre. Planiﬁcación basada en la descomposición en celdas. Planiﬁcación basada en campos potenciales. Una vez cumplida la primera fase de planiﬁcación, el paso siguiente es la generación del camino. El camino está representado por la secuencia de consignas que se entregarán al seguidor de caminos para la ejecución de la tarea de navegación. Se construye en función de la ruta deﬁnida en la etapa de planiﬁcación y debe estar libre de obstáculos. Además de esta característica básica, al utilizarse como referencia del seguidor de caminos, debe poseer ciertas cualidades que faciliten la acción de esta última tarea. La importancia de la deﬁnición de un camino con buenas propiedades está en que contribuirá a las posibilidades del seguidor para realizar una ejecución del camino con el menor error posible. C O NT I NU A R Lección 4 de 5 Otras consideraciones sobre percepción y acción Para cerrar esta lectura, es oportuno reproducir la introducción de un trabajo citado en primer lugar en el listado de referencias especíﬁcas. Este trabajo es el de Martin, Tucat y García (2004). La expectativa es por tratarse de la narración de una experiencia real que se originó en el desarrollo de un equipo de fútbol de robots que compitió en el campeonato mundial Robocup 2004. Los robots disponen de un sistema de visión global y de dos motores para su desplazamiento, teniendo como trabajo el objetivo de mostrar algunas soluciones a los problemas encontrados en la percepción de los objetos por parte del sistema de visión y también a problemas que pueden ocurrir al ejecutar las acciones básicas utilizando los motores. Se reproduce textualmente la citada introducción: Como los robots desarrollados no son completamente reactivos, estos toman sus decisiones basándose en un modelo abstracto del entorno donde se encuentran, el cual debe ser lo más preciso posible. En busca de este objetivo, es imprescindible tratar de minimizar los errores que ocurren tanto en la etapa de censado como también al momento de ejecutarse las acciones que modiﬁcan el entorno en el que se sitúan. Por ejemplo, el sistema de visión suele presentar ciertas imperfecciones. Un objeto estático dentro del campo de juego ilustra esta situación, ya que la información provista por el sistema de visión no es siempre la misma, en algunos casos varía considerablemente. Esto podría llevar a la construcción de un modelo abstracto donde las posiciones de los objetos sean diferentes a las reales, lo cual produciría que se tomen decisiones incorrectas. Con respecto a las acciones llevadas a cabo por los robots, es importante destacar que no puede asumirse de antemano que dichas acciones tendrán el resultado esperado en el modelo. En este trabajo consideramos los siguientes posibles problemas: la carga de las baterías que accionan los motores de los robots afecta el rendimiento de estos, el tipo de superﬁcie del campo de juego afecta la respuesta de los motores, la inercia del robot tiene efectos sobre la acción realizada y, por último, pequeñas diferencias entre dos motores que deberían ser iguales diﬁcultan algunas acciones básicas. (Martín, Tucat y García, 2004, p. 2) Desafío propuesto a partir de las notas anteriores El lector está pudiendo conﬁrmar lo que alguna vez ya fue anticipado: que la robótica es una disciplina polifacética, que incluye conocimientos de los más variados y que todos ellos tienen en común un respaldo matemático esencial y muy riguroso. Cada uno de los aspectos involucrados, tanto los intelectuales de aprendizaje y razonamiento como los físicos de percepción y acción son por sí mismos toda una especialidad en algún campo del saber cientíﬁco. A título de ejemplo, puede citarse uno de los tantos aspectos de los que trata la percepción, ¿cuánto conocimiento encierra la visión artiﬁcial? Y este interrogante puede repetirse para una larga lista de áreas especíﬁcas del conocimiento cientíﬁco. Aquí cabe una reﬂexión: ¡Cuánto conocimiento acumulado respaldan los progresos de la robótica y cuánto falta todavía para emular a un ser humano en todas sus capacidades! En la próxima y última lectura, también la última de la materia, trataremos las arquitecturas del robot, sus variantes y características; luego, los lenguajes de programación robóticos para, ﬁnalmente, incursionar en los dominios de aplicación. Todo parece conducir a conﬁrmar que la robótica es muy apropiada para ser presentada como tema de cierre de un curso de inteligencia artiﬁcial. Completada esta lectura, te invito a responder los interrogantes que se presentan a continuación. Luego, el siguiente paso será consultar los capítulos 24 y 25 de Russell, en los que se trata este asunto. Cabe aclarar que la lectura procura ser orientativa en cuanto al alcance y profundidad con que se espera tratar el tema en el libro, ya que en particular el libro de Russell tiene mucho más material del que estamos en condiciones de abordar en el curso. Por último, te invito a volver sobre las preguntas aquí formuladas y las respuestas propuestas, con un espíritu de autocontrol ﬁnal. La intención es estimular una mirada crítica al trabajo realizado desde una posición de mayores conocimientos sobre los temas tratados. Se reitera que estas preguntas tienen como única ﬁnalidad contribuir a que el estudiante compruebe por sí mismo sus conocimientos. No se trata de una instancia de evaluación. Las consignas son las siguientes: 1. Revisa las etapas y actividades previstas en una aplicación de visión artiﬁcial, explorando variantes con relación a los resultados esperados en cada etapa. 2. A través de un pequeño ejemplo numérico, revisa los conceptos planteados con la transformada de Hough. 3. Revisa el esquema de la estructura de navegación de un robot móvil, justiﬁca sus etapas y presenta las variantes que eventualmente consideras necesarias. 4. Selecciona uno de los métodos denominados clásicos de la primera fase de la planiﬁcación y resume sus ventajas y limitaciones. 5. Haz un resumen de los problemas de percepción y navegación presentados por los autores del artículo reproducido. C O NT I NU A R Lección 5 de 5 Referencias Escalera, A. (2001). Visión por computador: fundamentos y métodos. Prentice Hall. Martin, F. A, Tucat, M. y García, A. (2004). Soluciones a problemas de percepción y acción en el dominio de un equipo de fútbol de robots. Recuperado de http://sedici.unlp.edu.ar/bitstream/handle/10915/22516/Documento_completo.pdf?sequence=1&isAllowed=y Martínez, V. F. M. (1995). Planiﬁcación de trayectorias en robots móviles. Universidad de Málaga. Recuperado de http://webpersonal.uma.es/~VFMM/PDF/cap2.pdf C O NT I NU A R Arquitecturas Arquitecturas de robots Lenguajes de programación robóticos Dominios de aplicación Otras consideraciones sobre robótica Video conceptual Referencias Revisión del módulo Lección 1 de 7 Arquitecturas de robots La ﬁnalidad de las arquitecturas de software es la de hacer posible el diseño y construcción de sistemas cada vez más grandes y complejos, a la vez que están sometidos a exigencias muy severas en cuanto a ﬁabilidad, eﬁciencia, calidad y robustez, debiendo poder soportar con el mismo desempeño las cargas de trabajo iniciales y futuras. Y a estas necesarias cualidades debe agregarse la facilidad de mantenimiento. De esta manera, se hace posible la disponibilidad de una base ﬁrme para el inicio del ciclo de vida de un software que asegure la incorporación de las mejores propuestas y experiencias en el dominio, como así también que permita evitar a tiempo la adopción de soluciones que en la práctica demostraron no ser aconsejables. Los modelos de arquitecturas estabilizadas, respaldadas por conocimiento y experiencia profesional, desempeñan un rol cada vez más importante en la ingeniería de software. Esto, que está siendo comprobado en la industria del software en general, lo es aún en mayor medida cuando se trata de sistemas de control, embebidos o de tiempo real, o una combinación de estas cualidades. Y este enfoque del desarrollo de software, que viene demostrando su validez en todas las áreas de aplicación de los sistemas informáticos, lo es indudablemente también en el dominio de la robótica. Por las razones expuestas, se presenta aquí el tratamiento de las arquitecturas de software en el campo de la robótica, que naturalmente tiene exigencias particulares, y es el motivo por el que se las presenta en la última lectura, una vez que han sido desarrollados los aspectos que son propios en esta disciplina. Entrando más en el tema, las arquitecturas utilizadas para construir este tipo de sistemas especiﬁcan cómo se descomponen los agentes en un conjunto de módulos que interactúan entre sí para lograr la funcionalidad requerida. Como consecuencia, uno de los aspectos básicos que distingue una arquitectura de otra es la forma de descomposición del trabajo en tareas particulares. Un ejemplo son los subsistemas de planiﬁcación, que utilizan modelos de representación del conocimiento y razonamiento de tipo simbólico, y su modo de actuación está deﬁnido por la necesidad de satisfacer ciertos objetivos básicos (control deliberativo), para lo cual deben elaborar un plan. Y los algoritmos de planiﬁcación no siempre responden a los requerimientos del sistema en un tiempo razonable, ya que los principios básicos de la planiﬁcación son indecidibles. Por lo tanto, pueden requerir un elevado tiempo de respuesta. Este es un gran inconveniente cuando se resuelven problemas de tiempo real, por lo que al no constituir una opción válida llevaron a la búsqueda de alternativas que utilizasen otros modelos de representación o razonamiento, como es el caso de los reactivos o híbridos. Quedan así planteados tres modelos arquitectónicos, que son los siguientes: 1 Deliberativos: "Aquellas arquitecturas que utilizan modelos de representación simbólica del conocimiento. Suelen estar basadas en la teoría clásica de planiﬁcación. Estos agentes parten de un estado inicial y son capaces de generar planes para alcanzar sus objetivos" (Corchado, s.f., p. 3). 2 Reactivos: "Se caracterizan por no tener como elemento central de razonamiento un modelo simbólico y por no utilizar razonamiento simbólico complejo. […] La necesidad de actuar en un entorno impredecible y altamente cambiante diﬁculta la adopción de una arquitectura deliberativa" (Corchado, s.f., p. 12). 3 Híbridos: "Pretenden combinar aspectos de ambos modelos" (Corchado, s.f., p. 15), reactivos y deliberativos. "Las diferentes arquitecturas aparecen a la hora de integrar todas las acciones para dar respuesta a problemas complejos. Habitualmente el conjunto de habilidades necesita de la existencia de distintos niveles jerárquicos […] en la estructura de control" (Corchado, s.f., p. 13). En el campo de la robótica, la mayor parte de las opciones arquitectónicas deben combinar control reactivo y control deliberativo, es decir, quedan encuadradas como híbridas, donde ambos extremos representan enfoques con fortalezas y debilidades ortogonales. Así es que la identidad de cada propuesta reside en el nivel de participación de cada opción extrema y la forma en que son combinadas. Arquitectura de subsunción Los robots ya han sido reconocidos como agentes que actúan en un entorno cambiante. (Corchado, s.f.). Precisamente, la necesidad de actuar en un entorno impredecible y altamente cambiante diﬁculta la adopción de una arquitectura deliberativa, ya que las necesidades de replaniﬁcación y de continua adaptación del plan a la realidad hacen muy difícil que una arquitectura de este tipo responda con suﬁciente agilidad. (Corchado, s.f., p. 12) Como ha sido demostrado en numerosas aplicaciones, un sistema basado en las propiedades básicas de muchos elementos sencillos e interactuando adecuadamente establecen un orden a partir de un aparente caos, lo que es consecuencia de una capacidad de autoorganización. Esta propiedad, denominada emergente, puede evitar el problema de la excesiva longitud y complejidad de las descripciones algorítmicas. En efecto, las propiedades emergentes parecen decisivas en los esquemas de diseño al que acude regularmente la naturaleza. Este elegante concepto se transformó en uno de los postulados básicos del enfoque de la inteligencia artiﬁcial basado en la naturaleza: la inteligencia puede ser emergente, representando una propiedad de la interacción compleja de elementos más simples. Pueden citarse como ejemplo los "anímatas" desarrollados por Rodney Brooks (1986) en la Universidad de Stanford. Estos eran una especie de insectos artiﬁciales que conﬁrmaron que una conducta inteligente puede emerger a partir de la disponibilidad de comportamientos sencillos extremadamente reducidos. Los robots así construidos se componen de piezas destinadas a cumplir individualmente una función a partir de una organización muy elemental y donde una coordinación central se encarga de supervisar estos componentes y de compatibilizar sus respuestas. Es lo que se llama "arquitectura de subsunción", cuya principal ventaja es el escaso poder computacional que se requiere para operarlos. Puede decirse que operan a partir de jerarquías de tareas, de menor a mayor nivel de abstracción, que deﬁnen un comportamiento (Corchado, s.f.). Para Brooks (1986) la mejor representación del entorno es el propio entorno, por lo que el sistema de control debe operar directamente a partir de los datos adquiridos por el robot en ese momento. El concepto de reactividad deﬁne que el sistema de control debe utilizar únicamente la información actual para decidir la siguiente acción. La arquitectura puramente reactiva no necesita de ningún otro nivel y la actuación ﬁnal del robot se basa en la importancia para cada situación de la función que se puede ejecutar. A veces se deﬁne una relación entre las acciones básicas, de modo que una acción puede bloquear a otra e impedir su ejecución [compuerta AND]. Otras veces se recurre a distintos algoritmos de fusión que permiten ponderar las salidas [compuerta OR o XOR] [y también se combinan los distintos tipos de relaciones]. (Corchado, s.f., p. 14) En la ﬁgura 1 se muestra un esquema básico de una arquitectura de subsunción: Figura 1: Esquema de un modelo de subsunción Fuente: elaboración propia. El esquema presentado incluye cuatro señales de entrada y otras tantas salidas encadenadas que comandan una acción. Naturalmente, sus posibilidades son muy escasas, pero debe pensarse el potencial de la idea en un caso en que intervengan decenas de señales, cuyas salidas converjan a dispositivos de accionamientos complejos (válvulas lógicas) para ﬁnalmente comandar decenas de diversos tipos de acciones. Podría decirse que el límite de su capacidad está representado por la posibilidad de deﬁnir las secuencias de acciones requeridas y los vínculos lógicos entre las señales y sus salidas a ﬁn de producir un determinado efecto. Seguramente, nada fácil. Arquitecturas de tres capas En la arquitectura híbrida se combina la reacción con la deliberación, y un caso característico es la arquitectura básica de tres capas, que son las siguientes: Capa reactiva: provee el control de bajo nivel del robot, caracterizándose por un fuerte lazo de sensor‑acción. Su ciclo operativo se encuentra en rangos de períodos muy bajos, del orden de milisegundos. Capa ejecutiva: cumple la función de vincular la capa reactiva con la deliberativa. Recibe directivas de la capa deliberativa y las transmite a la capa reactiva, siendo también responsable de incorporar la información de los sensores en una representación de estado interno, que es compartida con la capa deliberativa. Su ciclo operativo es del orden del segundo. Capa deliberativa: a través de la planiﬁcación genera soluciones globales para tareas complejas, tomando decisiones a través de “modelos de decisión” e información del modelo de estado interno. Su ciclo operativo es de entre uno y varios minutos. En la ﬁgura 2 se presenta un esquema simpliﬁcado de un modelo de arquitectura de tres capas: Figura 2: Esquema de un modelo de tres capas Fuente: elaboración propia. C O NT I NU A R Lección 2 de 7 Lenguajes de programación robóticos El tratamiento de los lenguajes de programación robóticos puede ser abordado desde diferentes puntos de vista y para comenzar parece conveniente enumerar los requerimientos de un programador sobre su principal herramienta, que es el lenguaje y su compilador. Naturalmente, hay que hacerlo teniendo en cuenta las características del producto que se va a desarrollar, que es el software de un robot, posiblemente embebido y desde una visión de programador que debe poder concebir, completar, entregar un producto y dejar conforme a su cliente. Los requerimientos no serían los mismos si se los considerara desde el punto de vista de un investigador. Estos requerimientos serían los siguientes: 1 Lenguaje compilable, no interpretable. 2 Lenguaje expresivo y claro, en lo posible con sintaxis similar a la de los principales lenguajes imperativos utilizados en la actualidad. 3 Sintaxis que combine las grandes posibilidades de los lenguajes de bajo nivel con la ﬂexibilidad y simplicidad del alto nivel. 4 Capacidad para trabajar con temporizadores y operar niveles de interrupción (preferible). 5 Dependiente de los recursos del sistema operativo, sin dependencia de librerías o componentes de terceros. 6 Buena capacidad visual, apto para deﬁnir pantallas de diálogo e interfaces gráﬁcas. 7 Buen administrador de proyectos y editor de textos, que permitan trabajar con comodidad tanto a nivel de módulos en conjunto como a nivel de detalle con el código. 8 Compilador eﬁcaz para la identiﬁcación y señalización de advertencias y errores de sintaxis. 9 Buena capacidad de debugging, que permita seguir e identiﬁcar fallas en tiempo de ejecución. 10 Generación de código en lenguaje máquina que sea sólido y eﬁciente, esencialmente en lo que hace a complejidad temporal (rapidez de respuesta) y complejidad espacial (espacio de memoria demandado). Deﬁnidos los requerimientos, otro aspecto para considerar son los dos equilibrios que deben ser alcanzados, que son los siguientes: Adopción de nuevos lenguajes vs. adecuado conocimiento de estos: si se adoptan con frecuencia nuevos lenguajes (ambientes de desarrollo, IDE) nunca se los conoce con la profundidad suﬁciente como para superar problemas complejos; en caso contrario, se domina la herramienta de trabajo con el riesgo de quedar desactualizado. Uso de componentes vs. desarrollo de librerías propias: si todo el sistema se basa en componentes de origen desconocido, se pone en dudas el desempeño del sistema y la posibilidad de superar eventuales diﬁcultades eﬁcazmente; a la vez, no es posible desarrollar respuestas propias para todas las funcionalidades requeridas. En este contexto, en el que hay diez requerimientos que podrían considerarse básicos y resulta además esencial encontrar un justo equilibrio en dos aspectos críticos, se presentan los siguientes interrogantes: ¿debo adoptar un nuevo lenguaje especíﬁco para la programación robótica? ¿Resultaría conveniente adoptar CES (C++ for Embedded Systems) o debería trabajar con el C++, cuyo lenguaje y compilador domino ampliamente? Similares preguntas se pueden plantear con GRL (Generic Robot Language) y otros lenguajes. C O NT I NU A R Lección 3 de 7 Dominios de aplicación Se presentan y describen muy brevemente a continuación los principales dominios de aplicación de la robótica, que en la actualidad cubren todo el espectro de la actividad humana. Estos son los siguientes: Industria: Si bien la robótica tiene una muy larga historia y acompaña al hombre desde la antigua Grecia y aun antes, su escenario de aplicación en tiempos modernos fue la industria. Primero la Revolución Industrial y más recientemente las ideas de producción seriada de principios del siglo XX (Henry Ford, 1908), inspiradas en las limitaciones del hombre, no fueron suﬁcientes y había que incorporar nuevos recursos productivos. Y así aparece el brazo robotizado (George Devol, 1948). Su indudable y principal ventaja fue la mayor capacidad de trabajo, que fue complementada por otras cualidades, como la mayor precisión y estricta repetición de procedimientos, lo que permitió incrementar simultáneamente la producción y la calidad, con la consiguiente reducción de costos. Agricultura: La agricultura no estuvo ajena a estas iniciativas que inspiraron el desarrollo de máquinas excavadoras, sembradoras, cosechadoras y empacadoras, que buscaron también mayor capacidad de producción con menor participación humana. Transporte: El transporte robotizado tiene su expresión clásica en los dispositivos móviles de abastecimiento a las líneas de montaje industrial y, en la actualidad, esta se ha extendido desde la carga y descarga en puertos hasta el traslado de pacientes dentro de centros asistenciales, pasando por drones y otros vehículos aéreos destinados al traslado de elementos o relevamientos fotográﬁcos. Las aplicaciones no tienen límite. Entornos peligrosos: El segundo gran argumento que justiﬁcó e impulsó la robótica fue la posibilidad de reemplazar al hombre en escenarios de trabajo muy peligrosos, tóxicos, radiactivos o difícilmente accesibles (el primer argumento fue la mayor capacidad de trabajo). Así es que los robots están presentes en la desactivación de explosivos, búsqueda de sobrevivientes en estructuras colapsadas, exploración en cavernas, minas abandonadas o barcos hundidos, limpieza de bodegas en buques petroleros y otras muchas aplicaciones similares inapropiadas para la presencia humana. Exploración: Ya se anticipó oportunamente la importancia de la exploración espacial en el estímulo al desarrollo de la robótica. Así es que los robots hoy están presentes (a través de brazos manipuladores) a cargo de innumerables tareas en vehículos espaciales y desplazándose (robots móviles) por ahora sobre la superﬁcie de Marte. También son usados en la exploración de las profundidades marinas, inalcanzables para el hombre y en zonas absolutamente inhóspitas. Salud: Los robots de precisión ya forman parte habitual en los equipos de cirugía en centros médicos, cumpliendo el rol de asistentes y en muchos casos también el de los cirujanos cuando hacen falta intervenciones de altísima precisión, principalmente, en el cerebro, ojos y corazón. Prótesis humanas: Como herramientas de extensión de la salud, los robots están presentes en diversos tipos de prótesis humanas. Aquí cabe aclarar que este también es un dominio de actuación de la cinemática, solo que lo viene siendo estrictamente desde el punto de vista mecánico y ahora, integrado a las capacidades de control robótico, permite brindar soluciones muy completas y eﬁcaces. Entretenimiento: La extensa presencia de los robots en todas las facetas de la actividad cotidiana del mundo moderno no podía dejar estos dispositivos ajenos a los juguetes y variadas formas de entretenimientos, algunos de ellos muy soﬁsticados. Servicios personales: Quizás sea la aplicación más reciente de la robótica. Los robots de servicios cumplen la función de colaboradores para todo tipo de tareas personales en la empresa y en el hogar. Educación: Aquí habría que reconocer dos líneas de desarrollo: por un lado, la robótica como proveedora de herramientas didácticas de todo tipo, incluyendo modelos de los objetos estudiados; y, por otro lado, la robótica como objetivo en sí mismo, estimulando el estudio de la informática a través de la programación de esos elementos. C O NT I NU A R Lección 4 de 7 Otras consideraciones sobre robótica Habiendo completado las dieciséis lecturas del curso, resulta aquí oportuno tratar brevemente los principios éticos de la inteligencia artiﬁcial, que admite dos puntos de vista: 1 El comportamiento ético de los seres humanos cuando diseñan, construyen, usan y tratan con máquinas dotadas de inteligencia. 2 El comportamiento de las propias máquinas cuando operan y toman decisiones de manera autónoma. Si estas máquinas quedan encuadradas como robots, la evaluación de su comportamiento está a cargo de una especialidad reciente de la ética denominada robo ética. Desde los dos puntos de vista, conducta de creadores y de objetos creados, la ética de la inteligencia artiﬁcial es un tema que da lugar a una creciente preocupación y experimenta cada vez mayor difusión e importancia. Uno de los interrogantes se reﬁere a si los robots, al aprender de los seres humanos, heredarán o terminarán desarrollando "debilidades" humanas, tales como el egoísmo, deslealtad, vacilación, etc. También preocupa la posibilidad de llegar a un ciclo evolutivo en que las máquinas dispongan de la capacidad de mejorarse a sí mismas, sin límite. Todos estos temas son en la actualidad motivo de creciente atención y preocupación, destacándose el documento de la Unión Europea (abril del 2019) en el que se expresan siete principios que deberían considerarse: 1 La inteligencia artiﬁcial debe ser supervisada por seres humanos. 2 Los sistemas de inteligencia artiﬁcial no deben ser vulnerables y deben estar preparados para soportar ataques externos. 3 Debe garantizarse la integridad y privacidad de los datos. 4 La inteligencia artiﬁcial debe de ser transparente en su desempeño y siempre identiﬁcarse como tal. 5 No debe exhibir sesgos discriminatorios de ningún tipo. 6 En su desarrollo tecnológico debe tenerse en cuenta el impacto social y medioambiental, ser sostenible y ecológicamente responsable. 7 La inteligencia artiﬁcial y sus resultados deben rendir cuentas ante auditores externos e internos. ("Robótica y ética legal", 2019). Desafío propuesto a partir de las notas anteriores Con esta lectura se ha completado el curso, necesariamente introductorio, a la inteligencia artiﬁcial. Tanto por la diversidad de disciplinas del conocimiento involucradas como también por la amplia variedad de objetivos y aplicaciones, la inteligencia artiﬁcial es un inmenso campo para la investigación y ejercicio de la actividad profesional. Esto es así si se incursiona en la propia inteligencia artiﬁcial como ﬁn último y también si se utiliza sus recursos para obtener mejores desempeños en otras actividades convencionales. Es decir, y ya se lo expresó a lo largo del curso, a la inteligencia artiﬁcial se la puede ver como un ﬁn o un medio: sus posibilidades son inimaginables y con seguridad representarán una ventaja estratégica en el mundo laboral para aquellos que la sepan aprovechar. Espero que puedan y sepan hacerlo. Y que con este curso hayan dado un primer paso ﬁrme en esa dirección. Completada esta lectura, te invito a responder a los interrogantes que se presentan a continuación. Luego, el siguiente paso será consultar el capítulo 25 de Russell, que es donde se trata este asunto. Cabe aclarar que la lectura procura ser orientativa en cuanto al alcance y profundidad con que se espera tratar el tema en el libro, ya que en particular el libro de Russell tiene mucho más material del que estamos en condiciones de abordar en el curso. Por último, te invito a volver sobre las preguntas aquí formuladas y las respuestas propuestas con un espíritu de autocontrol ﬁnal. La intención es estimular una mirada crítica al trabajo realizado desde una posición de mayores conocimientos sobre los te

Introduccion a la Robotica PDF

Document Details

Tags

Related

Summary

Full Transcript