L1 LPM: Una Visión para la Gestión de Procesos de Negocio en la Era de la IA Generativa (PDF)

Document Details

Timotheus Kampik, Christian Warmuth, Adrian Rebmann, Ron Agam, Lukas N. P. Egger, Andreas Gerber, Johannes Hofart, Jonas Kolk, Philipp Herzig, Gero Decker, Han van der Aa, Artem Polyvyanyy, Stefanie Rinderle, Ingo Weber, Matthias Weidlich

Tags

Modelos de lenguaje a gran escala Inteligencia Artificial generativa Gestión de procesos de negocio

Summary

Este documento analiza el concepto de modelo de proceso a gran escala (LPM) para la gestión de procesos de negocio en la era de la IA generativa. Argumenta que los grandes modelos de lenguaje (LLM) ofrecen ventajas, pero también presentan desafíos. Propone un LPM para combinar el poder predictivo de los LLM con la precisión analítica de sistemas basados en el conocimiento.

Full Transcript

Machine Translated by Google KI ­ Künstliche Intelligenz https:// doi.org/10.1007/s13218­024­00863­8 DISCUSIÓN Modelos de procesos a gran escala: una visión para la gestión de procesos de negocio en la era de la IA generativa Timotheus Kampik1 ∙ Christ...

Machine Translated by Google KI ­ Künstliche Intelligenz https:// doi.org/10.1007/s13218­024­00863­8 DISCUSIÓN Modelos de procesos a gran escala: una visión para la gestión de procesos de negocio en la era de la IA generativa Timotheus Kampik1 ∙ Christian Warmuth1 ∙ Adrian Rebmann1 ∙ Ron Agam1 ∙ Lukas N. P. Egger1 ∙ Andreas Gerber1 ∙ Johannes Hofart1 ∙ Jonas Kolk1 ∙ Philipp Herzig1 ∙ Gero Decker1 ∙ Han van der Aa2 ∙ Artem Polyvyanyy3 ∙ Stefanie Rinderle Ma4 ∙ Ingo Weber4,5 ∙ Matthias weidlich6 Recibido: 31 de octubre de 2023 / Aceptado: 5 de julio de 2024 © El autor(es) 2024 Abstracto El éxito continuo de los modelos de lenguaje a gran escala (LLM, por sus siglas en inglés) y otros enfoques de inteligencia artificial generativa resalta las ventajas que pueden tener los grandes corpus de información sobre los modelos simbólicos definidos de manera rígida, pero también sirve como prueba de los desafíos que presentan los enfoques puramente estadísticos en términos de seguridad y confiabilidad. Como marco para contextualizar el potencial, así como las limitaciones de los LLM y otras tecnologías basadas en modelos básicos, proponemos el concepto de un modelo de proceso a gran escala (LPM, por sus siglas en inglés) que combina el poder de correlación de los LLM con la precisión analítica y la confiabilidad de los sistemas basados en el conocimiento y los enfoques de razonamiento automatizado. Se prevé que los LPM utilicen directamente la riqueza de la experiencia en gestión de procesos que han acumulado los expertos, así como los datos de desempeño de procesos de organizaciones con diversas características, por ejemplo, en cuanto a tamaño, región o industria. En esta visión, el LPM propuesto permitiría a las organizaciones recibir procesos específicos del contexto (personalizados) y otros modelos comerciales, análisis profundos y recomendaciones de mejora. Como tal, permitiría reducir sustancialmente el tiempo y el esfuerzo necesarios para la transformación empresarial, al tiempo que permitiría obtener información más profunda, más impactante y más práctica que la que era posible anteriormente. Sostenemos que la implementación de un LPM es factible, pero también destacamos las limitaciones y los desafíos de investigación que deben resolverse para implementar aspectos particulares de la visión Palabras clave Gestión de procesos de negocio ∙ Grandes modelos de lenguaje ∙ Inteligencia artificial generativa 1 Introducción Los LLM son herramientas basadas en estadísticas que reutilizan grandes corpus de texto generado por humanos y a menudo mal El éxito reciente de las arquitecturas de transformadores ha situado a curados; su comportamiento es impredecible, a veces no deseable y los modelos de lenguaje grande (LLM) en la frontera de la investigación con frecuencia ilógico. Esto limita la aplicabilidad de los LLM (simples) y las aplicaciones de la inteligencia artificial. La idea general de los en muchos contextos comerciales. En particular, en la gestión de LLM y otros modelos denominados de base es utilizar un gran volumen procesos comerciales (BPM) y la inteligencia de procesos, donde las de datos no etiquetados explícitamente para el entrenamiento, para decisiones tienen implicaciones críticas para las operaciones luego inferir resultados "estadísticamente plausibles" (en una modalidad comerciales, el poder de correlación crudo y asombroso del aprendizaje dada, como texto o imagen), dada una entrada. Están surgiendo profundo es insuficiente como facilitador independiente de inteligencia aplicaciones prometedoras de los LLM en la industria del software confiable, confiable y procesable. Para facilitar la inteligencia con las empresarial; mientras que los LLM de propósito general ya pueden propiedades mencionadas anteriormente, se requiere una integración aumentar el trabajo de conocimiento diario, como la redacción de de los LLM (o, más ampliamente, enfoques basados en modelos de textos publicitarios, se entrenan modelos especializados para dominios base) con la gestión de datos simbólicos (como los gráficos de como la ingeniería de software y las finanzas. Sin embargo, a medida que conocimiento) los LLM y métodos de razonamiento automatizado. Información ampliada del autor disponible en la última página del artículo. Volumen:(0123456789) Machine Translated by Google KI ­ Inteligencia Artística En este artículo, proponemos modelos de procesos grandes (LPM)1 La BPM aumentada con IA está haciendo que los procesos de negocios como marco conceptual central para BPM con soporte de software en la sean “adaptables, proactivos, explicables y sensibles al contexto”. era de la IA generativa, con el objetivo general de proporcionar una Sus dos elementos clave, el control humano y la integración de lo discusión equilibrada y orientada a la viabilidad del impacto esperado de simbólico (basado en la lógica/razonamiento) y lo subsimbólico (estadísticas/ los modelos de base en el software BPM. Fundamentamos los LPM en Los enfoques de IA basados en el aprendizaje automático son direcciones el estado del arte de las dos áreas de investigación (Sección 2) para de investigación bien establecidas en la comunidad de IA: la fusión de IA luego proporcionar una motivación para el concepto LPM desde diferentes simbólica y subsimbólica es bien conocida desde principios del siglo XX perspectivas (Sección 3). Basándonos en la investigación existente, como IA neurosimbólica y actualmente está resurgiendo, por ejemplo luego ensamblamos el LPM a partir de componentes nacientes y bien en el contexto de los gráficos de conocimiento y la Web Semántica. establecidos (Sección 4). Analizamos el potencial de aplicación de los LPM (Sección 5) y argumentamos a favor de su viabilidad técnica hasta Recientemente, el auge de la denominada IA generativa, posibilitada cierto punto, al mismo tiempo que destacamos riesgos y desafíos principalmente por la arquitectura de red neuronal de transformadores sustanciales desde perspectivas académicas y prácticas (Sección 6). , ha alimentado nuevas expectativas con respecto al potencial de Finalmente, analizamos conceptos relacionados con los LPM, así como aplicación de la inteligencia artificial, sobre todo en contextos LPM más allá de los LLM (Sección 7), antes de concluir el artículo empresariales y de BPM. Lo más destacado es que los productos de (Sección 8). software como ChatGPT permiten a los usuarios entablar diálogos con sistemas basados en LLM que luego producen contenido estadísticamente plausible dada la solicitud de un usuario, en función de los grandes 2 Antecedentes corpus de contenido con los que se han entrenado los sistemas. Existe un interés sustancial en relación con la IA generativa en la investigación BPM es una disciplina profesional y un área de investigación que se de BPM, así como en la industria. Por ejemplo, una investigación reciente ocupa de garantizar que las organizaciones funcionen como se desea y proporciona los primeros conocimientos sobre el potencial que tiene la IA logren sus objetivos competitivos y sociales. En el contexto de BPM, el generativa para la minería de procesos (en particular: generación de software juega un papel importante, ya que las organizaciones dependen consultas y respuesta directa a preguntas basadas en registros de de él no solo para la ejecución de procesos, sino también para el diseño eventos ). Además, las líneas de investigación emergentes exploran y análisis de procesos. BPM como disciplina de investigación, aunque la creación de modelos de procesos (generación de modelos de procesos multidisciplinaria, a menudo se ve a través de la lente de la informática y extracción de listas de tareas a partir de texto ), así como aplicada, por ejemplo, en el contexto de los enfoques fundamentales modelos conceptuales relacionados, como los modelos de lenguaje de para el modelado de procesos y el análisis de procesos impulsado modelado unificado (UML) [11, 13], y se han introducido propuestas por datos (minería de procesos). Aquí, los lenguajes de modelado académicas para la ingeniería rápida para BPM y el modelado empresarial "formales", como las redes de Petri, juegan un papel crucial para facilitar [14, 15]. Lo que falta hasta ahora es una visión general holística de cómo el razonamiento y la toma de decisiones sobre los procesos. la IA generativa puede facilitar BPM de manera más amplia, y cómo se Tradicionalmente, BPM como campo y, en particular, el software BPM, puede desarrollar una perspectiva sistemática sobre la interacción con se basan en enfoques simbólicos de la informática, muchos de los cuales las tecnologías existentes. se basan en la lógica y, en consecuencia, pueden considerarse una IA simbólica "de la vieja escuela". Por ejemplo, el núcleo de la minería de procesos se basa en la gestión simbólica de datos y enfoques de 3 Motivación razonamiento temporal. Con la llegada del aprendizaje profundo, la investigación de BPM ha El concepto de un modelo de proceso grande puede motivarse desde ajustado su curso y ha aumentado la adopción de una variedad de una doble perspectiva. enfoques de aprendizaje automático (ML). Como reacción a esta Intuitivamente, el creciente interés en los LLM en una amplia gama tendencia, la comunidad de BPM ha proporcionado una visión de BPM de dominios exige su posicionamiento holístico en el contexto de BPM. aumentada por IA. De acuerdo con este enfoque previsto, los métodos Considerando la prevalencia de los modelos de proceso como de IA subsimbólica no se utilizan para reemplazar el razonamiento herramientas para el análisis de procesos, así como artefactos de humano o simbólico en tareas cruciales, sino más bien para respaldar ejecución, el término modelo de proceso grande puede referirse a la las decisiones y acciones humanas y de las máquinas, por ejemplo, para aplicación de los LLM para producir modelos de procesos en el sentido facilitar el control humano con menos esfuerzo, al tiempo que se más amplio. permiten garantías simbólicas sólidas. El objetivo final de Sin embargo, más allá de esta analogía simplista, vemos el “modelo de proceso grande” más literalmente como una alternativa a los modelos de proceso pequeños, cableados y específicos que se utilizan hoy en día. 1 Los modelos de procesos grandes no deben confundirse con los modelos de procesos locales (también abreviados normalmente con el acrónimo LPM ), que tienen como objetivo describir el comportamiento que ocurre con frecuencia en un registro de eventos que un proceso ha generado en patrones locales algo pequeños. Machine Translated by Google KI ­ Inteligencia Artística (Piense en un modelo BPMN2 y una base de reglas DMN3 asociada ) que En algunos casos, el software estándar o el desarrollo personalizado va más allá de la mera aplicación de LLM. tradicional siguen siendo más viables. Por lo tanto, al igual que en el caso En el procesamiento del lenguaje natural (PLN), el término LLM se del lenguaje natural, el sueño de un modelo simbólico perfecto sigue refiere a modelos estadísticos del lenguaje natural que, basándose en los siendo una ambición que rara vez se logra. Los dos ejemplos siguientes grandes corpus de datos de texto con los que han sido entrenados, resaltan este problema y ejemplifican dos escenarios de BPM muy predicen los siguientes tokens plausibles (unidades básicas de texto) dada diferentes (procesos altamente personalizados y en gran medida una cadena de entrada. Inicialmente, los LLM aplicaban enfoques estandarizados). basados en estadísticas relativamente simples, que han sido reemplazados por redes neuronales durante la década de 2010; los LLM de hoy son Capacidades de verificación de cumplimiento de procesos para el típicamente transformadores preentrenados generativos (GPT), que utilizan ámbito financiero. Las grandes instituciones financieras suelen querer la arquitectura de red neuronal de transformador correspondiente que fue tener el control total de la especificación y ejecución de sus procesos de diseñada específicamente para tareas de PNL (aunque es más aplicable negocio y, por lo tanto, aplican conjuntos de desarrollo basados en modelos en general). Los predecesores de los enfoques de PNL basados en con motores de ejecución de reglas y procesos de negocio de código estadísticas, como los primeros LLM, fueron modelos de lenguaje abierto o de creación propia, utilizando notaciones de modelado como formales/basados en la lógica. Estos modelos simbólicos intentan definir BPMN y DMN.6 Un caso de uso clave dentro del ámbito es garantizar el con precisión el metamodelo del lenguaje humano y permiten la cumplimiento normativo y, al mismo tiempo, maximizar la agilidad empresarial. instanciación de estos metamodelos en contextos particulares. Sin Sin embargo, las bases de modelos y reglas necesarias para ejecutar las embargo, considerando la naturaleza compleja, matizada y dinámica del comprobaciones correspondientes e integrarlas en las operaciones lenguaje humano, los modelos de lenguaje basados en lógica son centrales de la empresa son muy grandes y el esfuerzo de mantenimiento insuficientes para manejar la mayoría de las tareas de NLP y ahora se es inmenso. Los modelos y reglas simbólicos, incluso si son correctos supone que son principalmente aplicables junto con herramientas basadas desde una perspectiva “lógica” (nivel de objeto), tienden a estar en ML como LLM. Análogamente, BPM solía tener un fuerte enfoque desactualizados, ser inconsistentes o estar modelados incorrectamente simbólico impulsado por modelos, en particular en el ámbito académico, lo desde una perspectiva de dominio (nivel meta). Por lo tanto, se requiere que se refleja en los libros de texto clásicos sobre el tema [4, 20]. El un esfuerzo humano sustancial, así como una experiencia muy particular supuesto era que los modelos de procesos imperativos permiten a los en la intersección de la tecnología y el dominio empresarial específico, expertos en negocios especificar cómo funcionan las organizaciones de para el mantenimiento y la mejora continua. una manera definida con precisión y automatizable, siguiendo un enfoque Capacidades genéricas de procesos de compra a pago. Los de desarrollo impulsado por modelos. En contraste, los enfoques más proveedores de software empresarial escalan las capacidades genéricas permisivos y declarativos para modelar procesos de negocios aún no han de procesos de compra a pago (adquisiciones) en miles de organizaciones alcanzado la madurez general, posiblemente debido a los desafíos utilizando software estándar. Cambiar y personalizar el software suele relacionados con la representación unificada y la facilidad de uso para requerir mucho esfuerzo e introduce riesgos de errores no deseados. crear y administrar modelos; esto se evidencia por la relativa falta de efectos secundarios que deben mitigarse. Por lo tanto, el grado de adopción del estándar CMMN,4 que al menos algunos proveedores personalización debe ser un equilibrio cuidadosamente deliberado. Tomar especializados con profunda experiencia en el campo consideran un la decisión correcta sobre la escala y la dirección de la personalización fracaso.5 requiere excavar en silos de datos y conocimiento; los datos disponibles Incluso en el caso de los modelos de procesos imperativos, y aunque generalmente cuentan solo una parte de la historia, y el conocimiento más existe un ecosistema tecnológico maduro de motores de ejecución de útil generalmente está distribuido en diferentes fuentes, es difícil de procesos de negocios, la implementación directa de modelos para la encontrar y no está disponible en un formato interpretable por máquinas. ejecución ha seguido siendo un enfoque de nicho para la automatización de procesos. Una suposición de la industria es que el nivel de alfabetización Al mismo tiempo, la utilización de enfoques tradicionales basados en tecnológica de los expertos en negocios y el esfuerzo de mantenimiento estadísticas y ML (métodos distintos de GPT) en un contexto de BPM requerido para el desarrollo impulsado por modelos es tan alto que solo plantea desafíos sustanciales, en particular debido a las siguientes las organizaciones muy grandes y maduras pueden beneficiarse de él, y por lo general cuestiones clave: – BPM requiere mucho conocimiento y los enfoques de inferencia estadística clásica tienen dificultades para utilizar el conocimiento 2 Modelo y notación de procesos de negocio, un estándar abierto para la modificación organizacional, en particular considerando que este desarrollo de procesos de negocio. 3 Modelo de decisión y notación, un estándar abierto para modelar negocios. reglas de conducta. 4 Modelo y notación de gestión de casos, un estándar abierto para la especificación declarativa de procesos de negocio. 6 Cabe destacar que un conocido banco de Wallstreet mantiene su propio motor DMN: 5 Cf. https://camunda.com/blog/2020/08/como­cmmn­nunca­alcanzó­su­potencial/, https://github.com/goldmansachs/jdmn (consultado el 28 de marzo de 2003). consultado el 28­03­2024. 2023). Machine Translated by Google KI ­ Inteligencia Artística El conocimiento normalmente no está disponible en una forma codificados en un LLM y parcialmente gestionados como átomos de estructurada, bien mantenida y fácil de procesar. proceso simbólicos, que son modelos y plantillas de consulta generados – Los enfoques de aprendizaje profundo que requieren entrenar redes por un conjunto de técnicas de aprendizaje profundo y algoritmos de neuronales desde cero son extremadamente costosos de escalar; la propósito especial. Dependiendo de la tarea de BPM en cuestión, el LPM capacitación para un contexto organizacional particular a menudo no se instancia a partir del marco general presentado. La implementación de es factible dado que los procesos de negocios generalmente se las tareas no está necesariamente codificada, pero se puede abordar de desvían con el tiempo y se requiere una capacitación continua. manera más flexible utilizando enfoques basados en agentes, es decir, – Los enfoques de aprendizaje de refuerzo que potencialmente pueden bucles de razonamiento que han estado en el centro de la investigación sistematizar y automatizar parcialmente la mejora continua de los de IA durante décadas y ahora se aplican en cierta medida en el contexto procesos de negocios dependen del conocimiento para los de los LLM [23, 24].8 controles y contrapesos. El aprendizaje por acción tiene un costo, en particular en escenarios donde la distribución de la utilidad generada El LPM consta de los siguientes componentes clave (Fig. 1). por las recompensas es sensible al tiempo: en un contexto de BPM, las malas recompensas tienden a aparecer tarde, por ejemplo, en la Datos de proceso y fuentes de conocimiento. Los datos de proceso y larga cola de instancias de proceso que finalmente no terminan como el conocimiento se proporcionan para entrenar modelos de ML, alimentar se esperaba. algoritmos simbólicos y servir directamente a los humanos. Desde el punto de vista tecnológico, el conocimiento estructurado se conserva en En consecuencia, la recopilación de conocimientos y datos de todos los gráficos de conocimiento (o se gestiona utilizando otras tecnologías procesos, organizaciones, sectores industriales y variantes de procesos basadas en el conocimiento) y, en el caso de las incrustaciones de en un LPM en el sentido más amplio puede permitir un avance sustancial: lenguaje, en almacenes de vectores; los datos no estructurados suelen en lugar de confiar en un modelo específico, aunque simplista e estar disponibles en una multitud de formatos, mientras que los datos incompleto, se utilizan todos los modelos en la medida en que sean útiles tabulares están disponibles en bases de datos relacionales tradicionales. para gestionar un proceso particular (o una variante o instancia del mismo). Tenga en cuenta que aquí, no pretendemos utilizar gráficos de conocimiento para la representación de datos de eventos, a diferencia de los enfoques recientes de minería de procesos , principalmente debido a preocupaciones de escalabilidad; en cambio, el término gráfico de 4 modelos de procesos grandes conocimiento puede entenderse como un pars pro toto para las tecnologías semánticas que conservan el conocimiento del modelo de proceso. Para promover un punto de vista holístico sobre los fundamentos Conceptualmente, podemos dividir las fuentes de datos y conocimiento tecnológicos del software BPM en la era de la IA generativa, proponemos en conocimiento genérico sobre un proceso o su dominio de aplicación el concepto de un modelo de proceso grande (LPM). (vertical de la industria), conocimiento específico del cliente y del contexto, Un LPM se concibe como un sistema de software neurosimbólico que y datos de ejecución. Aquí, el conocimiento se suele extraer de los datos integra el conocimiento de gestión de procesos acumulado por expertos de forma continua, por ejemplo, en el caso de los puntos de referencia. y datos precisos sobre cómo las organizaciones ejecutan sus procesos Para utilizar el contenido de fuentes de conocimiento heterogéneas, la con enfoques de IA generativa y métodos de inferencia estadística y propuesta LPM presenta la noción de una capa de átomos de proceso: simbólica, fusionando así los datos de proceso y el conocimiento. Dados los átomos de proceso son hechos sobre un proceso (o relaciones entre los datos de proceso en un registro de eventos o formato relacional,7 el hechos) que son atómicos en el sentido de que no se pueden dividir en LPM identifica automáticamente el dominio de un proceso específico, partes más pequeñas sin perder su significado comercial. Por ejemplo, al así como el contexto de la organización que lo ejecuta, para luego generar comprobar la infracción de la regla “solo si el importe del pedido supera información y recomendaciones de acción, utilizando una colección de los 1000 $ se produce una aprobación”, la implicación lógica se puede herramientas para el diseño, análisis, ejecución y predicción de procesos. dividir en proposiciones “más pequeñas”, pero tiene poco sentido hacerlo Como contexto organizacional, los datos de proceso por sí solos son desde la perspectiva de un usuario comercial. Dividir el conocimiento del suficientes, pero se puede ingerir automáticamente información adicional, proceso en átomos de proceso y extraer átomos de proceso de información por ejemplo, en forma de modelos de proceso o documentos no o datos no estructurados cierra la brecha entre el enfoque en lenguaje estructurados, para aumentar las capacidades de LPM específicas del natural de los LLM y la necesidad de representaciones que sean contexto. El conocimiento de LPM es parcialmente ejecutables, en particular como consultas en tablas. 8 Observemos aquí que la forma en que se utiliza la noción de “agente” en el 7 Se pueden utilizar datos adicionales, como informes de encuestas sobre la contexto de los LLM está sujeta a debate comunitario y que muchas de las satisfacción de clientes o empleados; aun así, asumimos que los datos tabulares propuestas y prototipos de sistemas de agentes nacientes aún no hacen uso de las tradicionales que representan rastros de ejecución de procesos forman la entrada capacidades integrales de planificación, razonamiento y aprendizaje (de refuerzo) principal para nuestras inferencias basadas en datos. que se han ideado en las últimas décadas. Machine Translated by Google KI ­ Inteligencia Artística Fig. 1 Una arquitectura conceptual de Datos de proceso y fuentes de conocimiento un LPM Contexto del proceso/cliente Información, KPI, datos en vivo, Conocimiento y experiencia del proceso Datos de la experiencia Capa de átomo de proceso Retroalimentación con control humano Predicción de procesos Consulta de proceso Motores Motores (Clásico y Modelos de datación Conocimiento de procesos curados Contextualización en tiempo de ejecución LLM de propósito general (Modelo de Fundación) Proceso datos de proceso y conocimiento simbólico de proceso. Intuitivamente, los herramientas y algoritmos BPM clásicos, en particular para modelado, átomos de proceso pueden considerarse equivalentes a modelos de análisis y ejecución de procesos, mientras que las capacidades predictivas proceso declarativos o restricciones, cuyo descubrimiento (interactivo) a pueden ser proporcionadas por modelos basados en estadísticas (ver más partir de registros de eventos e integración con lenguajes de modelado abajo). imperativos como BPMN ya ha sido estudiado por la comunidad Contextualización en tiempo de ejecución. La columna vertebral de las científica y que puede, por ejemplo, obtenerse utilizando LLM con el herramientas mencionadas anteriormente está formada por los motores de propósito de detectar las llamadas anomalías semánticas [28, 29], es decir, consulta de datos y conocimiento de procesos. Estos motores proporcionan de comportamientos que son inusuales dado el conocimiento disponible y, la "tubería" básica para BPM de nivel empresarial, como capacidades de por lo tanto, posiblemente indeseables. gestión de control de acceso, así como interfaces para usuarios humanos. En consecuencia, es necesario proporcionar y ampliar la infraestructura Proceso de perfeccionamiento del LLM. Para perfeccionar un LLM se para el conocimiento de procesos y la consulta de datos de procesos para utilizan tanto conocimientos estructurados como información no estructurada. que funcione en interacción con inferencias basadas en LLM. Por ejemplo, Cabe destacar que un LPM no es un LLM entrenado en conocimientos un LLM podría generar hipótesis plausibles sobre un proceso basándose específicos del dominio. Para lograr eficiencia y flexibilidad, se supone que en sus datos de ejecución, y estas hipótesis pueden luego probarse de es preferible el ajuste fino y la contextualización en las indicaciones a un manera rigurosa utilizando algoritmos tradicionales de inferencia simbólica entrenamiento desde cero. El ajuste fino puede realizarse en múltiples y estadística.9 Para el análisis predictivo y la simulación, se utiliza una dimensiones. Por ejemplo, un LLM puede ajustarse con precisión para: colección de modelos de ML. Aquí, se pueden utilizar los mejores modelos de su clase para una tarea o conjuntos determinados. Dado el éxito de los modelos básicos en el dominio del procesamiento del lenguaje natural, los – gestión de procesos en general: con terminología específica y modelos básicos entrenados en rastros de ejecución de procesos conocimientos generales sobre BPM; comerciales pueden ser una ampliación prometedora de los modelos de – un proceso vertical particular; ML más tradicionales. – una región específica y sus normas y regulaciones; Mecanismo de retroalimentación inherente con control humano. – una organización específica. Para garantizar que las inferencias extraídas por el LPM sean realmente útiles, se proponen mecanismos de retroalimentación con el control Herramientas y su integración en BPM. Teniendo en cuenta que BPM es, humano. La retroalimentación puede ser proporcionada completamente por en muchos aspectos, una disciplina precisa, en la que propiedades como máquinas, por ejemplo, determinando automáticamente, en función de la la fiabilidad y la confianza desempeñan un papel importante, sería ingenuo heurística, si una consulta generada y ejecutada produce resultados suponer que un LLM puede sustituir por completo a las herramientas relevantes. Sin embargo, en muchos casos, se puede esperar que el árbitro existentes. Por ejemplo, la documentación sobre cómo se ejecutan los final sea un humano, que debe participar en el diseño de modelos de procesos debe ser interpretable y gestionable de forma sistemática y, en procesos, la interpretación de los datos de negocios y la evaluación de los resultados. la mayoría de los casos, las evaluaciones de rendimiento y conformidad de los procesos deben ofrecer garantías "duras" y no conjeturas aproximadas. Por tanto, un LPM debe basarse en herramientas de gestión de procesos 9 En general, la fusión de LLM y enfoques basados en el conocimiento como se clásicas para combinar los beneficios de los LLM con la gestión de datos describe aquí a menudo se conoce como generación aumentada por recuperación principalmente simbólica.. Machine Translated by Google KI ­ Inteligencia Artística significado de los indicadores clave de desempeño y otros conocimientos sistema cal. La retroalimentación humana podría evaluar algunas cuantitativos, y aprobar la implementación de cambios de procesos en recomendaciones de acción como particularmente útiles, mientras que otras los sistemas de información (empresariales). En consecuencia, la podrían marcarse como falsos positivos. Por ejemplo, en el contexto de un interpretación del bucle de retroalimentación debe respaldar capacidades sistema de recomendación de cambio de proceso, un experto humano puede de retroalimentación técnica adecuadas que permitan el aprendizaje de tener una mejor visión general de los efectos sociales, los riesgos y los refuerzo, pero también considerar factores de interacción entre humanos costos del cambio organizacional y evaluar algunas recomendaciones como y computadoras para facilitar la toma de decisiones racional. Los bucles no viables, porque es poco probable que afecten un cambio significativo del de retroalimentación e inferencia interactivos pueden orquestarse proceso o porque llevarlas a cabo es demasiado riesgoso o demasiado mediante motores de flujo de trabajo livianos o arquitecturas de bucle de costoso. La retroalimentación puede entonces usarse para ajustar el LLM, razonamiento; debido a su estocasticidad, asumimos que los LLM no generar datos etiquetados y entrenar sistemas de recomendación más desempeñan un papel en la orquestación. clásicos que utilizan enfoques basados en aprendizaje de refuerzo, como las La arquitectura conceptual LPM presenta el siguiente flujo de usuario iterativo máquinas tragamonedas contextuales , para mejorar continuamente el (ver también la Figura 1), ya sea para una máquina o un usuario humano que LPM. desee realizar una tarea BPM.10 1. Especificar el objetivo (BPM). El usuario especifica el objetivo de BPM que desea alcanzar junto con las condiciones límite. 5 formas en las que los LPM pueden facilitar el BPM Un objetivo de este tipo puede ser relativamente sencillo, como por ejemplo “dame los cambios de configuración más importantes que ayuden a reducir A continuación, presentamos un esquema de cómo los LPM pueden facilitar la el tiempo de ciclo en mi proceso de pedido a cobro”, o puede ser muy BPM. Señalamos resultados de investigación específicos que brindan contexto ambicioso, como por ejemplo “cambiar la implementación del proceso de adicional y evidencia preliminar o parcial de viabilidad potencial para luego brindar pedido a cobro de modo que el tiempo de ciclo se reduzca sin afectar un análisis más matizado de la viabilidad en la Sección 6. negativamente a otros indicadores clave de rendimiento (KPI)”. En caso de que el objetivo lo especifique un usuario de máquina, esperamos que se active por un contexto en el que se encuentre un usuario humano, por 1. Reducción del esfuerzo y la experiencia necesarios para las tareas de BPM ejemplo, desde un panel de control al que acceda un usuario humano, en el basadas en el conocimiento. La gestión de procesos de negocio es un trabajo que se resuma un proceso de pedido a cobro con un tiempo de ciclo inferior que requiere un gran conocimiento, tanto de una profunda experiencia con al normal. respecto a herramientas y conjuntos de habilidades específicos, como 2. Consumir recomendación o acción. El objetivo especificado se convierte en un notaciones de modelado de procesos y lenguajes de consulta de datos de mensaje, en función del cual el LLM optimizado para el proceso produce el procesos, como de un buen acceso y comprensión del conocimiento y los contenido deseado y activa consultas a otros subsistemas. Tras la respuesta datos que existen sobre un proceso en particular, normalmente en un a la consulta, el mensaje inicial puede refinarse aún más o pueden generarse contexto organizacional altamente complejo. Por lo tanto, los expertos consultas adicionales. Por ejemplo, el LPM puede buscar variantes de humanos en BPM (individuos o equipos) deben tener un alto nivel de proceso para las que el tiempo de ciclo sea particularmente alto para luego habilidades técnicas y socioprofesionales, así como una experiencia identificar posibles causas raíz en función del análisis de correlación y el sustancial dentro de una organización en particular: la barrera de entrada conocimiento textual; para esto, se requieren consultas repetidas del registro para ejecutar con éxito una iniciativa de BPM es alta. Los LPM pueden reducir de eventos y la evaluación de los resultados de consulta devueltos. esta barrera de entrada (i) facilitando la búsqueda y presentación automática de información en el contexto en el que es útil y relevante; 3. Proporcionar retroalimentación. En función de los resultados devueltos por el (ii) convertir información no estructurada y semiestructurada en modelos y LPM, se proporciona retroalimentación, ya sea por un humano o por una consultas, lo que requiere un conocimiento menos detallado y formal de los máquina (la última de las cuales también puede ser un componente del lenguajes para el diseño y análisis de procesos; (iii) enriquecer y ampliar la LPM). Por ejemplo, si el motor de consulta de datos de proceso devuelve un información contextual del proceso en base a hechos inferidos lógicamente o conjunto vacío, esto puede considerarse una retroalimentación negativa en estadísticamente plausibles. En el contexto de este objetivo más amplio, muchos contextos. La retroalimentación humana es necesaria en casos imaginamos, por ejemplo, las siguientes capacidades específicas de LPM: más matizados, es decir, para proporcionar un contexto que no existe dentro de los límites de lo puramente técnico. – Convertir texto en lenguaje natural en modelos de procesos y consultas 10 Observemos que el enfoque del LPM está en la gestión de procesos (de modelos de procesos y datos); de negocio , es decir, en asegurarse de que una organización funcione de la manera deseada, y no en la ejecución de instancias de procesos – Mejorar los modelos de procesos y consultas basados en particulares caso por caso. retroalimentación en lenguaje natural; Machine Translated by Google KI ­ Inteligencia Artística – Recomendar (cambios) modelos de procesos y consultas basados en el mediante la creación de un canal que busque sistemáticamente en los contexto del lenguaje natural; silos de conocimiento organizacional12; en este caso, se pueden – Escalar conocimientos genéricos derivados de datos de procesos en todas emplear los enfoques existentes para el descubrimiento interactivo de las organizaciones generando automáticamente plantillas a partir de procesos que utilizan el conocimiento del dominio [35, 36], donde el consultas ejecutadas comúnmente e instándolas automáticamente en conocimiento del dominio se obtiene (parcialmente) utilizando LLM. un contexto determinado. – Utilizar información en lenguaje natural para descubrir fuentes de datos en Aquí, esperamos que las nociones emergentes de modelado de grandes paisajes de sistemas de información y recomendar scripts/ procesos conversacionales y minería de procesos conversacionales, consultas ETL para extraer datos relevantes, avanzando y aplicando cuya viabilidad a nivel humano en el circuito está respaldada en cierta la investigación existente sobre PNL para ETL ; medida por resultados de investigaciones recientes [10, 12, 32], se conviertan en una realidad y encuentren su camino hacia el software BPM de nivel de – Permitir la previsión y el análisis basados en datos basados en modelos producción de manera incremental en los próximos años. fundamentales, evitando el entrenamiento de modelos específicos para los procesos de una organización específica. 2. Mejora de la observabilidad de los procesos. Un desafío clave en BPM es el manejo de datos; el método clave que ejemplifica esto es la minería de 3. Convergencia del diseño, la ejecución y el análisis de procesos. Por último, el procesos, que se considera ampliamente una piedra angular del análisis de LPM puede ayudar a las organizaciones a avanzar hacia una mejora de procesos moderno. La minería de procesos utiliza registros de eventos que procesos verdaderamente continua y automatizada, en la que convergen el se han extraído de los sistemas empresariales como datos de entrada; estos diseño, la ejecución y el análisis de procesos. La idea de la mejora autónoma registros de eventos normalmente no están disponibles fácilmente y se sabe de los procesos de negocio ya se ha estudiado en profundidad en el contexto que generarlos como resultado de los pipelines de extracción­transformación­ de los motores de ejecución de procesos de negocio, que se complementan carga (ETL) implica un esfuerzo sustancial. Incluso cuando se generan con capacidades de aprendizaje de refuerzo que, con el tiempo, aprenden la registros de eventos, solo contienen un pequeño subconjunto de los datos mejor variante de proceso para un contexto determinado. Esto pone de de proceso que existen en una organización, por ejemplo, porque no se relieve la practicidad de la idea general, aunque en una configuración de puede acceder a todos los sistemas de TI relevantes o porque partes ingeniería que se asemeja a un desarrollo inmaculado basado en modelos sustanciales del proceso se ejecutan a través de canales informales (y, por que normalmente no se puede lograr en el contexto de las implementaciones lo tanto, no se registran en tablas de bases de datos). Además, interpretar y los despliegues de BPM de la vida real. En realidad, los modelos de lo que ocurre en el registro de eventos normalmente no es trivial, por ejemplo, procesos normalmente no se implementan con el clic de un botón; en porque el significado comercial de los eventos no siempre es claro, lo que cambio, se deben ejecutar flujos de trabajo de configuración complejos e aumenta el riesgo de malas interpretaciones. Desde una perspectiva intensivos en conocimiento para finalmente activar una actualización. industrial, resumimos estos desafíos bajo el paraguas de la observabilidad de procesos, que se refiere, de manera algo análoga a la observabilidad de datos en sistemas distribuidos , al grado en que un proceso es observado En términos más generales, el desafío de convertir los resultados del análisis y comprendido correcta y completamente, dado el objetivo (comercial) en de procesos en acciones específicas que cambien el funcionamiento de un cuestión.11 Afirmamos que la observabilidad de procesos tiende a proceso está surgiendo como un desafío clave en la investigación así permanecer relativamente baja cuando se depende únicamente de un como en la práctica. Al hacer que el conocimiento esté fácilmente disponible método de análisis, como el modelado o la minería (basada en registros de en un contexto determinado, el LPM puede hacer que estos flujos de eventos). Al fusionar el conocimiento y los datos de una amplia variedad de configuración frágiles y que requieren mucho trabajo humano sean más fuentes, el LPM puede aumentar potencialmente la observabilidad de ágiles y resilientes. Además, si se materializan, mejores capacidades de procesos. Por ejemplo, las siguientes capacidades del LPM pueden facilitar simulación y predicción pueden reducir sustancialmente el riesgo de potencialmente la observabilidad de procesos: implementar cambios en el proceso. Aquí, imaginamos las siguientes capacidades de LPM, en el espíritu de BPM aumentado con IA (por ejemplo): – Relacionar los conocimientos adquiridos a partir del análisis de procesos con las posibles acciones y sus supuestas consecuencias; – Convertir grandes cantidades de conocimiento de procesos informales y – Fusionar datos y conocimientos para evaluar de forma integral las no estructurados en modelos y consultas procesables implicaciones y los riesgos de determinadas acciones de cambio de procesos; 11 Para una introducción informal a la observabilidad de procesos, consulte: https:// 12 blogs.sap.com/2022/09/16/what­is­business­process­observability­and­why­does­it­matter/, Esto se relaciona con el objetivo general anterior, pero imaginemos un objetivo más amplio. consultado el 28­03­2023. escala, así como un enfoque más sistemático. Machine Translated by Google KI ­ Inteligencia Artística – Evaluar continuamente los cambios de procesos implementados y 6 Viabilidad y desafíos ajustarlos para lograr un rendimiento óptimo. Prevemos que las LPM surgirán de manera iterativa, lo que ayudará a Aun así, sostenemos que el control y la supervisión humanos garantizar que las capacidades proporcionadas cumplan con las expectativas siempre deben desempeñar un papel en la mejora continua del de ética, calidad y cumplimiento. A continuación, ofrecemos un esquema de proceso, para evitar que las máquinas se queden estancadas en tres pasos de cómo las LPM pueden potencialmente evolucionar y madurar. óptimos locales u optimicen hacia un comportamiento del proceso claramenteComenzamos indeseable. con capacidades que consideramos generalmente factibles dado el estado del arte (Paso 1) y luego avanzamos, a través de capacidades El siguiente ejemplo destaca los tres beneficios potenciales de alto nivel que plantean desafíos sustanciales cuyas soluciones aún están en ciernes antes mencionados de los LPM. Considere una organización de compras (Paso 2), hacia una visión de “cielo azul” que se centra más en lo que es que recién está comenzando con la gestión de procesos comerciales y intuitivamente deseable que en lo que es factible (Paso 3). En cada paso, desea adoptar un enfoque basado en datos de inmediato. Los KPI a nivel de argumentamos, con base en la literatura científica, la viabilidad de las proceso, extraídos directamente de la base de datos relacional del sistema capacidades o la falta de ellas y destacamos algunos de los desafíos de empresarial, han indicado que el proceso tiene un desempeño deficiente en investigación que vemos.13 términos de tiempo de ciclo; para un análisis en profundidad, se requiere la aplicación de la minería de procesos. Con base en la documentación del sistema no estructurada, el LPM sugiere de qué tablas extraer los datos para 1. Ampliar el modelado y el análisis con conocimiento contextualizado. El el proceso de compra a pago, recomendando una configuración del conector primer paso hacia la visión LPM es la utilización del conocimiento de ETL que solo necesita ajustes menores (Beneficio 2). Después de que se los procesos de negocio que de otro modo no sería posible encontrar o ingieren los datos, se ejecuta un análisis de datos automatizado. El sistema no se podría utilizar. ERP de la organización que ejecuta el proceso está altamente personalizado estructurado de una manera que permite un análisis parcialmente y se integra con subsistemas y servicios autoconstruidos. Por lo tanto, no automatizado con el ser humano en el circuito. Aquí, las dos capacidades existe un modelo de proceso de referencia exacto que se pueda aplicar. principales son el modelado y la minería de procesos aumentados por Basándose en una gran colección de modelos de procesos de referencia LLM. Incluso antes de la aparición de LLM y modelos de base, una (potenciales), así como en la documentación textual específica de la línea de investigación sustancial se ha centrado en la extracción de organización, el LPM genera un conjunto de consultas para la comprobación modelos de procesos de información no estructurada y, en particular, de conformidad, así como para los análisis cuantitativos, los ejecuta y texto [12, 39­41] y, a la inversa, en convertir modelos de procesos clasifica sus resultados y la interpretación empresarial básica por relevancia simbólicos en artefactos basados en lenguaje natural. Estos para el registro de eventos extraído (Beneficio 1). Por ejemplo, la modelos pueden ser imperativos, como los modelos BPMN clásicos, o comprobación de conformidad puede mostrar que las compras no declarativos, como consultas basadas en restricciones que se ejecutan convencionales en un registro de eventos, por ejemplo, para fines de verificación de conformidad. Además, varios trabajos han comenzado a explotar (compras sin requisición) ocurre con frecuencia, lo que lleva a un mayor grandes colecciones de modelos de procesos con el objetivo de capturar tiempo para completar el proceso y riesgos de cumplimiento para montos de una comprensión general de cómo se deben modelar u operar los órdenes de compra mayores a 10,000$. Los resultados se vinculan luego a procesos, con el objetivo de detectar instancias de proceso desviadas recomendaciones de acción, basadas en conocimiento de gestión de [28, 29] y proporcionar sugerencias de modelado de procesos. Se procesos "históricos" (Beneficio 1), así como datos y modelos de procesos espera que, con el uso de los LLM, los enfoques para facilitar la de compra a pago de otras organizaciones (Beneficio 2). Finalmente, las generación y el mantenimiento de conocimientos, convertir el recomendaciones de acción más prometedoras se aplican a la configuración conocimiento no estructurado en especificaciones y consultas del sistema, donde primero se prueban (de manera semiautomática y ejecutables y adaptar estas especificaciones y consultas a un contexto cuidadosa) y luego se prueban, para finalmente descartarse o aplicarse por de proceso particular resulten más eficaces y fáciles de implementar. completo a todo el sistema de producción (Beneficio 3). Por lo tanto, la aplicación de los LLM con este fin puede considerarse factible y se espera que tenga un impacto sustancial en el software En nuestro ejemplo de compra no convencional, los posibles cambios podrían BPM en el futuro cercano. ser la adición de un paso de aprobación previa para pedidos de grandes cantidades, o la aplicación “estricta” del ordenamiento de actividades para todos o algunos casos que superen los montos de pedidos de compra de 10 También esperamos que los próximos años de investigación y desarrollo 000 $. respondan a muchas preguntas abiertas y matizadas sobre las capacidades de análisis y modelado aumentadas con LPM. 13 Obviamente, la lista de desafíos de investigación no es exhaustiva, es decir, puede servir como un punto de partida para una opinión. Machine Translated by Google KI ­ Inteligencia Artística vínculos, en particular sobre la interacción de modelos simbólicos y modelos específicos (es decir, específicos de la organización y del metamodelos autogenerados y hechos a mano, y el grado en que la proceso) a escala, la falta de contexto holístico en la mayoría de los importancia de los modelos imperativos disminuirá en favor de registros de eventos, el dinamismo de los entornos comerciales y, conjuntos de restricciones declarativas que se pueden adaptar y en el caso de enfoques híbridos como la generación de modelos ensamblar automáticamente. de procesos con aprendizaje profundo, la incapacidad de los para el modelado y análisis a demanda, dado el contexto actual. modelos de procesos simbólicos tradicionales para capturar matices Considerando la prevalencia del conocimiento de procesos socioorganizacionales. El uso de modelos de base puede estructurado y no estructurado, por ejemplo, en la forma de los miles potencialmente abordar el problema de la falta de conocimiento de modelos de procesos que una sola organización puede poseer y contextual al extraer este conocimiento de fuentes no estructuradas las decenas de miles de modelos de procesos que los proveedores o difíciles de buscar, y proporcionar alternativas a la simulación y de sistemas empresariales tienen a su disposición, esperamos que predicción basadas en un entrenamiento supervisado altamente existan suficientes datos de alta calidad para “afinar” los LLM para específico, al entrenar en cambio modelos de base en rastros de tareas BPM genéricas y (si vale la pena el costo) específicas de la ejecución de procesos que pueden ser capaces de generalizar la organización y para proporcionar capacidades de generación simulación y la predicción en todo el contexto de procesos y aumentadas por recuperación de alto valor. Desafíos. organizaciones (hasta cierto punto). Sin embargo, debido a la falta Dada la viabilidad a corto y mediano plazo del Paso 1, asumimos de investigación que evalúe sistemáticamente el potencial de la IA que los desafíos clave que rodean este paso son de naturaleza generativa y los modelos de base en las direcciones mencionadas ingenieril. En particular, consideramos que vale la pena abordar los anteriormente, la viabilidad sigue siendo una pregunta abierta. siguientes desafíos: (i) definir métricas de evaluación rígidas para la Desafíos. Nuestra evaluación es que el Paso 2 requiere el generación de modelos de procesos y consultas con soporte de IA establecimiento de bases que ya existen de manera análoga al Paso generativa; (ii) especificar y evaluar formatos de intercambio de 1 o que requieren un cambio de paradigma para facilitar la fusión datos compatibles con LLM que sirvan como formatos de de información no estructurada y datos tabulares para la generación representación de "capa intermedia" entre subsistemas simbólicos de información. Más específicamente, solicitamos: (i) establecer y subsimbólicos; (iii) evaluar el potencial de ajustar con precisión los las bases conceptuales de la minería de procesos conversacional, LLM para la generación de modelos de procesos y consultas, así así como de nuevos paradigmas de simulación de procesos más como el potencial de enfoques alternativos o complementarios como aplicables; (ii) diseñar e implementar enfoques para obtener hipótesis la generación aumentada por recuperación. serializables sobre datos tabulares a partir de información no estructurada y conocimiento informal; (iii) diseñar, implementar y 2. Fusión de datos no estructurados y tabulares para obtener información evaluar algoritmos que permitan la evaluación de la hipótesis antes procesable. El paso anterior establece el LPM como una ampliación mencionada de manera escalable. del BPM, sin cambiar los fundamentos del BPM. Este paso tiene como objetivo utilizar el LPM para avanzar en la frontera del análisis de procesos de negocios, en particular hacia la simulación y la 3. Automatizar la mejora continua con el control humano. Como objetivo predicción. Estas capacidades han sido objeto de estudios científicos final a largo plazo, los LPM pueden permitir la automatización del exhaustivos y a menudo utilizan enfoques de aprendizaje profundo. ciclo de vida de BPM. La detección de anomalías basada en redes neuronales puede Es decir, el ciclo continuo de diseño, ejecución, análisis y mejora de permitir a las organizaciones inferir acciones que corrijan las procesos, con participación humana únicamente para permitir el anomalías identificadas, mejorando así el rendimiento del proceso control social total de la toma de decisiones clave. La cuestión de. Además, los enfoques de monitoreo predictivo para procesos si esto es posible, en absoluto o en cierta medida, sigue abierta. La de negocios a menudo utilizan el aprendizaje profundo para predecir investigación sobre la automatización (total) de todo el ciclo de vida actividades o resultados futuros, o para clasificar casos. Algunos de BPM es escasa. enfoques de simulación utilizan el aprendizaje profundo para generar Una línea de trabajo notable ha propuesto y evaluado el uso de los modelos de simulación de procesos de negocios más realistas, principios y prácticas de Operaciones de Desarrollador (DevOps) facilitando así las mejoras de procesos al permitir análisis junto con el aprendizaje de refuerzo para este fin. Aquí, se contrafactuales ("qué pasaría si"). Finalmente, investigaciones propone el uso de bandidos multiarmados contextuales para enrutar recientes incluso investigan la previsión basada en datos de modelos instancias de proceso a la mejor variante de proceso posible de procesos completos. A pesar de estos importantes esfuerzos (configuración) dado el contexto de caso particular. Con el tiempo, de investigación, las herramientas de simulación y predicción de se espera que el comportamiento de enrutamiento contextual procesos de negocios rara vez se aplican a gran escala en la converja, lo que puede desencadenar un cambio de proceso final de industria y, por lo general, siguen siendo herramientas para la manera análoga a un cambio basado en una prueba A/B clásica. El exploración básica y no para el análisis de alto impacto. Entre las enfoque se puede extender para incluir las llamadas pruebas de razones de esto se encuentran los desafíos de ingeniería sombra que enrutan los casos, en paralelo a su ejecución real, a relacionados con la capacitación y el reentrenamiento de personal altamente calificado. través de pruebas hipotéticas. Machine Translated by Google KI ­ Inteligencia Artística variantes de proceso, basándose tanto como sea posible en ¿Cómo se pueden definir las barreras de protección para los sistemas propiedades y comportamientos del mundo real y utilizando simulación de ejecución de procesos (en cierta medida) autónomos y garantizar solo cuando sea necesario. Las pruebas de sombra se pueden su cumplimiento, de modo que las compensaciones entre utilizar entonces para limitar los candidatos de cambio que son estandarización y optimización personalizada se puedan trasladar de suficientemente prometedores para las pruebas piloto. El enfoque se la primera a la segunda? puede ampliar aún más para permitir la intervención humana, reduciendo así el riesgo de decisiones poco razonables de la máquina Los desafíos de viabilidad que son ortogonales a los tres pasos anteriores dado el contexto que está disponible para un experto humano pero no se relacionan con la gestión de datos, la confiabilidad y el cumplimiento, y para la máquina [49, 50]. Desde una perspectiva de la industria, los la interacción de la toma de decisiones humana y de las máquinas: enfoques propuestos son muy ambiciosos, ya que requieren una flexibilidad y agilidad sustanciales en la configuración de sistemas – El LPM consume datos de una amplia gama de fuentes y los procesa de empresariales complejos y se basan principalmente en datos de diversas maneras para que los humanos y las máquinas puedan rendimiento del proceso al tomar decisiones sobre cambios de usarlos de manera eficiente en el ciclo de vida del BPM. La integración proceso. Los modelos de base pueden permitir potencialmente la con fuentes de datos externas y la gestión de los datos ingeridos y fusión de conocimientos basados en datos de ejecución con generados es un desafío clave, en particular porque los datos y el conocimiento estructurado y no estructurado, al mismo tiempo que conocimiento generados por el LLM pueden ser de calidad cuestionable mantienen un ciclo de retroalimentación similar al aprendizaje de y requerir una curación sustancial, ya sea por parte de máquinas más refuerzo que reevalúa continuamente los conocimientos y acciones confiables o de humanos. generados. Más allá de eso, los LPM también pueden ayudar a utilizar Por lo tanto, un riesgo de la propuesta LPM y de implementaciones datos de (sub)procesos mal estructurados; Por ejemplo, muchos similares de IA generativa es que los problemas bien conocidos procesos de contratación se llevan a cabo principalmente en un nivel relacionados con la gestión de datos y BPM (posiblemente más social y dejan un rastro de información textual que es difícil de analizar pronunciados en el contexto de los pipelines ETL en la minería de con enfoques tradicionales de minería de procesos; esto deja un vacío procesos ) se exacerbarán aún más, requiriendo así innovación en que el análisis de procesos de negocios aumentado por LLM puede el subcampo de los métodos de consulta de procesos. Los potencialmente llenar. Por lo tanto, los LPM como puentes entre la desafíos de gestión de datos antes mencionados son generalmente toma de decisiones basada en datos, intensiva en conocimiento y bien conocidos en la investigación de IA aplicada y han llevado al social pueden permitir un salto hacia una mayor autonomía de la surgimiento de la IA centrada en los datos , un paradigma de ingeniería máquina en el nivel del ciclo de vida de BPM. Sin embargo, que se centra en la gestión de datos y los pipelines de datos como considerando la escasez de investigación relacionada, la viabilidad fundamentos clave de las aplicaciones basadas en ML. general sigue siendo una pregunta abierta, en particular cuando se considera la complejidad en el contexto de los sistemas empresariales – Los LLM son frecuentemente criticados por la falta de confiabilidad de tradicionales (tiempo entre la acción y el efecto, así como el tamaño los resultados que producen y han sido descritos por expertos como del espacio de acción), así como los requisitos de confiabilidad y loros estocásticos y generadores de basura. 14 cumplimiento para cambios de procesos de alto impacto. Desafíos. generadores. Por lo tanto, es crucial que los conocimientos y las Debido a que el Paso 3 requiere la fusión de la gestión y la ejecución, acciones inferidos por los LLM y otros modelos de aprendizaje profundo tanto a nivel técnico como organizacional, lo consideramos se evalúen automáticamente en cuanto a su fiabilidad y sus sustancialmente más desafiante que el Paso 2, que es en gran medida implicaciones comerciales y sociales, como la equidad. Más allá independiente de los sistemas de ejecución. Además, suponemos que de eso, una cuestión clave es que la ingestión de más contenido el ajuste dinámico de los procesos a un contexto organizacional aumentará el riesgo ético y de cumplimiento de la fuga de información específico requerirá, en el futuro previsible, siempre un equilibrio entre personal, un problema que recientemente ha suscitado un interés la estandarización, por ejemplo, para controlar los costos y los riesgos sustancial en la investigación en el contexto de la minería de procesos asociados con la complejidad organizacional. En consecuencia, [56, 57]. Los posibles problemas éticos y de privacidad van de la mano planteamos desafíos en forma de las siguientes preguntas: (i) ¿cómo con los requisitos para garantizar el cumplimiento legal, que se puede diseñar un software empresarial, más allá de los motores de tradicionalmente es un desafío que BPM tiene como objetivo abordar ejecución de procesos, para lograr la máxima flexibilidad y modularidad y no exacerbar. en el nivel de conocimiento, de modo que los cambios deseados en – Incluso si las inferencias extraídas por el LPM (o: un LLM subyacente) un proceso o variante de proceso se puedan implementar con una son técnicamente verificables, aún pueden plantear desafíos para la mínima participación humana? (ii) ¿cómo cambian los requisitos toma de decisiones humana. Por ejemplo, un fundamentales del software BPM orientado al análisis (por ejemplo, el software de minería de procesos) cuando el software se convierte en un componente de misión crítica de los sistemas de ejecución? (iii) 14 Ver: https://www.aisnakeoil.com/p/chatgpt­is­a­bullshit­generator­ pero, Técnicamente, una tontería es una afirmación que emite un agente con indiferencia hacia la verdad de la afirmación. Machine Translated by Google KI ­ Inteligencia Artística La consulta o especificación de configuración de proceso puede ser así como respecto a la variabilidad de resultados tales como predicciones técnicamente correcta e interpretable por humanos, pero requiere y recomendaciones de acción. un esfuerzo cognitivo sustancial para entenderla; si el LPM recomienda entonces la ejecución de la consulta o especificación a un usuario humano, el usuario puede activar la ejecución sin verificar 7 Discusión cuidadosamente, sin detectar fallas que podrían haberse identificado solo con el conocimiento humano que no se mantiene en un nivel Esta sección relaciona la propuesta con otras visiones y visiones puramente técnico. Cuanto más severa sea la consecuencia de una generales de la IA generativa y BPM y analiza brevemente BPM y la IA acción recomendada o influida por un LPM, más importante es que generativa para modalidades distintas al texto. los expertos humanos deliberen cuidadosamente las implicaciones de la acción antes de ejecutarla o activarla. Aquí, se pueden utilizar 7.1 Conceptos relacionados conceptos de la psicología conductual como la arquitectura de elección que estudian cómo la toma de decisiones humana se Teniendo en cuenta el revuelo actual en torno a los LLM y la IA ve influida por la información contextual, que ya han sido adoptados generativa, surgen a un ritmo acelerado propuestas conceptuales e por el ámbito de los sistemas de información. implementaciones para el uso específico de los LLM en el dominio. Un ejemplo destacado es el desarrollo de BloombergGPT, un LLM de – Los límites de la viabilidad económica de la capacitación, operación y propósito especial entrenado específicamente para el dominio financiero mantenimiento de los modelos de base (y, más ampliamente, de los. Como era de esperar, también han surgido las primeras propuestas modelos básicos) son una frontera en movimiento. Es bien sabido integrales para fusionar BPM y LLM. que la capacitación de los modelos básicos, y por lo tanto también En particular, Vidgof et al. presentan una visión y una agenda de las actualizaciones completas de los modelos básicos, son muy investigación para los LLM y BPM ; su trabajo está principalmente costosas (en millones de dólares). Incluso extraer inferencias de alineado con el ciclo de vida de BPM, es decir, afirmamos que proporciona modelos previamente entrenados puede generar costos sustanciales, una visión de gestión de los LLM para BPM, mientras que nuestra que superan los costos de operación de los sistemas tradicionales perspectiva está orientada a la viabilidad. Beheshti et al. proponen de inferencia simbólica o estadística. Por lo tanto, para cada Process­ GPT , un enfoque basado en transformadores para aplicación de los modelos básicos (y, en consecuencia, de los recomendar las próximas acciones en procesos intensivos en conocimiento modelos básicos de aprendizaje) es crucial evaluar si los costos superan los beneficios. durante la ejecución.15 De manera análoga a BloombergGPT, y si las tecnologías alternativas pueden lograr mejores puntajes en ProcessGPT se concibe como un GPT de propósito especial, entrenado un cálculo de costo/beneficio. Por ejemplo, en algunos casos de uso, desde cero con datos específicos del dominio. Por lo tanto, la diferencia utilizar los modelos de procesamiento de lenguaje natural con nuestra propuesta LPM es doble: (i) nuestro alcance es más amplio, preentrenados más pequeños de las bibliotecas populares de Python abarcando todo el ciclo de vida de BPM y (ii) no proponemos para la comparación de similitud semántica puede tener más sentido principalmente entrenar un GPT desde cero, bajo el supuesto de que los que confiar en un LLM ajustado con precisión más costoso, que costos superan los beneficios y que el ajuste fino y la contextualización siempre implica un bloqueo a la arquitectura LLM específica. basada en indicaciones son mejores medios para alcanzar el mismo Un compromiso entre las dos opciones puede ser un poderoso LLM objetivo en el contexto de grandes modelos de lenguaje. Si bien el de propósito general que dependa en gran medida de la generación entrenamiento de modelos básicos sobre datos de procesos para fines aumentada de recuperación, utilizando así el potencial de los de predicción y simulación contrafactual es parte de la agenda de sistemas basados en el conocimiento existentes. Más allá de eso, la investigación de LPM, la viabilidad general de los LPM como un enfoque implementación de modelos más pequeños que se entrenan en más amplio no depende de la viabilidad de esta capacidad potencial función de la retroalimentación de modelos muy grandes ha surgido particular. Centrándose en el análisis de datos de procesos, Berti y Qafari como una dirección de investigación prometedora , que podría proponen enfoques para utilizar modelos básicos de minería de facilitar potencialmente el uso más rentable de los modelos de base. procesos listos para usar, en particular para responder directamente a las consultas de los usuarios y para generar consultas simbólicas sobre En los tres casos, los desafíos son razonablemente factibles de abordar datos de procesos. Las propuestas están respaldadas por experimentos para el Paso 1: aquí, la generación de conocimiento simbólico (es decir, preliminares, que brindan evidencia de viabilidad. modelos y consultas) se puede gestionar utilizando tecnologías de base Dado el alcance (más pequeño) del artículo de Berti y Qafari, de datos y conocimiento bien establecidas, es verificable y se puede consideramos el enfoque propuesto en su trabajo como un subconjunto integrar en abstracciones fáciles de usar en procedimientos relativamente de las capacidades que los LPM pueden ofrecer, proporcionando primero sencillos y bien comprendidos. Por el contrario, tanto el Paso 2 como el Paso 3 plantean desafíos sustanciales con respecto a la gestión de modelos de ML, como un 15 Tenga en cuenta que consideramos que uno de los casos de uso propuestos posible modelo de base basado en rastros de ejecución de procesos, (calificación automatizada de exámenes y detección de plagio) es altamente cuestionable desde perspectivas éticas y de viabilidad. Machine Translated by Google KI ­ Inteligencia Artística y evidencia parcial de la viabilidad de los LPM. De manera similar, vemos Avances en IA generativa. Si bien nuestro LPM utiliza un LLM (basado los trabajos de Klievtsova et al. y Grohs et al. como puntos de en un modelo de base) y potencialmente modelos de base específicos partida conceptuales y experimentales para los LPM para el modelado de datos de ejecución de procesos, vemos el LPM como una fusión de IA de procesos. Aquí, podemos destacar nuevamente que lo que aún falta generativa y enfoques simbólicos y estadísticos tradicionales para son trabajos experimentales que brinden evidencia sólida de la efectividad automatizar el razonamiento y la toma de decisiones en BPM. Evaluamos de los LLM en un contexto de ejecución de procesos. la aplicación de LLM de propósito general ajustados a procesos como contextualizadores, generadores y aumentadores de modelos simbólicos y consultas como factible y como facilitadores sustanciales de BPM. 7.2 IA generativa para BPM más allá de los LLM Aquí, esperamos un impacto sustancial en la industria durante los próximos años. Más allá de eso, vemos el uso de modelos de base de La propuesta LPM y su analogía LLM colocan a la IA generativa basada propósito especial para BPM, en particular basados en rastros de en texto en el centro de atención. Más allá de esto, los modelos de base ejecución de procesos, como una frontera de investigación prometedora entrenados específicamente en rastros de ejecución de procesos pueden pero demasiado incipiente para justificar predicciones de implementaciones ser utilizados por el LPM para predicción y simulación. Obviamente, industriales a gran escala. Además, la aplicación de IA generativa para otras modalidades como imagen, video y sonido también son relevantes. automatizar partes más grandes del ciclo de vida de BPM también es Por ejemplo, los modelos de proceso a menudo se crean como parte de potencialmente interesante, pero plantea desafíos de viabilidad presentaciones de diapositivas notorias, lo que dificulta la gestión de los sustanciales y riesgos comerciales/sociales que requieren una modelos y su uso para el análisis de datos. Para facilitar la transición de investigación y validación exhaustivas antes de que una implementación imágenes a representaciones de modelos de proceso formales, una potencial sea viable. investigación reciente introduce un enfoque basado en el aprendizaje Agradecimientos Los autores desean agradecer a los numerosos colegas del ámbito profundo para convertir imágenes de flujo de proceso en BPMN académico y de la industria que trabajan en la aplicación de los LLM y la IA generativa compatible con estándares (basados en XML). En este contexto, uno y cuyo trabajo ha influido en la perspectiva proporcionada en este documento. podría imaginar que la IA generativa se puede aplicar, si no directamente como procesadores de imágenes, entonces como posprocesadores de Declaraciones la salida XML. Además, los modelos de IA generativa podrían aplicarse potencialmente para generar automáticamente información, como Conflicto de intereses Todos los autores con afiliación no académica trabajan para modelos y consultas de bases de datos, a partir de grandes cantidades una empresa que desarrolla software de gestión de procesos de negocios. de datos de audio recopilados, como entrevistas a expertos o conversaciones con clientes. Sin embargo, en este caso tampoco está Acceso abierto Este artículo está licenciado bajo una Licencia Creative Commons Atribución 4.0 Internacional, que permite el uso, intercambio, adaptación, distribución claro si es mejor procesar directamente la modalidad adicional (sonido) y reproducción en cualquier medio o formato, siempre que se otorgue el crédito mediante un modelo de base; el preprocesamiento con un procesador de correspondiente al autor original y a la fuente, se proporcione un enlace a la licencia voz a texto estándar puede ser más factible y más fácil de implementar. Creative Commons y se indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el En conclusión, cabe señalar que nuestra visión de LPM se presenta material no está incluido en la licencia Creative Commons del artículo y el uso que principalmente en relación con el estado actual de BPM y los procesos pretende darle no está permitido por la regulación legal o excede el uso permitido, de negocio, considerando el debate en curso sobre cómo se puede deberá obtener permiso directamente del titular de los derechos de autor. Para ver aplicar la IA generativa en general en los procesos de negocio. Sin una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. embargo, sigue siendo incierto cómo, o incluso si, la IA generativa generará cambios fundamentales en las prácticas de BPM o en los procesos de negocio que requieren cambios fundamentales en los enfoques de BPM, como el ciclo de vida de BPM, desde una perspectiva Referencias de gestión. 1. Nguyen N, Nadi S (2022) Una evaluación empírica de las sugerencias de código de Github Copi­lot. En: Actas de la 19.ª Conferencia Internacional sobre Minería de Repositorios de Software, MSR '22, págs. 1–5. 8 Conclusión Asociación para Maquinaria Informática, Nueva York, NY, EE. UU. https:// doi.org/10.1145/3524842.3528470 2. Wu S, Irsoy O, Lu S, Dabravolski V, Dredze M, Gehrmann S, Kambadur P, En este documento, hemos presentado la noción de un Modelo de Rosenberg DS, Mann G (2023) Bloomberggpt: Un modelo de lenguaje grande Proceso Grande (LPM) que permite la inferencia automatizada de para finanzas. CoRR abs/2303.17564. doi: https://doi.org/10.48550/ conocimientos y acciones con respecto a un proceso específico en un ARXIV.2303.17564 contexto organizacional dado basado en una colección grande y 3. Tax N, Sidorova N, Haakma R, van der Aalst WM (2016) Modelos de procesos locales mineros. J Innov Digital Ecosyst 3(2):183–196. https://doi.org/10.1016/ heterogénea de datos y conocimientos sobre muchos procesos en j.jides.2016.11.001 muchos contextos organizacionales, con el objetivo de facilitar BPM ahora y en el futuro a la luz de Machine Translated by Google KI ­ Inteligencia Artística 4. Weske M (2019) Gestión de procesos de negocio: conceptos, lenguajes, 19. Hamilton K, Nayak A, Božić B, Longo L (2022) ¿Está la IA neurosimbólica arquitecturas, 3.ª ed. Springer, Berlín. https://doi.org/ cumpliendo sus promesas en el procesamiento del lenguaje natural? Una 10.1007/978­3­662­59432­2 revisión estructurada. Web semántica. https://doi.org/10.3233/ 5. van der Aalst W (2016) Ciencia de datos en acción. Springer, Berlín. https:// SW­223228 doi.org/10.1007/978­3­662­49851­4_1 20. Dumas M, Rosa ML, Mendling J, Reijers HA (2018) Fundamentos de la gestión 6. Dumas M, Fournier F, Limonad L, Marrella A, Montali M, Rehse JR, Accorsi R, de procesos empresariales, 2.ª ed. Springer, Berlín. https://doi.org/ Calvanese D, De Giacomo G, Fahland D, Gal A, La Rosa M, Völzer H, Weber I 10.1007/978­3­662­56509­4 (2023) AI­ Sistemas aumentados de gestión de procesos de negocio: un 21. OMG (2016) Modelo y notación de gestión de casos (CMMN), versión 2.0. https:// manifiesto de investigación. ACM Trans Manag Inf Syst (TMIS) 14(1):1–19. www.omg.org/spec/CMMN/1.1 https://doi.org/10.1145/35760 22. Satyal S, Weber I, Paik H, Ciccio CD, Mendling J (2019) Mejora de procesos de 47 negocio con la metodología AB­BPM. Inf Syst 84:283–298. https://doi.org/ 7. Garcez ASD, Broda K, Gabbay DM (2002) Sistemas de aprendizaje neural­ 10.1016/j.is.2018.06.007 simbólico: fundamentos y aplicaciones. Springer, Londres 23. Yao S, Zhao J, Yu D, Du N, Shafran I, Narasimhan KR, Cao Y (2023) React: 8. Breit A, Waltersdorfer L, Ekaputra FJ, Sabou M, Ekelhart A, Iana A, Paulheim H, Sinergización del razonamiento y la actuación en modelos lingüísticos. En: La Portisch J, Revenko A, Teije AT, Van Harmelen F (2023) Combinación de undécima conferencia internacional sobre representaciones del aprendizaje, aprendizaje automático y web semántica: un estudio de mapeo sistemático. ICLR 2023, Kigali, Ruanda, del 1 al 5 de mayo de 2023. ACM Comput Surv 55(14s):313. https:// OpenReview.net http://doi.org/10.1145/

Use Quizgecko on...
Browser
Browser