L1 LPM: Una Visión para la Gestión de Procesos de Negocio en la Era de la IA Generativa (PDF)

Machine Translated by Google KI Künstliche Intelligenz https:// doi.org/10.1007/s13218024008638 DISCUSIÓN Modelos de procesos a gran escala: una visión para la gestión de procesos de negocio en la era de la IA generativa Timotheus Kampik1 ∙ Christ...

Machine Translated by Google KI Künstliche Intelligenz https:// doi.org/10.1007/s13218024008638 DISCUSIÓN Modelos de procesos a gran escala: una visión para la gestión negocio en la era de la IA generativa Timotheus Kampik1 ∙ Christian Warmuth1 ∙ Adrian Rebmann1 Kolk1 ∙ Philipp Herzig1 ∙ Gero Decker1 ∙ Han van der Aa2 weidlich6 Recibido: 31 de octubre de 2023 / Aceptado: 5 de julio de 2024 © El autor(es) 2024 Abstracto El éxito continuo de los modelos de lenguaje a gran escala (LLM, resalta las ventajas que pueden tener los grandes corpus de información sirve como prueba de los desafíos que presentan los enfoques contextualizar el potencial, así como las limitaciones de los modelo de proceso a gran escala (LPM, por sus siglas en inglés) confiabilidad de los sistemas basados en el conocimiento y los la riqueza de la experiencia en gestión de procesos que han organizaciones con diversas características, por ejemplo, en organizaciones recibir procesos específicos del contexto (personalizados) mejora. Como tal, permitiría reducir sustancialmente el tiempo obtener información más profunda, más impactante y más práctica LPM es factible, pero también destacamos las limitaciones y Palabras clave Gestión de procesos de negocio ∙ Grandes modelos 1 Introducción El éxito reciente de las arquitecturas de transformadores ha situado a los modelos de lenguaje grande (LLM) en la frontera de la investigación y las aplicaciones de la inteligencia artificial. La idea general de los LLM y otros modelos denominados de base es utilizar un gran volumen de datos no etiquetados explícitamente para el entrenamiento, para luego inferir resultados "estadísticamente plausibles" dada, como texto o imagen), dada una entrada. Están surgiendo aplicaciones prometedoras de los LLM en la industria del software empresarial; mientras que los LLM de propósito general ya pueden aumentar el trabajo de conocimiento diario, como la redacción de textos publicitarios, se entrenan modelos especializados para dominios como la ingeniería de software y las finanzas. Sin embargo, Información ampliada del autor disponible en la última página Machine Translated by Google En este artículo, proponemos modelos de procesos grandes (LPM)1 como marco conceptual central para BPM con soporte de software en la era de la IA generativa, con el objetivo general de proporcionar una discusión equilibrada y orientada a la viabilidad del impacto esperado de los modelos de base en el software BPM. Fundamentamos los LPM en el estado del arte de las dos áreas de investigación (Sección 2) para luego proporcionar una motivación para el concepto LPM desde diferentes perspectivas (Sección 3). Basándonos en la investigación existente, luego ensamblamos el LPM a partir de componentes nacientes y bien establecidos (Sección 4). Analizamos el potencial de aplicación LPM (Sección 5) y argumentamos a favor de su viabilidad técnica hasta cierto punto, al mismo tiempo que destacamos riesgos y desafíos sustanciales desde perspectivas académicas y prácticas (Sección 6). Finalmente, analizamos conceptos relacionados con los LPM, así como LPM más allá de los LLM (Sección 7), antes de concluir el artículo (Sección 8). 2 Antecedentes BPM es una disciplina profesional y un área de investigación que se ocupa de garantizar que las organizaciones funcionen como se desea y logren sus objetivos competitivos y sociales. En el contexto de BPM, el software juega un papel importante, ya que las organizaciones dependen de él no solo para la ejecución de procesos, sino también para el diseño y análisis de procesos. BPM como disciplina de investigación, aunque multidisciplinaria, a menudo se ve a través de la lente de la informática aplicada, por ejemplo, en el contexto de los enfoques fundamentales para el modelado de procesos y el análisis de procesos impulsado por datos (minería de procesos). Aquí, los lenguajes de modelado "formales", como las redes de Petri, juegan un papel el razonamiento y la toma de decisiones sobre los procesos. Tradicionalmente, BPM como campo y, en particular, el software BPM, se basan en enfoques simbólicos de la informática, muchos de los cuales se basan en la lógica y, en consecuencia, pueden considerarse una IA simbólica "de la vieja escuela". Por ejemplo, el núcleo procesos se basa en la gestión simbólica de datos y enfoques de razonamiento temporal. Con la llegada del aprendizaje profundo, la investigación de BPM ha ajustado su curso y ha aumentado la adopción de una variedad de enfoques de aprendizaje automático (ML). Como reacción a esta tendencia, la comunidad de BPM ha proporcionado una visión de BPM aumentada por IA. De acuerdo con este enfoque previsto, los métodos de IA subsimbólica no se utilizan para reemplazar el razonamiento humano o simbólico en tareas cruciales, sino más bien para respaldar las decisiones y acciones humanas y de las máquinas, por ejemplo, para facilitar el control humano con menos esfuerzo, al tiempo que se permiten garantías simbólicas sólidas. El objetivo final de 1 Los modelos de procesos grandes no deben confundirse con procesos locales (también abreviados normalmente con el acrónimo tienen como objetivo describir el comportamiento que ocurre con registro de eventos que un proceso ha generado en patrones locales Machine Translated by Google KI Inteligencia Artística (Piense en un modelo BPMN2 y una base de reglas DMN3 asociada ) que va más allá de la mera aplicación de LLM. En el procesamiento del lenguaje natural (PLN), el término LLM se refiere a modelos estadísticos del lenguaje natural que, basándose en los grandes corpus de datos de texto con los que han sido entrenados, predicen los siguientes tokens plausibles (unidades básicas de texto) dada una cadena de entrada. Inicialmente, los LLM aplicaban enfoques basados en estadísticas relativamente simples, que han sido por redes neuronales durante la década de 2010; los LLM de hoy son típicamente transformadores preentrenados generativos (GPT), que utilizan la arquitectura de red neuronal de transformador correspondiente que fue diseñada específicamente para tareas de PNL (aunque es más aplicable en general). Los predecesores de los enfoques de PNL basados en estadísticas, como los primeros LLM, fueron modelos de lenguaje formales/basados en la lógica. Estos modelos simbólicos intentan definir con precisión el metamodelo del lenguaje humano y permiten la instanciación de estos metamodelos en contextos particulares. Sin embargo, considerando la naturaleza compleja, matizada y dinámica del lenguaje humano, los modelos de lenguaje basados en lógica son insuficientes para manejar la mayoría de las tareas de NLP y ahora se supone que son principalmente aplicables junto con herramientas basadas en ML como LLM. Análogamente, BPM solía tener un fuerte enfoque simbólico impulsado por modelos, en particular en el ámbito académico, lo que se refleja en los libros de texto clásicos sobre el tema [4, 20]. El supuesto era que los modelos de procesos imperativos permiten a los expertos en negocios especificar cómo funcionan las organizaciones de una manera definida con precisión y automatizable, siguiendo un enfoque de desarrollo impulsado por modelos. En contraste, los enfoques más permisivos y declarativos para modelar procesos de negocios aún no han alcanzado la madurez general, posiblemente debido a los desafíos relacionados con la representación unificada y la facilidad de uso para crear y administrar modelos; esto se evidencia por la relativa falta de adopción del estándar CMMN,4 que al menos algunos proveedores especializados con profunda experiencia en el campo consideran un fracaso.5 Incluso en el caso de los modelos de procesos imperativos, y aunque existe un ecosistema tecnológico maduro de motores de ejecución de procesos de negocios, la implementación directa de modelos para la ejecución ha seguido siendo un enfoque de nicho para la automatizació de procesos. Una suposición de la industria es que el nivel de alfabetización tecnológica de los expertos en negocios y el esfuerzo de mantenimiento requerido para el desarrollo impulsado por modelos es tan alto que solo las organizaciones muy grandes y maduras pueden beneficiarse 2 Modelo y notación de procesos de negocio, un estándar abierto desarrollo de procesos de negocio. 3 Modelo de decisión y notación, un estándar abierto para reglas de conducta. 4 Modelo y notación de gestión de casos, un estándar abierto declarativa de procesos de negocio. 5 Cf. https://camunda.com/blog/2020/08/comocmmnnuncaalcanzó consultado el 28032024. Machine Translated by Google El conocimiento normalmente no está disponible en una forma estructurada, bien mantenida y fácil de procesar. – Los enfoques de aprendizaje profundo que requieren entrenar redes neuronales desde cero son extremadamente costosos de escalar; la capacitación para un contexto organizacional particular a menudo no es factible dado que los procesos de negocios generalmente se desvían con el tiempo y se requiere una capacitación continua. – Los enfoques de aprendizaje de refuerzo que potencialmente pueden sistematizar y automatizar parcialmente la mejora continua de los procesos de negocios dependen del conocimiento para los controles y contrapesos. El aprendizaje por acción tiene particular en escenarios donde la distribución de la utilidad generada por las recompensas es sensible al tiempo: en un contexto las malas recompensas tienden a aparecer tarde, por ejemplo, en la larga cola de instancias de proceso que finalmente no terminan como se esperaba. En consecuencia, la recopilación de conocimientos y datos de todos los procesos, organizaciones, sectores industriales y variantes de procesos en un LPM en el sentido más amplio puede permitir un avance sustancial: en lugar de confiar en un modelo específico, aunque simplista e incompleto, se utilizan todos los modelos en la medida en que sean útiles para gestionar un proceso particular (o una variante o instancia del mismo). 4 modelos de procesos grandes Para promover un punto de vista holístico sobre los fundamentos tecnológicos del software BPM en la era de la IA generativa, proponemos el concepto de un modelo de proceso grande (LPM). Un LPM se concibe como un sistema de software neurosimbólico que integra el conocimiento de gestión de procesos acumulado por expertos y datos precisos sobre cómo las organizaciones ejecutan sus procesos con enfoques de IA generativa y métodos de inferencia estadística y simbólica, fusionando así los datos de proceso y el conocimiento. Dados los datos de proceso en un registro de eventos o formato relacional,7 el LPM identifica automáticamente el dominio de un proceso específico, así como el contexto de la organización que lo ejecuta, para luego generar información y recomendaciones de acción, utilizando una colección de herramientas para el diseño, análisis, ejecución y predicción de procesos. Como contexto organizacional, los datos de proceso por sí solos son suficientes, pero se puede ingerir automáticamente información adicional, por ejemplo, en forma de modelos de proceso o documentos no estructurados, para aumentar las capacidades de LPM específicas del contexto. El conocimiento de LPM es parcialmente 7 Se pueden utilizar datos adicionales, como informes de encuestas sobre la satisfacción de clientes o empleados; aun así, asumimos que los datos tabulares tradicionales que representan rastros de ejecución de procesos forman la entrada principal para nuestras inferencias basadas en datos. Machine Translated by Google KI Inteligencia Artística Fig. 1 Una arquitectura conceptual de un LPM Conocimiento datos de proceso y conocimiento simbólico de proceso. Intuitivamente, los átomos de proceso pueden considerarse equivalentes a modelos de proceso declarativos o restricciones, cuyo descubrimiento (interactivo) a partir de registros de eventos e integración con lenguajes de modelado imperativos como BPMN ya ha sido estudiado por la comunidad científica y que puede, por ejemplo, obtenerse utilizando LLM con el propósito de detectar las llamadas anomalías semánticas [28, 29], es decir, de comportamientos que son inusuales dado el conocimiento disponible y, por lo tanto, posiblemente indeseables. Proceso de perfeccionamiento del LLM. Para perfeccionar un LLM se utilizan tanto conocimientos estructurados como información no estructurada. Cabe destacar que un LPM no es un LLM entrenado en conocimientos específicos del dominio. Para lograr eficiencia y flexibilidad, se supone que es preferible el ajuste fino y la contextualización en las indicaciones a un entrenamiento desde cero. El ajuste fino puede realizarse en múltiples dimensiones. Por ejemplo, un LLM puede ajustarse con precisión para: – gestión de procesos en general: con terminología específica y conocimientos generales sobre BPM; – un proceso vertical particular; – una región específica y sus normas y regulaciones; – una organización específica. Herramientas y su integración en BPM. Teniendo en cuenta que BPM es, en muchos aspectos, una disciplina precisa, en la que propiedades como la fiabilidad y la confianza desempeñan un papel importante, sería ingenuo suponer que un LLM puede sustituir por completo a las herramientas existentes. Por ejemplo, la documentación sobre cómo se ejecutan los procesos debe ser interpretable y gestionable de forma sistemática y, en la mayoría de los casos, las evaluaciones de rendimiento y conformidad los procesos deben ofrecer garantías "duras" y no Por tanto, un LPM debe basarse en herramientas de gestión de procesos clásicas para combinar los beneficios de los LLM con la gestión principalmente simbólica.. Machine Translated by Google significado de los indicadores clave de desempeño y otros conocimientos cuantitativos, y aprobar la implementación de cambios de procesos en los sistemas de información (empresariales). En consecuencia, la interpretación del bucle de retroalimentación debe respaldar capacidades de retroalimentación técnica adecuadas que permitan el aprendizaje de refuerzo, pero también considerar factores de interacción entre humanos y computadoras para facilitar la toma de decisiones racional. Los bucles de retroalimentación e inferencia interactivos pueden orquestarse mediante motores de flujo de trabajo livianos o arquitecturas de bucle de razonamiento; debido a su estocasticidad, asumimos que los LLM no desempeñan un papel en la orquestación. La arquitectura conceptual LPM presenta el siguiente flujo (ver también la Figura 1), ya sea para una máquina o un usuario humano que desee realizar una tarea BPM.10 1. Especificar el objetivo (BPM). El usuario especifica el objetivo desea alcanzar junto con las condiciones límite. Un objetivo de este tipo puede ser relativamente sencillo, “dame los cambios de configuración más importantes que ayuden a reducir el tiempo de ciclo en mi proceso de pedido a cobro”, o puede ser muy ambicioso, como por ejemplo “cambiar la implementación del proceso de pedido a cobro de modo que el tiempo de ciclo se reduzca sin afectar negativamente a otros indicadores clave de rendimiento que el objetivo lo especifique un usuario de máquina, active por un contexto en el que se encuentre un usuario humano, por ejemplo, desde un panel de control al que acceda un usuario humano, en el que se resuma un proceso de pedido a cobro con un tiempo de ciclo inferior al normal. 2. Consumir recomendación o acción. El objetivo especificado se convierte en un mensaje, en función del cual el LLM optimizado para el proceso produce el contenido deseado y activa consultas a otros subsistemas. Tras la respuesta a la consulta, el mensaje inicial puede refinarse aún consultas adicionales. Por ejemplo, el LPM puede buscar variantes de proceso para las que el tiempo de ciclo sea particularmente alto para luego identificar posibles causas raíz en función del análisis conocimiento textual; para esto, se requieren consultas de eventos y la evaluación de los resultados de consulta devueltos. 3. Proporcionar retroalimentación. En función de los resultados devueltos por el LPM, se proporciona retroalimentación, ya sea por un humano o por una máquina (la última de las cuales también puede ser un componente del LPM). Por ejemplo, si el motor de consulta de datos de proceso devuelve un conjunto vacío, esto puede considerarse una retroalimentación negativa en muchos contextos. La retroalimentación humana es necesaria en casos más matizados, es decir, para proporcionar un contexto de los límites de lo puramente técnico. 10 Observemos que el enfoque del LPM está en la gestión de procesos de negocio , es decir, en asegurarse de que una organización funcione de la manera deseada, y no en la ejecución de instancias de procesos particulares caso por caso. Machine Translated by Google KI Inteligencia Artística – Recomendar (cambios) modelos de procesos y consultas basados en el contexto del lenguaje natural; – Escalar conocimientos genéricos derivados de datos las organizaciones generando automáticamente plantillas a partir de consultas ejecutadas comúnmente e instándolas automáticamente en un contexto determinado. Aquí, esperamos que las nociones emergentes de modelado de procesos conversacionales y minería de procesos conversacionales, cuya viabilidad a nivel humano en el circuito está respaldada en cierta medida por resultados de investigaciones recientes [10, en una realidad y encuentren su camino hacia el software BPM de nivel de producción de manera incremental en los próximos años. 2. Mejora de la observabilidad de los procesos. Un desafío clave manejo de datos; el método clave que ejemplifica esto es la minería de procesos, que se considera ampliamente una piedra angular del análisis de procesos moderno. La minería de procesos utiliza registros de eventos que se han extraído de los sistemas empresariales como datos registros de eventos normalmente no están disponibles que generarlos como resultado de los pipelines de extracción carga (ETL) implica un esfuerzo sustancial. Incluso cuando se generan registros de eventos, solo contienen un pequeño subconjunto de los datos de proceso que existen en una organización, por ejemplo, porque no se puede acceder a todos los sistemas de TI relevantes o porque partes sustanciales del proceso se ejecutan a través de canales lo tanto, no se registran en tablas de bases de datos). lo que ocurre en el registro de eventos normalmente no porque el significado comercial de los eventos no siempre es claro, lo que aumenta el riesgo de malas interpretaciones. Desde una perspectiva industrial, resumimos estos desafíos bajo el paraguas de procesos, que se refiere, de manera algo análoga a datos en sistemas distribuidos , al grado en que un proceso es observado y comprendido correcta y completamente, dado el objetivo (comercial) en cuestión.11 Afirmamos que la observabilidad de procesos tiende a permanecer relativamente baja cuando se depende únicamente de un método de análisis, como el modelado o la minería (basada eventos). Al fusionar el conocimiento y los datos de una amplia variedad de fuentes, el LPM puede aumentar potencialmente la observabilidad de procesos. Por ejemplo, las siguientes capacidades del LPM pueden facilitar potencialmente la observabilidad de procesos: – Convertir grandes cantidades de conocimiento de procesos informales y no estructurados en modelos y consultas procesables 11 Para una introducción informal a la observabilidad de procesos, blogs.sap.com/2022/09/16/whatisbusinessprocessobservabilitya consultado el 28032023. Machine Translated by Google – Evaluar continuamente los cambios de procesos implementados y ajustarlos para lograr un rendimiento óptimo. Aun así, sostenemos que el control y la supervisión humanos siempre deben desempeñar un papel en la mejora continua del proceso, para evitar que las máquinas se queden estancadas en óptimos locales u optimicen hacia un comportamiento del El siguiente ejemplo destaca los tres beneficios potenciales de alto nivel antes mencionados de los LPM. Considere una organización de compras que recién está comenzando con la gestión de procesos comerciales y desea adoptar un enfoque basado en datos de inmediato. Los KPI a nivel de proceso, extraídos directamente de la base de datos relacional del sistema empresarial, han indicado que el proceso tiene un desempeño deficiente en términos de tiempo de ciclo; para un análisis en profundidad, aplicación de la minería de procesos. Con base en la documentación sistema no estructurada, el LPM sugiere de qué tablas extraer los datos para el proceso de compra a pago, recomendando una configuración del conector ETL que solo necesita ajustes menores (Beneficio 2). Después de que se ingieren los datos, se ejecuta un análisis de datos automatizado. El sistema ERP de la organización que ejecuta el proceso está altamente personalizado y se integra con subsistemas y servicios autoconstruidos. Por lo tanto, no existe un modelo de proceso de referencia exacto que se pueda aplicar. Basándose en una gran colección de modelos de procesos de referencia (potenciales), así como en la documentación textual específica de la organización, el LPM genera un conjunto de consultas para la comprobación de conformidad, así como para los análisis cuantitativos, los ejecuta y clasifica sus resultados y la interpretación empresarial básica por relevancia para el registro de eventos extraído (Beneficio 1). Por ejemplo, la comprobación de conformidad puede mostrar que las compras no convencionales (compras sin requisición) ocurre con frecuencia, lo que lleva a un mayor tiempo para completar el proceso y riesgos de cumplimiento para montos de órdenes de compra mayores a 10,000$. Los resultados se vinculan luego a recomendaciones de acción, basadas en conocimiento de gestión de procesos "históricos" (Beneficio 1), así como datos de compra a pago de otras organizaciones (Beneficio 2). Finalmente, las recomendaciones de acción más prometedoras se aplican a la configuración del sistema, donde primero se prueban (de manera semiautomática y cuidadosa) y luego se prueban, para finalmente descartarse o aplicarse por completo a todo el sistema de producción (Beneficio 3). En nuestro ejemplo de compra no convencional, los posibles cambios podrían ser la adición de un paso de aprobación previa para pedidos cantidades, o la aplicación “estricta” del ordenamiento todos o algunos casos que superen los montos de pedidos de compra de 10 000 $. Machine Translated by Google KI Inteligencia Artística vínculos, en particular sobre la interacción de modelos simbólicos y metamodelos autogenerados y hechos a mano, y el grado en que la importancia de los modelos imperativos disminuirá en favor de conjuntos de restricciones declarativas que se pueden adaptar y ensamblar automáticamente. para el modelado y análisis a demanda, dado el contexto actual. Considerando la prevalencia del conocimiento de procesos estructurado y no estructurado, por ejemplo, en la forma de los miles de modelos de procesos que una sola organización puede poseer y las decenas de miles de modelos de procesos que los proveedores de sistemas empresariales tienen a su disposición, esperamos que existan suficientes datos de alta calidad para “afinar” los LLM para tareas BPM genéricas y (si vale la pena el costo) específicas de la organización y para proporcionar capacidades de generación aumentadas por recuperación de alto valor. Desafíos. Dada la viabilidad a corto y mediano plazo del Paso 1, asumimos que los desafíos clave que rodean este paso son de naturaleza ingenieril. En particular, consideramos que vale la pena abordar los siguientes desafíos: (i) definir métricas de evaluación rígidas para la generación de modelos de procesos y consultas con soporte de IA generativa; (ii) especificar y evaluar formatos de intercambio de datos compatibles con LLM que sirvan como formatos de representación de "capa intermedia" entre subsistemas simbólicos y subsimbólicos; (iii) evaluar el potencial de ajustar con precisión los LLM para la generación de modelos de procesos y consultas, así como el potencial de enfoques alternativos o complementarios como la generación aumentada por recuperación. 2. Fusión de datos no estructurados y tabulares para obtener información procesable. El paso anterior establece el LPM como una ampliación del BPM, sin cambiar los fundamentos del BPM. Este paso tiene como objetivo utilizar el LPM para avanzar en la frontera de procesos de negocios, en particular hacia la simulación y la predicción. Estas capacidades han sido objeto de estudios científicos exhaustivos y a menudo utilizan enfoques de aprendizaje profundo. La detección de anomalías basada en redes neuronales puede permitir a las organizaciones inferir acciones que corrijan las anomalías identificadas, mejorando así el rendimiento del proceso de negocios a menudo utilizan el aprendizaje profundo para predecir actividades o resultados futuros, o para clasificar casos. Algunos enfoques de simulación utilizan el aprendizaje profundo para generar modelos de simulación de procesos de negocios más realistas, facilitando así las mejoras de procesos al permitir análisis contrafactuales ("qué pasaría si"). Finalmente, investigaciones recientes incluso investigan la previsión basada en datos de modelos de procesos completos. A pesar de estos importantes esfuerzos de investigación, las herramientas de simulación y predicción de procesos de negocios rara vez se aplican a gran escala en la industria y, por lo general, siguen siendo herramientas para la exploración básica y no para el análisis de alto impacto. Entre las razones de esto se encuentran los desafíos de ingeniería relacionados con la capacitación y el reentrenamiento de Machine Translated by Google variantes de proceso, basándose tanto como sea posible en propiedades y comportamientos del mundo real y utilizando simulación solo cuando sea necesario. Las pruebas de sombra se pueden utilizar entonces para limitar los candidatos de cambio que son suficientemente prometedores para las pruebas piloto. El enfoque se puede ampliar aún más para permitir la intervención humana, reduciendo así el riesgo de decisiones poco razonables de la máquina dado el contexto que está disponible para un experto humano pero no para la máquina [49, 50]. Desde una perspectiva de la industria, los enfoques propuestos son muy ambiciosos, ya que requieren una flexibilidad y agilidad sustanciales en la configuración de sistemas empresariales complejos y se basan principalmente en datos de rendimiento del proceso al tomar decisiones sobre cambios de proceso. Los modelos de base pueden permitir potencialmente la fusión de conocimientos basados en datos de ejecución con conocimiento estructurado y no estructurado, al mismo tiempo que mantienen un ciclo de retroalimentación similar al aprendizaje de refuerzo que reevalúa continuamente los conocimientos y acciones generados. Más allá de eso, los LPM también pueden ayudar a utilizar datos de (sub)procesos mal estructurados; Por ejemplo, muchos procesos de contratación se llevan a cabo principalmente en un nivel social y dejan un rastro de información textual que es difícil de analizar con enfoques tradicionales de minería de procesos; esto deja un vacío que el análisis de procesos de negocios aumentado por LLM puede potencialmente llenar. Por lo tanto, los LPM como puentes entre la toma de decisiones basada en datos, intensiva en conocimiento y social pueden permitir un salto hacia una mayor autonomía de la máquina en el nivel del ciclo de vida de BPM. Sin embargo, considerando la escasez de investigación relacionada, la viabilidad general sigue siendo una pregunta abierta, en particular cuando se considera la complejidad en el contexto de los sistemas empresariales tradicionales (tiempo entre la acción y el efecto, así como el tamaño del espacio de acción), así como los requisitos de confiabilidad y cumplimiento para cambios de procesos de alto impacto. Desafíos. Debido a que el Paso 3 requiere la fusión de la gestión y la ejecución, tanto a nivel técnico como organizacional, lo consideramos sustancialmente más desafiante que el Paso 2, que es en gran medida independiente de los sistemas de ejecución. Además, suponemos que el ajuste dinámico de los procesos a un contexto organizacional específico requerirá, en el futuro previsible, siempre un equilibrio entre la estandarización, por ejemplo, para controlar los costos y los riesgos asociados con la complejidad organizacional. En consecuencia, planteamos desafíos en forma de las siguientes preguntas: (i) ¿cómo se puede diseñar un software empresarial, más allá de los motores de ejecución de procesos, para lograr la máxima flexibilidad y modularidad en el nivel de conocimiento, de modo que los cambios deseados en un proceso o variante de proceso se puedan implementar con una mínima participación humana? (ii) ¿cómo cambian los requisitos fundamentales del software BPM orientado al análisis (por software de minería de procesos) cuando el software se convierte un componente de misión crítica de los sistemas de ejecución? (iii) Machine Translated by Google KI Inteligencia Artística La consulta o especificación de configuración de proceso puede ser técnicamente correcta e interpretable por humanos, pero requiere un esfuerzo cognitivo sustancial para entenderla; si el LPM recomienda entonces la ejecución de la consulta o especificación un usuario humano, el usuario puede activar la ejecución sin verificar cuidadosamente, sin detectar fallas que podrían haberse solo con el conocimiento humano que no se mantiene en un nivel puramente técnico. Cuanto más severa sea la consecuencia de una acción recomendada o influida por un LPM, más importante es que los expertos humanos deliberen cuidadosamente las implicaciones de la acción antes de ejecutarla o activarla. Aquí, se pueden utilizar conceptos de la psicología conductual como la arquitectura de elección que estudian cómo la toma de decisiones humana se ve influida por la información contextual, que ya han sido adoptados por el ámbito de los sistemas de información. – Los límites de la viabilidad económica de la capacitación, operación y mantenimiento de los modelos de base (y, más ampliamente, modelos básicos) son una frontera en movimiento. Es bien sabido que la capacitación de los modelos básicos, y por lo tanto también las actualizaciones completas de los modelos básicos, son muy costosas (en millones de dólares). Incluso extraer inferencias de modelos previamente entrenados puede generar costos sustanciales, que superan los costos de operación de los sistemas tradicionales de inferencia simbólica o estadística. Por lo tanto, para cada aplicación de los modelos básicos (y, en consecuencia, de los modelos básicos de aprendizaje) es crucial evaluar si los y si las tecnologías alternativas pueden lograr mejores puntajes en un cálculo de costo/beneficio. Por ejemplo, en algunos casos de uso, utilizar los modelos de procesamiento de lenguaje natural preentrenados más pequeños de las bibliotecas populares de Python para la comparación de similitud semántica puede tener más sentido que confiar en un LLM ajustado con precisión más costoso, que siempre implica un bloqueo a la arquitectura LLM específica. Un compromiso entre las dos opciones puede ser un poderoso LLM de propósito general que dependa en gran medida de la generación aumentada de recuperación, utilizando así el potencial de los sistemas basados en el conocimiento existentes. Más allá de eso, la implementación de modelos más pequeños que se entrenan en función de la retroalimentación de modelos muy grandes ha surgido como una dirección de investigación prometedora , que podría facilitar potencialmente el uso más rentable de los modelos de base. En los tres casos, los desafíos son razonablemente factibles de abordar para el Paso 1: aquí, la generación de conocimiento simbólico (es decir, modelos y consultas) se puede gestionar utilizando tecnologías de base de datos y conocimiento bien establecidas, es verificable y se puede integrar en abstracciones fáciles de usar en procedimientos relativamente sencillos y bien comprendidos. Por el contrario, tanto el Paso 2 como el Paso 3 plantean desafíos sustanciales con respecto a la gestión de modelos de ML, como un posible modelo de base basado en rastros de ejecución de procesos, Machine Translated by Google y evidencia parcial de la viabilidad de los LPM. De manera similar, vemos los trabajos de Klievtsova et al. y Grohs et al. como puntos de partida conceptuales y experimentales para los LPM para el modelado de procesos. Aquí, podemos destacar nuevamente que lo que aún falta son trabajos experimentales que brinden evidencia sólida de la efectividad de los LLM en un contexto de ejecución de procesos. 7.2 IA generativa para BPM más allá de los LLM La propuesta LPM y su analogía LLM colocan a la IA generativa basada en texto en el centro de atención. Más allá de esto, los modelos de base entrenados específicamente en rastros de ejecución de procesos pueden ser utilizados por el LPM para predicción y simulación. Obviamente, otras modalidades como imagen, video y sonido también son relevantes. Por ejemplo, los modelos de proceso a menudo se crean como parte de presentaciones de diapositivas notorias, lo que dificulta la gestión de los modelos y su uso para el análisis de datos. Para facilitar la transición de imágenes a representaciones de modelos de proceso formales, una investigación reciente introduce un enfoque basado en el aprendizaje profundo para convertir imágenes de flujo de proceso en BPMN compatible con estándares (basados en XML). En este contexto, uno podría imaginar que la IA generativa se puede aplicar, si no como procesadores de imágenes, entonces como posprocesadores de la salida XML. Además, los modelos de IA generativa podrían potencialmente para generar automáticamente información, como modelos y consultas de bases de datos, a partir de grandes cantidades de datos de audio recopilados, como entrevistas a expertos o conversaciones con clientes. Sin embargo, en este caso tampoco está claro si es mejor procesar directamente la modalidad adicional mediante un modelo de base; el preprocesamiento con un procesador de voz a texto estándar puede ser más factible y más fácil de implementar. En conclusión, cabe señalar que nuestra visión de LPM se principalmente en relación con el estado actual de BPM y los procesos de negocio, considerando el debate en curso sobre cómo se puede aplicar la IA generativa en general en los procesos de negocio. Sin embargo, sigue siendo incierto cómo, o incluso si, la IA generativa generará cambios fundamentales en las prácticas de BPM o en los procesos de negocio que requieren cambios fundamentales en los enfoques de BPM, como el ciclo de vida de BPM, desde una perspectiva de gestión. 8 Conclusión En este documento, hemos presentado la noción de un Modelo de Proceso Grande (LPM) que permite la inferencia automatizada de conocimientos y acciones con respecto a un proceso específico en un contexto organizacional dado basado en una colección grande y heterogénea de datos y conocimientos sobre muchos procesos en muchos contextos organizacionales, con el objetivo de facilitar y en el futuro a la luz de Machine Translated by Google KI Inteligencia Artística 4. Weske M (2019) Gestión de procesos de negocio: conceptos, lenguajes, arquitecturas, 3.ª ed. Springer, Berlín. https://doi.org/ 10.1007/9783662594322 5. van der Aalst W (2016) Ciencia de datos en acción. Springer, doi.org/10.1007/9783662498514_1 6. Dumas M, Fournier F, Limonad L, Marrella A, Montali M, Rehse JR, Accorsi R, Calvanese D, De Giacomo G, Fahland D, Gal A, La Rosa M, Völzer H, Weber I (2023) AI Sistemas aumentados de gestión de procesos de negocio: un manifiesto de investigación. ACM Trans Manag Inf Syst (TMIS) 14(1):1–19. https://doi.org/10.1145/35760 47 7. Garcez ASD, Broda K, Gabbay DM (2002) Sistemas de aprendizaje neural simbólico: fundamentos y aplicaciones. Springer, Londres 8. Breit A, Waltersdorfer L, Ekaputra FJ, Sabou M, Ekelhart Portisch J, Revenko A, Teije AT, Van Harmelen F (2023) Combinación de aprendizaje automático y web semántica: un estudio de mapeo sistemático. ACM Comput Surv 55(14s):313. https:// http://doi.org/10.1145/ de procesos de ∙ Ron Agam1 ∙ Lukas N. P. Egger1 ∙ Andreas Gerber1 ∙ Johannes Hofart1 ∙ Jonas ∙ Artem Polyvyanyy3 ∙ Stefanie Rinderle Ma4 ∙ Ingo Weber4,5 ∙ Matthias por sus siglas en inglés) y otros enfoques de inteligencia artificial generativa sobre los modelos simbólicos definidos de manera rígida, pero también puramente estadísticos en términos de seguridad y confiabilidad. Como marco para LLM y otras tecnologías basadas en modelos básicos, proponemos el concepto de un que combina el poder de correlación de los LLM con la precisión analítica y la enfoques de razonamiento automatizado. Se prevé que los LPM utilicen directamente acumulado los expertos, así como los datos de desempeño de procesos de cuanto a tamaño, región o industria. En esta visión, el LPM propuesto permitiría a las y otros modelos comerciales, análisis profundos y recomendaciones de y el esfuerzo necesarios para la transformación empresarial, al tiempo que permitiría que la que era posible anteriormente. Sostenemos que la implementación de un los desafíos de investigación que deben resolverse para implementar aspectos particulares de la visión de lenguaje ∙ Inteligencia artificial generativa Los LLM son herramientas basadas en estadísticas que reutilizan grandes corpus de texto generado por humanos y a menudo mal curados; su comportamiento es impredecible, a veces no deseable y con frecuencia ilógico. Esto limita la aplicabilidad de los LLM (simples) en muchos contextos comerciales. En particular, en la gestión de procesos comerciales (BPM) y la inteligencia de procesos, donde las decisiones tienen implicaciones críticas para las operaciones (en una modalidad comerciales, el poder de correlación crudo y asombroso del aprendizaje profundo es insuficiente como facilitador independiente de inteligencia confiable, confiable y procesable. Para facilitar la inteligencia con las propiedades mencionadas anteriormente, se requiere una integración de los LLM (o, más ampliamente, enfoques basados en modelos de base) con la gestión de datos simbólicos (como los gráficos de a medida que conocimiento) los LLM y métodos de razonamiento automatizado. del artículo. Volumen:(0123456789) KI Inteligencia Artística La BPM aumentada con IA está haciendo que los procesos de negocios sean “adaptables, proactivos, explicables y sensibles al contexto”. Sus dos elementos clave, el control humano y la integración de lo simbólico (basado en la lógica/razonamiento) y lo subsimbólico (estadísticas/ Los enfoques de IA basados en el aprendizaje automático son direcciones de investigación bien establecidas en la comunidad de IA: la fusión de IA simbólica y subsimbólica es bien conocida desde principios del siglo XX como IA neurosimbólica y actualmente está resurgiendo, por ejemplo en el contexto de los gráficos de conocimiento y la Web Semántica. de los Recientemente, el auge de la denominada IA generativa, posibilitada principalmente por la arquitectura de red neuronal de transformadores , ha alimentado nuevas expectativas con respecto al potencial de aplicación de la inteligencia artificial, sobre todo en contextos empresariales y de BPM. Lo más destacado es que los productos de software como ChatGPT permiten a los usuarios entablar diálogos con sistemas basados en LLM que luego producen contenido estadísticamente plausible dada la solicitud de un usuario, en función de los grandes corpus de contenido con los que se han entrenado los sistemas. Existe un interés sustancial en relación con la IA generativa en la investigación de BPM, así como en la industria. Por ejemplo, una investigación reciente proporciona los primeros conocimientos sobre el potencial que tiene la IA generativa para la minería de procesos (en particular: generación de consultas y respuesta directa a preguntas basadas en registros de eventos ). Además, las líneas de investigación emergentes exploran la creación de modelos de procesos (generación de modelos de procesos y extracción de listas de tareas a partir de texto ), así como modelos conceptuales relacionados, como los modelos de lenguaje de modelado unificado (UML) [11, 13], y se han introducido propuestas académicas para la ingeniería rápida para BPM y el modelado empresarial crucial para facilitar [14, 15]. Lo que falta hasta ahora es una visión general holística de cómo la IA generativa puede facilitar BPM de manera más amplia, y cómo se puede desarrollar una perspectiva sistemática sobre la interacción con las tecnologías existentes. de la minería de 3 Motivación El concepto de un modelo de proceso grande puede motivarse desde una doble perspectiva. Intuitivamente, el creciente interés en los LLM en una amplia gama de dominios exige su posicionamiento holístico en el contexto de BPM. Considerando la prevalencia de los modelos de proceso como herramientas para el análisis de procesos, así como artefactos de ejecución, el término modelo de proceso grande puede referirse a la aplicación de los LLM para producir modelos de procesos en el sentido más amplio. Sin embargo, más allá de esta analogía simplista, vemos el “modelo de proceso grande” más literalmente como una alternativa a los modelos de proceso pequeños, cableados y específicos que se utilizan hoy en día. los modelos de LPM ), que frecuencia en un algo pequeños. En algunos casos, el software estándar o el desarrollo personalizado tradicional siguen siendo más viables. Por lo tanto, al igual que en el caso del lenguaje natural, el sueño de un modelo simbólico perfecto sigue siendo una ambición que rara vez se logra. Los dos ejemplos siguientes resaltan este problema y ejemplifican dos escenarios de BPM muy diferentes (procesos altamente personalizados y en gran medida estandarizados). reemplazados Capacidades de verificación de cumplimiento de procesos para el ámbito financiero. Las grandes instituciones financieras suelen querer tener el control total de la especificación y ejecución de sus procesos de negocio y, por lo tanto, aplican conjuntos de desarrollo basados en modelos con motores de ejecución de reglas y procesos de negocio de código abierto o de creación propia, utilizando notaciones de modelado como BPMN y DMN.6 Un caso de uso clave dentro del ámbito es garantizar el cumplimiento normativo y, al mismo tiempo, maximizar la agilidad empresarial. Sin embargo, las bases de modelos y reglas necesarias para ejecutar las comprobaciones correspondientes e integrarlas en las operaciones centrales de la empresa son muy grandes y el esfuerzo de mantenimiento es inmenso. Los modelos y reglas simbólicos, incluso si son correctos desde una perspectiva “lógica” (nivel de objeto), tienden a estar desactualizados, ser inconsistentes o estar modelados incorrectamente desde una perspectiva de dominio (nivel meta). Por lo tanto, se requiere un esfuerzo humano sustancial, así como una experiencia muy particular en la intersección de la tecnología y el dominio empresarial específico, para el mantenimiento y la mejora continua. Capacidades genéricas de procesos de compra a pago. Los proveedores de software empresarial escalan las capacidades genéricas de procesos de compra a pago (adquisiciones) en miles de organizaciones utilizando software estándar. Cambiar y personalizar el software suele requerir mucho esfuerzo e introduce riesgos de errores no deseados. efectos secundarios que deben mitigarse. Por lo tanto, el grado de personalización debe ser un equilibrio cuidadosamente deliberado. Tomar la decisión correcta sobre la escala y la dirección de la personalización requiere excavar en silos de datos y conocimiento; los datos disponibles generalmente cuentan solo una parte de la historia, y el conocimiento más útil generalmente está distribuido en diferentes fuentes, es difícil de encontrar y no está disponible en un formato interpretable por máquinas. n Al mismo tiempo, la utilización de enfoques tradicionales basados en estadísticas y ML (métodos distintos de GPT) en un contexto de BPM plantea desafíos sustanciales, en particular debido a las siguientes de él, y por lo general cuestiones clave: – BPM requiere mucho conocimiento y los enfoques de inferencia estadística clásica tienen dificultades para utilizar el conocimiento para la modificación organizacional, en particular considerando que este modelar negocios. para la especificación 6 Cabe destacar que un conocido banco de Wallstreet mantiene su propio motor DMN: supotencial/, https://github.com/goldmansachs/jdmn (consultado el 28 de marzo de 2003). 2023). KI Inteligencia Artística codificados en un LLM y parcialmente gestionados como átomos de proceso simbólicos, que son modelos y plantillas de consulta generados por un conjunto de técnicas de aprendizaje profundo y algoritmos de propósito especial. Dependiendo de la tarea de BPM en cuestión, el LPM se instancia a partir del marco general presentado. La implementación de las tareas no está necesariamente codificada, pero se puede abordar de manera más flexible utilizando enfoques basados en agentes, es decir, bucles de razonamiento que han estado en el centro de la investigación de IA durante décadas y ahora se aplican en cierta medida en el contexto de los LLM [23, 24].8 un costo, en El LPM consta de los siguientes componentes clave (Fig. 1). de BPM, Datos de proceso y fuentes de conocimiento. Los datos de proceso y el conocimiento se proporcionan para entrenar modelos de ML, alimentar algoritmos simbólicos y servir directamente a los humanos. Desde el punto de vista tecnológico, el conocimiento estructurado se conserva en gráficos de conocimiento (o se gestiona utilizando otras tecnologías basadas en el conocimiento) y, en el caso de las incrustaciones de lenguaje, en almacenes de vectores; los datos no estructurados suelen estar disponibles en una multitud de formatos, mientras que los datos tabulares están disponibles en bases de datos relacionales tradicionales. Tenga en cuenta que aquí, no pretendemos utilizar gráficos de conocimiento para la representación de datos de eventos, a diferencia de los enfoques recientes de minería de procesos , principalmente debido a preocupaciones de escalabilidad; en cambio, el término gráfico de conocimiento puede entenderse como un pars pro toto para las tecnologías semánticas que conservan el conocimiento del modelo de proceso. Conceptualmente, podemos dividir las fuentes de datos y conocimiento en conocimiento genérico sobre un proceso o su dominio de aplicación (vertical de la industria), conocimiento específico del cliente y del contexto, y datos de ejecución. Aquí, el conocimiento se suele extraer de los datos de forma continua, por ejemplo, en el caso de los puntos de referencia. Para utilizar el contenido de fuentes de conocimiento heterogéneas, la propuesta LPM presenta la noción de una capa de átomos de proceso: los átomos de proceso son hechos sobre un proceso (o relaciones entre hechos) que son atómicos en el sentido de que no se pueden dividir en partes más pequeñas sin perder su significado comercial. Por ejemplo, al comprobar la infracción de la regla “solo si el importe del pedido supera los 1000 $ se produce una aprobación”, la implicación lógica se puede dividir en proposiciones “más pequeñas”, pero tiene poco sentido hacerlo desde la perspectiva de un usuario comercial. Dividir el conocimiento del proceso en átomos de proceso y extraer átomos de proceso de información o datos no estructurados cierra la brecha entre el enfoque en lenguaje natural de los LLM y la necesidad de representaciones que sean ejecutables, en particular como consultas en tablas. 8 Observemos aquí que la forma en que se utiliza la noción de “agente” en el contexto de los LLM está sujeta a debate comunitario y que muchas de las propuestas y prototipos de sistemas de agentes nacientes aún no hacen uso de las capacidades integrales de planificación, razonamiento y aprendizaje (de refuerzo) que se han ideado en las últimas décadas. Datos de proceso y fuentes de conocimiento Contexto del proceso/cliente Información, KPI, datos en vivo, y experiencia del proceso Datos de la experiencia Capa de átomo de proceso Retroalimentación con control humano Predicción de procesos Consulta de proceso Motores Motores (Clásico y Modelos de datación Conocimiento de procesos curados Contextualización en tiempo de ejecución LLM de propósito general (Modelo de Fundación) Proceso herramientas y algoritmos BPM clásicos, en particular para modelado, análisis y ejecución de procesos, mientras que las capacidades predictivas pueden ser proporcionadas por modelos basados en estadísticas (ver más abajo). Contextualización en tiempo de ejecución. La columna vertebral de las herramientas mencionadas anteriormente está formada por los motores de consulta de datos y conocimiento de procesos. Estos motores proporcionan la "tubería" básica para BPM de nivel empresarial, como capacidades de gestión de control de acceso, así como interfaces para usuarios humanos. En consecuencia, es necesario proporcionar y ampliar la infraestructura para el conocimiento de procesos y la consulta de datos de procesos para que funcione en interacción con inferencias basadas en LLM. Por ejemplo, un LLM podría generar hipótesis plausibles sobre un proceso basándose en sus datos de ejecución, y estas hipótesis pueden luego probarse de manera rigurosa utilizando algoritmos tradicionales de inferencia simbólica y estadística.9 Para el análisis predictivo y la simulación, se utiliza una colección de modelos de ML. Aquí, se pueden utilizar los mejores modelos de su clase para una tarea o conjuntos determinados. Dado el éxito de los modelos básicos en el dominio del procesamiento del lenguaje natural, los modelos básicos entrenados en rastros de ejecución de procesos comerciales pueden ser una ampliación prometedora de los modelos de ML más tradicionales. Mecanismo de retroalimentación inherente con control humano. Para garantizar que las inferencias extraídas por el LPM sean realmente útiles, se proponen mecanismos de retroalimentación con el control humano. La retroalimentación puede ser proporcionada completamente por máquinas, por ejemplo, determinando automáticamente, en función de la heurística, si una consulta generada y ejecutada produce resultados relevantes. Sin embargo, en muchos casos, se puede esperar que el árbitro final sea un humano, que debe participar en el diseño de modelos de procesos, la interpretación de los datos de negocios y la evaluación de los resultados. de conjeturas aproximadas. 9 En general, la fusión de LLM y enfoques basados en el conocimiento como se de datos describe aquí a menudo se conoce como generación aumentada por recuperación KI Inteligencia Artística sistema cal. La retroalimentación humana podría evaluar algunas recomendaciones de acción como particularmente útiles, mientras que otras podrían marcarse como falsos positivos. Por ejemplo, en el contexto de un sistema de recomendación de cambio de proceso, un experto humano puede tener una mejor visión general de los efectos sociales, los riesgos y los costos del cambio organizacional y evaluar algunas recomendaciones como no viables, porque es poco probable que afecten un cambio significativo del proceso o porque llevarlas a cabo es demasiado riesgoso o demasiado costoso. La retroalimentación puede entonces usarse para ajustar el LLM, generar datos etiquetados y entrenar sistemas de recomendación más clásicos que utilizan enfoques basados en aprendizaje de refuerzo, como las de usuario iterativo máquinas tragamonedas contextuales , para mejorar continuamente el LPM. de BPM que 5 formas en las que los LPM pueden facilitar el BPM como por ejemplo A continuación, presentamos un esquema de cómo los LPM pueden facilitar la BPM. Señalamos resultados de investigación específicos que brindan contexto adicional y evidencia preliminar o parcial de viabilidad potencial para luego brindar un análisis más matizado de la viabilidad en la Sección 6. (KPI)”. En caso de esperamos que se 1. Reducción del esfuerzo y la experiencia necesarios para las tareas de BPM basadas en el conocimiento. La gestión de procesos de negocio es un trabajo que requiere un gran conocimiento, tanto de una profunda experiencia con respecto a herramientas y conjuntos de habilidades específicos, como notaciones de modelado de procesos y lenguajes de consulta de datos de procesos, como de un buen acceso y comprensión del conocimiento y los datos que existen sobre un proceso en particular, normalmente en un más o pueden generarse contexto organizacional altamente complejo. Por lo tanto, los expertos humanos en BPM (individuos o equipos) deben tener un alto nivel de habilidades técnicas y socioprofesionales, así como una experiencia de correlación y el sustancial dentro de una organización en particular: la barrera de entrada repetidas del registro para ejecutar con éxito una iniciativa de BPM es alta. Los LPM pueden reducir esta barrera de entrada (i) facilitando la búsqueda y presentación automática de información en el contexto en el que es útil y relevante; (ii) convertir información no estructurada y semiestructurada en modelos y consultas, lo que requiere un conocimiento menos detallado y formal de los lenguajes para el diseño y análisis de procesos; (iii) enriquecer y ampliar la información contextual del proceso en base a hechos inferidos lógicamente o estadísticamente plausibles. En el contexto de este objetivo más amplio, imaginamos, por ejemplo, las siguientes capacidades específicas de LPM: que no existe dentro – Convertir texto en lenguaje natural en modelos de procesos y consultas (de modelos de procesos y datos); – Mejorar los modelos de procesos y consultas basados en retroalimentación en lenguaje natural; mediante la creación de un canal que busque sistemáticamente en los silos de conocimiento organizacional12; en este caso, se pueden de procesos en todas emplear los enfoques existentes para el descubrimiento interactivo de procesos que utilizan el conocimiento del dominio [35, 36], donde el conocimiento del dominio se obtiene (parcialmente) utilizando LLM. – Utilizar información en lenguaje natural para descubrir fuentes de datos en grandes paisajes de sistemas de información y recomendar scripts/ consultas ETL para extraer datos relevantes, avanzando y aplicando la investigación existente sobre PNL para ETL ; 12, 32], se conviertan – Permitir la previsión y el análisis basados en datos basados en modelos fundamentales, evitando el entrenamiento de modelos específicos para los procesos de una organización específica. en BPM es el 3. Convergencia del diseño, la ejecución y el análisis de procesos. Por último, el LPM puede ayudar a las organizaciones a avanzar hacia una mejora de procesos verdaderamente continua y automatizada, en la que convergen el de entrada; estos diseño, la ejecución y el análisis de procesos. La idea de la mejora autónoma fácilmente y se sabe de los procesos de negocio ya se ha estudiado en profundidad en el contexto transformación de los motores de ejecución de procesos de negocio, que se complementan con capacidades de aprendizaje de refuerzo que, con el tiempo, aprenden la mejor variante de proceso para un contexto determinado. Esto pone de relieve la practicidad de la idea general, aunque en una configuración de ingeniería que se asemeja a un desarrollo inmaculado basado en modelos informales (y, por que normalmente no se puede lograr en el contexto de las implementaciones Además, interpretar y los despliegues de BPM de la vida real. En realidad, los modelos de es trivial, por ejemplo, procesos normalmente no se implementan con el clic de un botón; en cambio, se deben ejecutar flujos de trabajo de configuración complejos e intensivos en conocimiento para finalmente activar una actualización. de la observabilidad la observabilidad de En términos más generales, el desafío de convertir los resultados del análisis de procesos en acciones específicas que cambien el funcionamiento de un proceso está surgiendo como un desafío clave en la investigación así como en la práctica. Al hacer que el conocimiento esté fácilmente disponible en registros de en un contexto determinado, el LPM puede hacer que estos flujos de configuración frágiles y que requieren mucho trabajo humano sean más ágiles y resilientes. Además, si se materializan, mejores capacidades de simulación y predicción pueden reducir sustancialmente el riesgo de implementar cambios en el proceso. Aquí, imaginamos las siguientes capacidades de LPM, en el espíritu de BPM aumentado con IA (por ejemplo): – Relacionar los conocimientos adquiridos a partir del análisis de procesos con las posibles acciones y sus supuestas consecuencias; – Fusionar datos y conocimientos para evaluar de forma integral las implicaciones y los riesgos de determinadas acciones de cambio de procesos; consulte: https:// 12 ndwhydoesitmatter/, Esto se relaciona con el objetivo general anterior, pero imaginemos un objetivo más amplio. escala, así como un enfoque más sistemático. KI Inteligencia Artística 6 Viabilidad y desafíos Prevemos que las LPM surgirán de manera iterativa, lo que ayudará a garantizar que las capacidades proporcionadas cumplan con las expectativas de ética, calidad y cumplimiento. A continuación, ofrecemos un esquema de tres pasos de cómo las LPM pueden potencialmente evolucionar y madurar. proceso claramenteComenzamos indeseable. con capacidades que consideramos generalmente factibles dado el estado del arte (Paso 1) y luego avanzamos, a través de capacidades que plantean desafíos sustanciales cuyas soluciones aún están en ciernes (Paso 2), hacia una visión de “cielo azul” que se centra más en lo que es intuitivamente deseable que en lo que es factible (Paso 3). En cada paso, argumentamos, con base en la literatura científica, la viabilidad de las capacidades o la falta de ellas y destacamos algunos de los desafíos de investigación que vemos.13 se requiere la del 1. Ampliar el modelado y el análisis con conocimiento contextualizado. El primer paso hacia la visión LPM es la utilización del conocimiento de los procesos de negocio que de otro modo no sería posible encontrar o no se podría utilizar. estructurado de una manera que permite un análisis parcialmente automatizado con el ser humano en el circuito. Aquí, las dos capacidades principales son el modelado y la minería de procesos aumentados por LLM. Incluso antes de la aparición de LLM y modelos de base, una línea de investigación sustancial se ha centrado en la extracción de modelos de procesos de información no estructurada y, en particular, texto [12, 3941] y, a la inversa, en convertir modelos de procesos simbólicos en artefactos basados en lenguaje natural. Estos modelos pueden ser imperativos, como los modelos BPMN clásicos, o declarativos, como consultas basadas en restricciones que se ejecutan en un registro de eventos, por ejemplo, para fines de verificación de conformidad. Además, varios trabajos han comenzado a explotar grandes colecciones de modelos de procesos con el objetivo de capturar una comprensión general de cómo se deben modelar u operar los procesos, con el objetivo de detectar instancias de proceso desviadas [28, 29] y proporcionar sugerencias de modelado de procesos. Se y modelos de procesos espera que, con el uso de los LLM, los enfoques para facilitar la generación y el mantenimiento de conocimientos, convertir el conocimiento no estructurado en especificaciones y consultas ejecutables y adaptar estas especificaciones y consultas a un contexto de proceso particular resulten más eficaces y fáciles de implementar. Por lo tanto, la aplicación de los LLM con este fin puede considerarse factible y se espera que tenga un impacto sustancial en el software BPM en el futuro cercano. de grandes de actividades para También esperamos que los próximos años de investigación y desarrollo respondan a muchas preguntas abiertas y matizadas sobre las capacidades de análisis y modelado aumentadas con LPM. 13 Obviamente, la lista de desafíos de investigación no es exhaustiva, es decir, puede servir como un punto de partida para una opinión. modelos específicos (es decir, específicos de la organización y del proceso) a escala, la falta de contexto holístico en la mayoría de los registros de eventos, el dinamismo de los entornos comerciales y, en el caso de enfoques híbridos como la generación de modelos de procesos con aprendizaje profundo, la incapacidad de los modelos de procesos simbólicos tradicionales para capturar matices socioorganizacionales. El uso de modelos de base puede potencialmente abordar el problema de la falta de conocimiento contextual al extraer este conocimiento de fuentes no estructuradas o difíciles de buscar, y proporcionar alternativas a la simulación y predicción basadas en un entrenamiento supervisado altamente específico, al entrenar en cambio modelos de base en rastros de ejecución de procesos que pueden ser capaces de generalizar la simulación y la predicción en todo el contexto de procesos y organizaciones (hasta cierto punto). Sin embargo, debido a la falta de investigación que evalúe sistemáticamente el potencial de la IA generativa y los modelos de base en las direcciones mencionadas anteriormente, la viabilidad sigue siendo una pregunta abierta. Desafíos. Nuestra evaluación es que el Paso 2 requiere el establecimiento de bases que ya existen de manera análoga al Paso 1 o que requieren un cambio de paradigma para facilitar la fusión de información no estructurada y datos tabulares para la generación de información. Más específicamente, solicitamos: (i) establecer las bases conceptuales de la minería de procesos conversacional, así como de nuevos paradigmas de simulación de procesos más aplicables; (ii) diseñar e implementar enfoques para obtener hipótesis serializables sobre datos tabulares a partir de información no estructurada y conocimiento informal; (iii) diseñar, implementar y evaluar algoritmos que permitan la evaluación de la hipótesis antes mencionada de manera escalable. del análisis 3. Automatizar la mejora continua con el control humano. Como objetivo final a largo plazo, los LPM pueden permitir la automatización del ciclo de vida de BPM. Es decir, el ciclo continuo de diseño, ejecución, análisis y mejora de procesos, con participación humana únicamente para permitir el control social total de la toma de decisiones clave. La cuestión de. Además, los enfoques de monitoreo predictivo para procesos si esto es posible, en absoluto o en cierta medida, sigue abierta. La investigación sobre la automatización (total) de todo el ciclo de vida de BPM es escasa. Una línea de trabajo notable ha propuesto y evaluado el uso de los principios y prácticas de Operaciones de Desarrollador (DevOps) junto con el aprendizaje de refuerzo para este fin. Aquí, se propone el uso de bandidos multiarmados contextuales para enrutar instancias de proceso a la mejor variante de proceso posible (configuración) dado el contexto de caso particular. Con el tiempo, se espera que el comportamiento de enrutamiento contextual converja, lo que puede desencadenar un cambio de proceso final de manera análoga a un cambio basado en una prueba A/B clásica. El enfoque se puede extender para incluir las llamadas pruebas de sombra que enrutan los casos, en paralelo a su ejecución real, a personal altamente calificado. través de pruebas hipotéticas. KI Inteligencia Artística ¿Cómo se pueden definir las barreras de protección para los sistemas de ejecución de procesos (en cierta medida) autónomos y garantizar su cumplimiento, de modo que las compensaciones entre estandarización y optimización personalizada se puedan trasladar de la primera a la segunda? Los desafíos de viabilidad que son ortogonales a los tres pasos anteriores se relacionan con la gestión de datos, la confiabilidad y el cumplimiento, y la interacción de la toma de decisiones humana y de las máquinas: – El LPM consume datos de una amplia gama de fuentes y los procesa de diversas maneras para que los humanos y las máquinas puedan usarlos de manera eficiente en el ciclo de vida del BPM. La integración con fuentes de datos externas y la gestión de los datos ingeridos y generados es un desafío clave, en particular porque los datos y el conocimiento generados por el LLM pueden ser de calidad cuestionable y requerir una curación sustancial, ya sea por parte de máquinas más confiables o de humanos. Por lo tanto, un riesgo de la propuesta LPM y de implementaciones similares de IA generativa es que los problemas bien conocidos relacionados con la gestión de datos y BPM (posiblemente más pronunciados en el contexto de los pipelines ETL en la minería de procesos ) se exacerbarán aún más, requiriendo así innovación en el subcampo de los métodos de consulta de procesos. Los desafíos de gestión de datos antes mencionados son generalmente bien conocidos en la investigación de IA aplicada y han llevado al surgimiento de la IA centrada en los datos , un paradigma de ingeniería que se centra en la gestión de datos y los pipelines de datos como fundamentos clave de las aplicaciones basadas en ML. – Los LLM son frecuentemente criticados por la falta de confiabilidad de los resultados que producen y han sido descritos por expertos como loros estocásticos y generadores de basura. 14 generadores. Por lo tanto, es crucial que los conocimientos y las acciones inferidos por los LLM y otros modelos de aprendizaje profundo se evalúen automáticamente en cuanto a su fiabilidad y sus implicaciones comerciales y sociales, como la equidad. Más allá de eso, una cuestión clave es que la ingestión de más contenido aumentará el riesgo ético y de cumplimiento de la fuga de información personal, un problema que recientemente ha suscitado un interés sustancial en la investigación en el contexto de la minería de procesos [56, 57]. Los posibles problemas éticos y de privacidad van de la mano con los requisitos para garantizar el cumplimiento legal, que tradicionalmente es un desafío que BPM tiene como objetivo abordar y no exacerbar. – Incluso si las inferencias extraídas por el LPM (o: un LLM subyacente) son técnicamente verificables, aún pueden plantear desafíos para la toma de decisiones humana. Por ejemplo, un ejemplo, el en 14 Ver: https://www.aisnakeoil.com/p/chatgptisabullshitgenerator pero, Técnicamente, una tontería es una afirmación que emite un agente con indiferencia hacia la verdad de la afirmación. así como respecto a la variabilidad de resultados tales como predicciones y recomendaciones de acción. a 7 Discusión identificado Esta sección relaciona la propuesta con otras visiones y visiones generales de la IA generativa y BPM y analiza brevemente BPM y la IA generativa para modalidades distintas al texto. 7.1 Conceptos relacionados Teniendo en cuenta el revuelo actual en torno a los LLM y la IA generativa, surgen a un ritmo acelerado propuestas conceptuales e implementaciones para el uso específico de los LLM en el dominio. Un ejemplo destacado es el desarrollo de BloombergGPT, un LLM de propósito especial entrenado específicamente para el dominio financiero de los. Como era de esperar, también han surgido las primeras propuestas integrales para fusionar BPM y LLM. En particular, Vidgof et al. presentan una visión y una agenda de investigación para los LLM y BPM ; su trabajo está principalmente alineado con el ciclo de vida de BPM, es decir, afirmamos que proporciona una visión de gestión de los LLM para BPM, mientras que nuestra perspectiva está orientada a la viabilidad. Beheshti et al. proponen Process GPT , un enfoque basado en transformadores para recomendar las próximas acciones en procesos intensivos en conocimiento costos superan los beneficios. durante la ejecución.15 De manera análoga a BloombergGPT, ProcessGPT se concibe como un GPT de propósito especial, entrenado desde cero con datos específicos del dominio. Por lo tanto, la diferencia con nuestra propuesta LPM es doble: (i) nuestro alcance es más amplio, abarcando todo el ciclo de vida de BPM y (ii) no proponemos principalmente entrenar un GPT desde cero, bajo el supuesto de que los costos superan los beneficios y que el ajuste fino y la contextualización basada en indicaciones son mejores medios para alcanzar el mismo objetivo en el contexto de grandes modelos de lenguaje. Si bien el entrenamiento de modelos básicos sobre datos de procesos para fines de predicción y simulación contrafactual es parte de la agenda de investigación de LPM, la viabilidad general de los LPM como un enfoque más amplio no depende de la viabilidad de esta capacidad potencial particular. Centrándose en el análisis de datos de procesos, Berti y Qafari proponen enfoques para utilizar modelos básicos de minería de procesos listos para usar, en particular para responder directamente a las consultas de los usuarios y para generar consultas simbólicas sobre datos de procesos. Las propuestas están respaldadas por experimentos preliminares, que brindan evidencia de viabilidad. Dado el alcance (más pequeño) del artículo de Berti y Qafari, consideramos el enfoque propuesto en su trabajo como un subconjunto de las capacidades que los LPM pueden ofrecer, proporcionando primero 15 Tenga en cuenta que consideramos que uno de los casos de uso propuestos (calificación automatizada de exámenes y detección de plagio) es altamente cuestionable desde perspectivas éticas y de viabilidad. KI Inteligencia Artística Avances en IA generativa. Si bien nuestro LPM utiliza un LLM (basado en un modelo de base) y potencialmente modelos de base específicos de datos de ejecución de procesos, vemos el LPM como una fusión de IA generativa y enfoques simbólicos y estadísticos tradicionales para automatizar el razonamiento y la toma de decisiones en BPM. Evaluamos la aplicación de LLM de propósito general ajustados a procesos como contextualizadores, generadores y aumentadores de modelos simbólicos y consultas como factible y como facilitadores sustanciales de BPM. Aquí, esperamos un impacto sustancial en la industria durante los próximos años. Más allá de eso, vemos el uso de modelos de base de propósito especial para BPM, en particular basados en rastros de ejecución de procesos, como una frontera de investigación prometedora pero demasiado incipiente para justificar predicciones de implementaciones industriales a gran escala. Además, la aplicación de IA generativa para automatizar partes más grandes del ciclo de vida de BPM también es potencialmente interesante, pero plantea desafíos de viabilidad sustanciales y riesgos comerciales/sociales que requieren una investigación y validación exhaustivas antes de que una implementación potencial sea viable. Agradecimientos Los autores desean agradecer a los numerosos colegas del ámbito académico y de la industria que trabajan en la aplicación de los LLM y la IA generativa y cuyo trabajo ha influido en la perspectiva proporcionada en este documento. directamente Declaraciones aplicarse Conflicto de intereses Todos los autores con afiliación no académica trabajan para una empresa que desarrolla software de gestión de procesos de negocios. Acceso abierto Este artículo está licenciado bajo una Licencia Creative Commons Atribución 4.0 Internacional, que permite el uso, intercambio, adaptación, distribución (sonido) y reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor original y a la fuente, se proporcione un enlace a la licencia Creative Commons y se indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el presenta material no está incluido en la licencia Creative Commons del artículo y el uso que pretende darle no está permitido por la regulación legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. Referencias 1. Nguyen N, Nadi S (2022) Una evaluación empírica de las sugerencias de código de Github Copilot. En: Actas de la 19.ª Conferencia Internacional sobre Minería de Repositorios de Software, MSR '22, págs. 1–5. Asociación para Maquinaria Informática, Nueva York, NY, EE. UU. https:// doi.org/10.1145/3524842.3528470 2. Wu S, Irsoy O, Lu S, Dabravolski V, Dredze M, Gehrmann S, Kambadur P, Rosenberg DS, Mann G (2023) Bloomberggpt: Un modelo de lenguaje grande para finanzas. CoRR abs/2303.17564. doi: https://doi.org/10.48550/ ARXIV.2303.17564 3. Tax N, Sidorova N, Haakma R, van der Aalst WM (2016) Modelos de procesos locales mineros. J Innov Digital Ecosyst 3(2):183–196. https://doi.org/10.1016/ j.jides.2016.11.001 BPM ahora 19. Hamilton K, Nayak A, Božić B, Longo L (2022) ¿Está la IA neurosimbólica cumpliendo sus promesas en el procesamiento del lenguaje natural? Una revisión estructurada. Web semántica. https://doi.org/10.3233/ Berlín. https:// SW223228 20. Dumas M, Rosa ML, Mendling J, Reijers HA (2018) Fundamentos de la gestión de procesos empresariales, 2.ª ed. Springer, Berlín. https://doi.org/ 10.1007/9783662565094 21. OMG (2016) Modelo y notación de gestión de casos (CMMN), versión 2.0. https:// www.omg.org/spec/CMMN/1.1 22. Satyal S, Weber I, Paik H, Ciccio CD, Mendling J (2019) Mejora de procesos de negocio con la metodología ABBPM. Inf Syst 84:283–298. https://doi.org/ 10.1016/j.is.2018.06.007 23. Yao S, Zhao J, Yu D, Du N, Shafran I, Narasimhan KR, Cao Y (2023) React: A, Iana A, Paulheim H, Sinergización del razonamiento y la actuación en modelos lingüísticos. En: La undécima conferencia internacional sobre representaciones del aprendizaje, ICLR 2023, Kigali, Ruanda, del 1 al 5 de mayo de 2023. OpenReview.net

L1 LPM: Una Visión para la Gestión de Procesos de Negocio en la Era de la IA Generativa (PDF)

Document Details

Tags

Related

Summary

Full Transcript