Saltar al contenido

¿Modelos de aprendizaje automático prediseñados o personalizados?

05/01/2024
¿Modelos De Aprendizaje Automático Prediseñados O Personalizados?

¿Es mejor desarrollar una solución personalizada o aprovechar una ya disponible?

Las organizaciones tienen disponible una variedad de opciones para el desarrollo de modelos, desde plataformas de aprendizaje automático completamente gestionadas hasta modelos personalizados de Inteligencia Artificial. La decisión de si es más adecuado desarrollar sus propias soluciones específicas o preferir un servicio existente en el mercado general depende de diversos factores, como las necesidades del negocio, la experiencia técnica de mano y las restricciones de tiempo y presupuesto.

En cada etapa de las tareas de aprendizaje automático, es necesario tomar una decisión sobre qué elementos del proceso se utilizarán. Desde la recolección, organización y representación visual de datos, pasando por la ingeniería de características, hasta la formación y evaluación de modelos, los ingenieros especializados en aprendizaje automático se encuentran frente a una elección recurrente: ¿Se optará por una solución desarrollada a medida? ¿O se preferirá un servicio estándar?[automatic_youtube_gallery type="search" search="¿Modelos de aprendizaje automático prediseñados o personalizados?" cache="2419200" per_page="1" thumb_excerpt="0" player_description="0"]

Pero, ¿cuándo es preferible desarrollar a adquirir una solución ya existente? Los factores primordiales que diferencian estas dos opciones son: el esfuerzo requerido en la fase de preprocesamiento, la rapidez en el desarrollo y la experiencia necesaria.

¿Qué aspectos deben tenerse en cuenta al decidir si utilizar modelos de aprendizaje automático personalizados o genéricos?

Esfuerzo en el preprocesamiento de datos

Los proyectos de aprendizaje automático se enfrentan a retos variados, pero probablemente el más significativo sea la obtención de datos de entrenamiento suficientes. Muchos proyectos se ven detenidos antes de empezar por falta de estos datos esenciales. Antes de que un proyecto arranque, puede encontrarse cara a cara con costes elevados asociados a la recolección, etiquetado y limpieza de estos datos, además de los esfuerzos de preprocesamiento. Muchos proyectos de aprendizaje automático fracasan por caer en esta trampa: el preprocesamiento devora el 80% de los recursos asignados, dejando poco para la formación y evaluación del modelo en sí.

Las soluciones genéricas alivian las tensiones y dificultades asociadas a los esfuerzos de preprocesamiento. Están diseñadas para realizar operaciones comunes con una configuración mínima. La gran ventaja es que existen soluciones genéricas para todas las etapas de las tareas de aprendizaje automático.

Por otro lado, las implementaciones personalizadas usualmente requieren más esfuerzos de preprocesamiento. Ello no significa que deban ser descartadas de inmediato: hay situaciones en las que se precisa adaptar una etapa específica del aprendizaje automático a las particularidades del problema que se intenta resolver. Un set de datos especialmente contaminado puede necesitar unas reglas de limpieza particulares. Igualmente, un conjunto de características singular puede requerir una ingeniería de características personalizada, al igual que las arquitecturas neuronales pueden requerir ajustes finos. Para estos casos, es probable que las soluciones coutomizadas desarrolladas desde el inicio cubran todas las necesidades.

Ritmo de desarrollo

Las soluciones genéricas enfatizan la configuración más que la implementación. En lugar de destinar recursos a determinar qué debe hacerse, los equipos de aprendizaje automático se enfocarán en cómo las diferentes piezas del proceso se ensamblarán. Este enfoque posibilita a las empresas, los investigadores y los ingenieros implementar rápidamente prototipos y pruebas de concepto. Las soluciones ya disponibles en el mercado permiten aprovechar conocimientos previos, ahorrando así tiempo de desarrollo.

Se sabe que las soluciones personalizadas construidas desde cero tienen un ritmo de desarrollo más lento. El motivo es que requieren mayor mantenimiento: los ingenieros necesitan descubrir tanto el qué como el cómo de la solución. Además, cuánto más compleja sea la solución, más recursos de tiempo serán necesarios para asegurar su escalabilidad y disponibilidad durante su producción. Desde esta perspectiva, el tiempo invertido en las soluciones personalizadas es directamente proporcional a su complejidad: una solución compleja requerirá más tiempo.

La realidad suele estar en un punto intermedio: la base de código existente será refactorizada y adaptada a las necesidades del proyecto actual. Se puede tomar como ejemplo el conocido enfoque de aprendizaje por transferencia para la formación de modelos.

Experiencia requerida

Del mismo modo que el aprendizaje automático se realiza en diversos niveles, los modelos de aprendizaje automático pueden desarrollarse en diferentes niveles de experiencia, desde interfaces sin código hasta la construcción de modelos desde cero.

Existen soluciones genéricas que requieren pocos conocimientos sobre aprendizaje automático. Gracias al uso de interfaces intuitivas e incluso enfoques de arrastrar y soltar, es sumamente sencillo para cualquier persona (desde analistas de negocio hasta ingenieros de software) construir e implementar algún tipo de modelo de aprendizaje automático. Esta simplicidad puede ser ventajosa para la creación de prototipos, pero es poco probable que cumpla con los requerimientos de los sistemas de producción.

Aún así, se requiere experiencia para configurar, ajustar y mantener apropiadamente las soluciones genéricas en producción. Las soluciones alternativas, los parches de código, la conexión a diferentes interfaces API y la resolución de problemas de implementación son tareas necesarias para garantizar el rendimiento de los modelos en entornos de producción.

Las soluciones personalizadas suelen implementarse a nivel de infraestructura y no hay forma de eludirlo: definitivamente se necesita experiencia. Dependiendo del tamaño de la empresa y los objetivos del proyecto, pueden necesitarse equipos multidisciplinarios para mantener los sistemas de producción. Científicos de datos, ingenieros de aprendizaje automático y analistas de negocios colaboran para interpretar los resultados de las inferencias y mantener los modelos de producción.

¿Cuál es la mejor opción? ¿Modelo genérico o personalizado de aprendizaje automático?

Una solución de aprendizaje automático se construirá a partir de muchos componentes y servicios individuales que deben formar una solución coherente. La elección nunca se trata de ser completamente personalizado o completamente genérico, ya que diferentes problemas de negocios requieren diferentes soluciones. La mayoría de las veces, las soluciones basadas en el aprendizaje automático se crean a través de una combinación de los dos: se utilizan servicios genéricos para extraer información general y se combinan con modelos personalizados para lograr mayor precisión y modelado de conocimiento específico de dominio.

La habilidad reside en saber cuándo implementar soluciones personalizadas desde cero y qué partes del proyecto pueden beneficiarse de los servicios disponibles en el mercado. Ciertamente, la elección dependerá mucho del tipo de problema a resolver, los requerimientos del negocio, los datos disponibles y las restricciones generales del ambiente de desarrollo.