Gestor de paquetes para modelos de máquina aprendida
La mayoría de los modelos aprendidos a máquina están entrenados desde cero. Si entrena un modelo de visión por computadora, aprenderá una jerarquía de detectores de borde a lo largo de la profundidad de la red. El modelo aprendido es útil pero incómodo de reutilizar.
Déjame usar una analogía. En Python y en muchos otros idiomas, agregar “paquetes” de habilidades informativas a un proyecto generalmente requiere 1 línea de código. Como contraste, agregar nuevos “modelos” de habilidades a un nuevo modelo requiere desarrollo personalizado, lo que puede llevar algunas horas o días.
En este momento, los investigadores están trabajando principalmente en problemas aislados en: lenguaje natural, habla, visión y robótica. El aprendizaje multimodal intenta trabajar en la intersección de algunos campos, pero solo utilizan un puñado de modelos aprendidos. Principalmente, porque es difícil reutilizar los modelos ya aprendidos.
- ¿Por qué la gente adopta en lugar de procrear?
- ¿La venganza es gratificante?
- Cómo detener un comportamiento de adelgazamiento
- ¿Cómo solicitar un trabajo en LinkedIn? Apenas conozco a esa gente, necesito estar en lo cierto para preguntarles
- Cómo mostrar a la gente que no eres perezoso.
Ejemplo
Imagine que está trabajando en un nuevo problema de visión de computadora y con un solo comando instale el mejor modelo de Imagenet. Luego importa un módulo de inferencia para convertir las imágenes a incrustaciones. Utiliza las incrustaciones como características para entrenar a tu nuevo modelo. Algo como:
pip instalar best_imagenet_model
de best_imagenet_model import inference
embedding = inference.predict (raw_image, layer_depth = 8)
Ahora quieres probar algo nuevo e instalar el mejor modelo de subtítulos de imágenes. Importa el módulo de inferencia y lo utiliza como extractor de características. Por lo tanto, tiene dos conjuntos sólidos de características de los mejores modelos de Imagenet y subtítulos de imagen para entrenar a su nuevo modelo.
Ahora puede usar un modelo generativo como Wavenet para convertir el texto de los subtítulos a audio y usar el audio como una característica. Por lo tanto tienes tres características fuertes para entrenar a tu modelo.
Ahora ha detectado que hay muchas marcas de automóviles en los datos. Instala el mejor modelo de clasificación de marca de autos y el proceso comienza de nuevo.
Ahora ha detectado que hay muchos autos en los datos. Entonces, ¿por qué no intentamos usar un modelo de imagen que fue entrenado usando muchos autos?
Como puede ver, probar nuevas ideas sería muy fácil, conveniente y le ahorraría mucho tiempo. Además, sería útil agregar una bandera para afinar esos modelos.
También haríamos que este planeta sea más verde porque ahorraríamos muchos ciclos de entrenamiento de GPU y CPU.