¿Cuáles serían herramientas valiosas para el aprendizaje profundo que nadie ha construido todavía?

Gestor de paquetes para modelos de máquina aprendida

La mayoría de los modelos aprendidos a máquina están entrenados desde cero. Si entrena un modelo de visión por computadora, aprenderá una jerarquía de detectores de borde a lo largo de la profundidad de la red. El modelo aprendido es útil pero incómodo de reutilizar.

Déjame usar una analogía. En Python y en muchos otros idiomas, agregar “paquetes” de habilidades informativas a un proyecto generalmente requiere 1 línea de código. Como contraste, agregar nuevos “modelos” de habilidades a un nuevo modelo requiere desarrollo personalizado, lo que puede llevar algunas horas o días.

En este momento, los investigadores están trabajando principalmente en problemas aislados en: lenguaje natural, habla, visión y robótica. El aprendizaje multimodal intenta trabajar en la intersección de algunos campos, pero solo utilizan un puñado de modelos aprendidos. Principalmente, porque es difícil reutilizar los modelos ya aprendidos.

Ejemplo

Imagine que está trabajando en un nuevo problema de visión de computadora y con un solo comando instale el mejor modelo de Imagenet. Luego importa un módulo de inferencia para convertir las imágenes a incrustaciones. Utiliza las incrustaciones como características para entrenar a tu nuevo modelo. Algo como:

pip instalar best_imagenet_model
de best_imagenet_model import inference
embedding = inference.predict (raw_image, layer_depth = 8)

Ahora quieres probar algo nuevo e instalar el mejor modelo de subtítulos de imágenes. Importa el módulo de inferencia y lo utiliza como extractor de características. Por lo tanto, tiene dos conjuntos sólidos de características de los mejores modelos de Imagenet y subtítulos de imagen para entrenar a su nuevo modelo.

Ahora puede usar un modelo generativo como Wavenet para convertir el texto de los subtítulos a audio y usar el audio como una característica. Por lo tanto tienes tres características fuertes para entrenar a tu modelo.

Ahora ha detectado que hay muchas marcas de automóviles en los datos. Instala el mejor modelo de clasificación de marca de autos y el proceso comienza de nuevo.

Ahora ha detectado que hay muchos autos en los datos. Entonces, ¿por qué no intentamos usar un modelo de imagen que fue entrenado usando muchos autos?

Como puede ver, probar nuevas ideas sería muy fácil, conveniente y le ahorraría mucho tiempo. Además, sería útil agregar una bandera para afinar esos modelos.

También haríamos que este planeta sea más verde porque ahorraríamos muchos ciclos de entrenamiento de GPU y CPU.

Como programador, me gusta pensar en construir modelos de aprendizaje profundo como programación y experimentación. Todas las herramientas que se aplican en esos campos también son muy relevantes para este espacio. TensorFlow para el aprendizaje profundo es como un lenguaje para la programación. Todavía hay mucho trabajo por hacer para construir el resto del ecosistema.

Por ejemplo, mejores herramientas de depuración ayudarán a los investigadores a comprender por qué sus modelos no están aprendiendo, una mejor administración de la experimentación les facilitará la ejecución y el análisis de más experimentos.

Predecir el ataque al corazón humano.