La matriz de Facebook quiere ser también un actor de referencia en la inteligencia artificial generativa y para ello busca el desarrollo de un modelo de lenguaje de gran tamaño propio, que estaría listo el próximo año.
Este nuevo modelo será más potente que Llama 2, el modelo de lenguaje que Meta ha lanzado este verano junto con Microsoft, que se caracteriza por ser de código abierto y estar enfocado a la investigación y el uso comercial.
De hecho, este modelo sería también más potente que GPT-4, el modelo más avanzado de la actualidad, desarrollado por OpenIA con la infraestructura de Microsoft, según informa The Wall Street Journal, a partir de lo transmitido por fuentes conocedoras de este asunto.
Para su desarrollo y entrenamiento, Meta ha establecido un grupo de trabajo dedicado y está construyendo la infraestructura necesaria, para no depender de la de Microsoft como ocurre con Llama 2, que está disponible en Azure. En concreto, está adquiriendo los procesadores más avanzados de Nvidia para el entrenamiento de IA, H100.
La compañía espera poder iniciar el entrenamiento a principios de 2024. Una vez disponible, este modelo ofrecería a las empresas servicios basados en IA generativa para la obtención de texto y análisis sofisticados.