Mistral AI, una startup floreciente en el sector de la IA, se ha propuesto revolucionar la inteligencia artificial (IA) generativa con su primer modelo de lenguaje grande (LLM), Mistral 7B.
La compañía espera que el nuevo modelo de 7 mil millones de parámetros se convierta en una alternativa de código abierto a las soluciones de inteligencia artificial actuales.
Modelos de instrucción Mistral 7B y Mistral 7B
Mientras que otros han establecido el estándar de la industria con sus modelos de “caja negra”, Mistral AI cree que un enfoque de código abierto impulsado por la comunidad puede superarlos.
Haciendo comparaciones con los movimientos de código abierto en navegadores web y sistemas operativos, Mistral sugiere que los modelos respaldados por la comunidad son el futuro.
El lanzamiento de Mistral 7 B es el primer paso significativo de la compañía hacia la creación de modelos especializados que compitan con soluciones de IA más grandes y establecidas.
Los pesos del modelo sin procesar se distribuyen con Bittorrent y en Hugging Face. Esta documentación detalla el paquete de implementación que permite implementar rápidamente una API de finalización en cualquier proveedor de nube importante con GPU NVIDIA.
Los modelos abiertos de Mistral AI tienen como objetivo ofrecer una adaptabilidad superior, permitiendo la personalización para tareas específicas y necesidades del usuario.
Este enfoque se promociona como ventajoso para las empresas que buscan mantener los costos bajos y al mismo tiempo mantener el rendimiento.
Además, la empresa cree que los modelos de código abierto serán herramientas fundamentales para combatir los desafíos éticos asociados con la IA, como la censura y los prejuicios.
A medida que los modelos generativos continúan influyendo en la sociedad, la capacidad de auditarlos para detectar fallas y mal uso se vuelve cada vez más vital.
Cómo utilizar Mistral 7B gratis
imán:?xt=urn:btih:208b101a0f51514ecf285885a8b0f6fb1a1e4d7d&dn=mistral-7B-v0.1&tr=udp%3A%2F%https://t.co/OdtBUsbMKD%3A1337%2Fannounce&tr=https%3A%2F%https://t .co/HAadNvH1t0%3A443%2Fannounce
LANZAMIENTO ab979f50d7d406ab8d0b07d09806c72c
– Mistral AI (@MistralAI) 27 de septiembre de 2023
El modelo Mistral 7B está disponible para descargar, con documentación en GitHub o a través de Hugging Face.
muy genial de ver @MistralAI ¡Lanza sus primeros modelos, incluido un Instruct 7B! https://t.co/BgguuZx7nO
– Clemente 🤗 (@ClementDelangue) 27 de septiembre de 2023
Además, puedes chatear con el modelo Mistral 7B Instruct en Perplexity Labs.
Mistral AI llegó a los titulares con financiación inicial
Mistral AI fue noticia este verano cuando recaudó 113 millones de dólares en financiación inicial en junio, lo que subraya la confianza de los inversores en el enfoque de código abierto.
La financiación estuvo dirigida por Lightspeed Venture Partners, con más de una docena de inversores, incluidos Eric Schmidtex director ejecutivo de Google, que a menudo habla de IA.
Increíble logro de @InflexiónAI – En menos de un año, desarrollaron uno de los LLM más sofisticados y lanzaron Pi, el primer producto de inteligencia artificial personal con un alto ecualizador. https://t.co/kDWLql8nJG
—Eric Schmidt (@ericschmidt) 30 de junio de 2023
El equipo de Mistral AI está compuesto por científicos de datos, ingenieros de software e ingenieros de aprendizaje automático extraídos de DeepMind, Meta, Hugging Face y otros.
¡Grandes noticias! Me emociona compartir que comenzaré un nuevo capítulo en mi carrera en @aimistral. Estoy increíblemente agradecido por el crecimiento y los recuerdos que he creado durante mi tiempo en @huggingface. Espero poder aportar mis habilidades y pasión a mi nuevo puesto. 🚀 🚀 🚀
-Saulnier Lucile (@LucileSaulnier) 18 de julio de 2023
Arthur Mensch, cofundador y director ejecutivo de Mistral AI, expresó su entusiasmo por lo que la empresa planeaba lograr:
“Nuestra formación como investigadores en IA, combinada con nuestras respectivas experiencias profesionales dentro de las principales empresas tecnológicas del mundo, nos ha convencido de que existe un camino a seguir para un proyecto alternativo e innovador que nos permitirá difundir responsablemente la tecnología más prometedora de nuestra generación como lo más ampliamente posible.
Estamos orgullosos de iniciar este proyecto global desde Francia, nuestro país de origen, y de contribuir, a nuestro nivel, al surgimiento de un nuevo actor creíble en inteligencia artificial generativa de Europa. Durante los próximos meses centraremos toda nuestra energía y pasión en honrar la confianza depositada en nosotros por nuestros inversores”.
Según la plataforma de presentación, los planes de Mistral incluyen el desarrollo de modelos de IA superiores a los de OpenAI en 2024.
En esa ronda (tercer trimestre de 2024), esperamos necesitar recaudar 200 millones para entrenar modelos que superen las capacidades de GPT-4. Una financiación sólida nos permitirá entrenar modelos en infraestructuras más grandes, lo que nos establecerá como un líder en investigación en IA que será el proveedor de referencia de la industria europea.
Mistral AI espera lanzar progresivamente nuevos modelos que cierren la brecha de rendimiento entre sus soluciones de código abierto y sus ofertas patentadas como parte de su estrategia continua.
¿Francia se posiciona como el próximo líder en el desarrollo de la IA?
En junio, el presidente francés, Emmanuel Macron, un gran promotor de las nuevas empresas tecnológicas francesas, estuvo en VivaTech, la feria tecnológica europea más grande de París.
Quería apoyar a las nuevas empresas francesas, ayudarlas a expandirse internacionalmente y atraer más inversiones en investigación y proyectos de IA en Francia.
Los expertos en tecnología también han anotado que la mayoría de los desarrolladores (11 de 14) de la tecnología Llama de código abierto de Meta AI son franceses, lo que hace que los últimos desarrollos de IA no sean sorprendentes.
Hoy lanzamos LLaMA, 4 modelos de base que van desde parámetros 7B hasta 65B.
LLaMA-13B supera a OPT y GPT-3 175B en la mayoría de las pruebas. LLaMA-65B es competitivo con Chinchilla 70B y PaLM 540B.
Los pesos para todos los modelos están abiertos y disponibles en https://t.co/q51f2oPZlE
1/n pic.twitter.com/DPyJFBfWEq– Guillaume Lample (@GuillaumeLample) 24 de febrero de 2023
El futuro de la IA de código abierto
Un competidor potencialmente sólido y de código abierto para los LLM existentes como Mistral 7B podría ofrecer nuevas oportunidades para que las empresas utilicen la IA, con posibilidades de personalización más amplias y un control mejorado sobre la seguridad de los datos.
El paso a modelos generativos de código abierto representa un cambio significativo en la industria de la IA, que desafía los modelos propietarios tradicionales por motivos éticos y de rendimiento.
Imagen de portada: The Hornbills Studio/Shutterstock
Con información de Search Engine Journal.
Leer la nota Completa > Mistral AI lanza LLM de código abierto, Mistral 7B