LinuxParty
Tuesday Meta lanzó Llama 3.1, su modelo de IA de código abierto más grande hasta la fecha. Pero justo un día Mistral lanzó Large 2, señala este informe de TechCrunch, "que afirma estar a la par con los últimos modelos de vanguardia de OpenAI y Meta en términos de generación de código, matemáticas y razonamiento...
"Aunque Mistral es uno de los nuevos participantes en el espacio de la inteligencia artificial, está lanzando rápidamente modelos de IA en la vanguardia o cerca de ella".En un comunicado de prensa, Mistral dice que una de sus áreas clave de enfoque durante el entrenamiento fue minimizar los problemas de alucinaciones del modelo. La compañía dice que Large 2 fue entrenado para ser más exigente en sus respuestas, reconociendo cuando no sabe algo en lugar de inventar algo que parece plausible. La startup de IA con sede en París recaudó recientemente 640 millones de dólares en una ronda de financiación Serie B, liderada por General Catalyst, con una valoración de 6 mil millones de dólares...
Sin embargo, es importante tener en cuenta que los modelos de Mistral, como la mayoría de los demás, no son de código abierto en el En sentido tradicional : cualquier aplicación comercial del modelo necesita una licencia paga. Y si bien es más abierto que, digamos, GPT-4o, pocos en el mundo tienen la experiencia y la infraestructura para implementar un modelo tan grande. (Eso se duplica para los 405 mil millones de parámetros de Llama, por supuesto).
Mistral sólo tiene 123 mil millones de parámetros, según el artículo. Pero sea cual sea el sistema que prevalezca, "La IA de código abierto es el camino a seguir", escribió Mark Zuckerberg esta semana, prediciendo que la IA de código abierto alcanzará la misma popularidad que Linux :Este año, Llama 3 compite con los modelos más avanzados y es líder en algunas áreas. A partir del próximo año, esperamos que los futuros modelos Llama se conviertan en los más avanzados de la industria. Pero incluso antes de eso, Llama ya es líder en apertura, modificabilidad y rentabilidad... Más allá de lanzar estos modelos, estamos trabajando con una variedad de empresas para hacer crecer el ecosistema más amplio. Amazon, Databricks y NVIDIA están lanzando conjuntos completos de servicios para ayudar a los desarrolladores a ajustar y desarrollar sus propios modelos. Innovadores como Groq han creado servicios de inferencia de baja latencia y bajo costo para todos los modelos nuevos. Los modelos estarán disponibles en las principales nubes, incluidas AWS, Azure, Google, Oracle y más. Empresas como Scale.AI, Dell, Deloitte y otras están listas para ayudar a las empresas a adoptar Llama y entrenar modelos personalizados con sus propios datos.
"A medida que la comunidad crece y más empresas desarrollan nuevos servicios, colectivamente podemos hacer de Llama el estándar de la industria y llevar los beneficios de la IA a todos", escribe Zuckerberg. Dice que ha escuchado de desarrolladores, directores ejecutivos y funcionarios gubernamentales que quieren "entrenar, afinar y destilar" sus propios modelos, protegiendo sus datos con un modelo barato y eficiente, y sin estar encerrados en un proveedor cerrado. Pero también le dicen que quieren invertir en un ecosistema "que va a ser el estándar a largo plazo".Mucha gente ve que el código abierto avanza a un ritmo más rápido que los modelos cerrados y quiere construir sus sistemas sobre la arquitectura que les brinde la mayor ventaja a largo plazo...
Una de mis experiencias formativas ha sido la construcción de nuestros servicios restringidos. por lo que Apple nos permitirá construir en sus plataformas. Entre la forma en que gravan a los desarrolladores, las reglas arbitrarias que aplican y todas las innovaciones de productos que bloquean, está claro que Meta y muchas otras empresas tendrían libertad para crear servicios mucho mejores para las personas si pudiéramos crear las mejores versiones de Nuestros productos y competidores no pudieron limitar lo que podíamos construir. A nivel filosófico, esta es una de las principales razones por las que creo tan firmemente en la construcción de ecosistemas abiertos en IA y AR/VR para la próxima generación de informática...
Creo que el código abierto es necesario para un futuro positivo de IA. La IA tiene más potencial que cualquier otra tecnología moderna para aumentar la productividad, la creatividad y la calidad de vida humanas, y para acelerar el crecimiento económico y al mismo tiempo desbloquear avances en la investigación médica y científica. El código abierto garantizará que más personas en todo el mundo tengan acceso a los beneficios y oportunidades de la IA, que el poder no se concentre en manos de un pequeño número de empresas y que la tecnología pueda implementarse de manera más uniforme y segura en toda la sociedad. Existe un debate en curso sobre la seguridad de los modelos de IA de código abierto y mi opinión es que la IA de código abierto será más segura que las alternativas. Creo que los gobiernos concluirán que les conviene apoyar el código abierto porque hará que el mundo sea más próspero y más seguro... El código abierto debería ser significativamente más seguro ya que los sistemas son más transparentes y pueden ser examinados ampliamente
... La conclusión es que la IA de código abierto representa la mejor oportunidad del mundo para aprovechar esta tecnología para crear la mayor oportunidad económica y seguridad para todos... Creo que el lanzamiento de Llama 3.1 será un punto de inflexión en la industria donde la mayoría de los desarrolladores comenzarán a utilizar principalmente código abierto, y espero que ese enfoque solo crezca a partir de aquí. Espero que se unan a nosotros en este viaje para llevar los beneficios de la IA a todas las personas del mundo.
-
Artículos
- 5 razones por las que Linux superará a Windows y MacOS en el escritorio, próximamente
- El crecimiento de Linux: Un hito en su popularidad con un 4,55% según StatCounter
- Se lanzó la herramienta de rescate del sistema Super Grub2 Disk 2.06s4 con soporte para Btrfs
- Europa se sube al tren
- El encargado de mantenimiento de Rust para Linux se retira frustrado por una "tontería no técnica"
- Japón lucha por popularizar la semana laboral de cuatro días
- Pruebas del inframundo del antiguo Egipto y entrevista con Thomas Flynn
- Las 10 fórmulas y atajos de teclado de Excel (y LibreOffice) que todo el mundo debería saber según la Universidad de Harvard
- Las Redes Sociales Están Muertas
- Científicos identifican el origen y la composición del asteroide que hace 66 millones de años exterminó a los dinosaurios
- ¿Quieres salvar tu vieja computadora? Pruebe estas 5 distribuciones de Linux
- ¿Cuál es el futuro de la IA de código abierto?
- Reconstrucción Virtual Revoluciona el Conocimiento del Castro Vetón de Villasviejas del Tamuja, Extremadura
- Los ríos se convierten en 'reservorios de enfermedades'
- Innovador Motor de Hidrógeno Podría Revolucionar la Industria del Vehículo Eléctrico y el motor de Explosión