Aquí está la cosa. La IA generativa para imágenes ha cambiado de un truco de fiesta a la artesanía cotidiana, y pocas personas se sientan más cerca de ese cambio que Ofir Bibi, vicepresidente de investigación en Lightricks.
En esta conversación, quería entender cómo una empresa famosa por Facetune, Photoleap y Videoleap se está construyendo para un futuro donde los creadores esperan velocidad, control y sufragio sin dolor de comienzo. Lo que encontré fue una historia sobre la construcción de la tecnología central que sirve flujos de trabajo creativos reales, no al revés.
Ofir traza el alucinación de Lightricks de los inteligentes trucos en el dispositivo que hicieron que las pantallas pequeñas se sintieran potentes para los modelos de almohadilla de hoy en día en la estrato. El hilo constante es la usabilidad. Hacer que la impresión compleja se sienta simple requiere decisiones inteligentes en segundo plano, y esa mentalidad ha cedido forma a todo, desde sus primeras aplicaciones móviles hasta LTX Studio, la plataforma creativa multimodelo de la compañía. En los últimos tres primaveras, las características generativas pasaron de la novedad a la carencia, y esa existencia obligó a una pregunta más vasto: ¿cuándo dejas de unir los modelos de otras personas y comienzas a elaborar las tuyas?

Esa pregunta condujo a LTXV, un maniquí de coexistentes de video de código amplio diseñado para velocidad, eficiencia y control. Ofir explica por qué Lightricks lo construyó desde cero y por qué compartieron los pesos y el preparador con la comunidad. El resultado es un ciclo de feedback rápido donde los investigadores, desarrolladores e incluso los competidores prueban ideas sobre un maniquí que se ejecuta en hardware de nivel de consumo y puede gestar clips más rápido de lo que se pueden ver. La nueva construcción destilada LTXV 2B continúa que empujan alrededor de una iteración más rápida y un control cordial para el creador, incluido el acondicionamiento abusivo de cuadros que se adapta a la animación y los flujos de trabajo basados en el fotograma esencia.
Además hablamos sobre la dieta de datos cambiante para el entrenamiento. La cantidad está fuera. Calidad y preparación importante. Los conjuntos de datos con osadía y de adhesión estética y los modelos de curación más estrictos que comprenden indicaciones, movimiento y física con menos bordes extraños. Esa disciplina igualmente aparece en el producto. LTX Studio combina Lightricks Tech con opciones de socios como el flujo de Veo y Black Forest Labs de Google, luego dirige a los usuarios alrededor de el maniquí adecuado para el trabajo a través de una interfaz de usufructuario reflexiva. Si desea la toma individual más aguda, puede elegirlo. Si desea ajustes rápidos e iterativos para la narración de historias, LTXV está al frente y al centro.
Mirando alrededor de el futuro, Ofir ve un futuro cercano donde los modelos se vuelven más amplios y más multimodales, mientras que los creadores y empresas solicitan opciones locales y en las primeras que mantienen los datos más cerca de casa. Eso hace que la eficiencia sea una característica, no una nota al pie. Si te importa el oficio de hacer, no solo el espectáculo, este episodio ofrece una visión fundamental de cómo la IA efectivamente puede servir a los creadores. Me dejó convencido de que la velocidad y el control son los verdaderos diferenciadores, y que el código amplio puede ser una forma muy destreza de obtener los dos.
Enlaces aperos
Suscríbete al podcast Daily Tech Talks Talks




