Трумультимодальность. До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini

Трумультимодальность. До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini. OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель. Поглядите все видосики обязательно. Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество. А вот пример с газовой горелкой - просто отличный: “нарисуй то, что случится, когда горелка повернется“. Визуальная цепочка мыслей. “Включи телевизор“ - тоже неплохо. Источник тут. В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы. И поднимите веки Midjourney кто-нибудь. Неприлично уже.
Back to Top