OpenAI представила нову функцію генерації зображень на базі моделі GPT-4o, доступну для користувачів ChatGPT. Функція стане стандартною для всіх версій ChatGPT, і дозволяє створювати високоякісні зображення без необхідності окремого вибору моделі, як це було з DALL-E.
Генерація зображень на основі GPT-4o відрізняється від попередніх версій завдяки покращеній здатності точніше відтворювати текст, логотипи та інші складні елементи. Завдяки великій мультимодальній моделі, GPT-4o також може працювати з текстом, зображеннями, аудіо і відео, що дозволяє створювати зображення з різними об’єктами та сценаріями за допомогою лише одного запиту.
Для користувачів з безоплатним доступом залишаються колишні ліміти генерації (до трьох зображень на день), однак нова система демонструє кращу точність при створенні текстових елементів на зображеннях, у порівнянні з попередніми моделями. Оновлена система генерує зображення поетапно, зверху вниз і зліва направо, що дозволяє забезпечити більш детальне і коректне відображення всіх елементів.
Нова функція також дозволяє редагувати завантажені зображення, створюючи нові варіанти, використовуючи наявні зображення як візуальні натхнення.
Оскільки GPT-4o є “омніомодальною” моделлю, що працює з текстом, зображенням, аудіо та відео, вона здатна краще розуміти промпти користувачів, коли потрібно створити кілька об’єктів на зображенні.
Однак у моделі є певні обмеження:
Через підвищену деталізацію створення зображення може займати до однієї хвилини.
Довгі зображення, такі як постери, можуть обрізатися надто щільно, особливо в нижній частині.
Якщо в запиті недостатньо контексту, модель може “додумувати” деталі.
При створенні складних концепцій, наприклад, повної періодичної таблиці, модель може неточно відтворювати більше ніж 10-20 об’єктів одночасно.
Символи можуть відображатися некоректно або спотворюватися.
Виправлення окремих деталей (наприклад, орфографічних помилок) не завжди працює без побічних змін у зображенні.
OpenAI виявила, що китайський уряд використовує штучний інтелект для стеження за антикитайським контентом на західних соціальних платформах у режимі реального часу.
Про це повідомляє The New York Times.
Шпигунська система на основі ШІ, що отримала назву Peer Review, була виявлена після того, як фахівці OpenAI помітили застосування їхніх інструментів для налагодження коду, пов’язаного з цією програмою.
«Ми вперше зіткнулися з настільки потужною системою спостереження, заснованою на ШІ», – заявив головний дослідник OpenAI Бен Німмо. За його словами, іноді зловмисники самі випадково розкривають свої схеми, взаємодіючи з моделями OpenAI.
За даними OpenAI, в основі китайської системи стеження лежить модель Llama, розроблена Meta. Оскільки Llama поширюється у форматі open-source, її можливості були використані для створення цього інструменту.
Крім того, OpenAI виявила ще одну китайську кампанію, що отримала назву Sponsored Discontent. Ця група використовувала ШІ для генерації англомовних матеріалів, спрямованих проти китайських опозиціонерів, а також перекладала статті з критикою США іспанською мовою і поширювала їх у Латинській Америці.