불과 몇 년 전만 해도 AI가 전문가 수준의 이미지를 만들어낼 수 있다고는 누구도 믿지 못했을 것입니다. 물론 읽을 수 있는 텍스트가 포함된 것은 아닙니다. 첫 번째 시도를 기억하시나요?글이 흐릿하고 의미가 없었으며, 종종 무작위로 모인 문자 집합과 비슷했습니다. 하지만 GPT-4o가 등장하면서 모든 것이 바뀌었습니다. OpenAI는 새로운 모델이 의미가 있는 정확한 텍스트가 포함된 사실적인 이미지를 생성할 수 있다고 주장합니다.
당신은 몇 번이나 그렇게 하지 않았으면 좋겠다고 바랐나요?chat 포스터나 명함, 혹은 명언이 담긴 이미지를 만들었지만, 그 결과가 재앙이었나요? 글이 왜곡되어 있거나, 읽을 수 없거나, 전혀 의미가 없었습니다. GPT-4o가 마침내 이 문제를 해결했습니다. OpenAI는 생성된 텍스트가 자연스러워 보이고 편집기에서 작성한 텍스트만큼 읽기 쉽도록 모델을 조정하는 데 성공했습니다.
AI는 지시를 따르는 데 더 능숙합니다
AI에게 정확한 설명을 해주었는데, 그 결과가 당신이 상상했던 것과 전혀 다를 때의 느낌을 경험해 보셨나요? 새로운 모델은 사용자가 원하는 것이 무엇인지 정확히 이해하는 능력이 훨씬 향상되었습니다. 더 이상 실제로 입력한 내용을 추측할 필요가 없습니다. GPT-4o는 사용자의 지시를 훨씬 더 정확하게 해석할 수 있습니다. 즉, 특정 장면이 생성되면 설명을 그대로 따라하는 것이 아니라 실제로 그 장면을 이해하게 된다는 의미입니다.
4세대 이미지가 도래했습니다.
오늘부터 출시가 시작됩니다. ChatGPT 그리고 Plus, Pro, Team, Free 사용자 모두에게 Sora를 선물합니다. pic.twitter.com/pFXDzKhh2t
— 오픈AI(@OpenAI) 2025 년 3 월 25 일
이게 아마 가장 좋은 소식일 거예요. 유료 사용자에게만 제한되었던 일부 다른 AI 기능과 달리, OpenAI는 GPT-4o를 사용하여 이미지를 생성하는 기능을 비용을 지불하지 않으려는 사용자도 사용할 수 있도록 했습니다. ChatGPT 지불하다. 생성되는 이미지 수에는 다소 제한이 있을지 몰라도, 이 기술이 일반 사용자에게까지 도달한다는 사실은 큰 진전입니다.
그래픽 디자이너 뿐만 아니라 일반인도 GPT-4o의 혜택을 누릴 수 있습니다. max면역성 있는. 나만의 초대장, 독창적인 포스터, 소셜 미디어 게시물, 심지어 간단한 만화를 만드는 것이 그 어느 때보다 쉬워졌습니다. 더 이상 복잡한 그래픽 프로그램이 필요 없습니다. 텍스트만 입력하면 AI가 대신 작업을 해줍니다.
GPT-4o는 이미지와 텍스트를 기반으로 구축할 수 있습니다. chat 맥락을 고려하여 일관성을 유지합니다. pic.twitter.com/DxgN6z2qqB
— 오픈AI(@OpenAI) 2025 년 3 월 25 일
아직 완벽하지 않은 점은 무엇입니까?
GPT-4o가 큰 진전을 이루었지만 OpenAI가 미세 조정해야 할 부분도 아직 남아 있습니다. 이 모델은 이전보다 텍스트를 더 잘 표현해냈지만, 가끔은 일부 글자가 완벽하게 선명하지 않은 경우가 발생합니다. 또한 모델이 항상 당신이 상상하는 글꼴 스타일과 일치하지는 않는다는 점도 고려해야 합니다. 하지만 이전 버전에 비하면 엄청난 개선이 있었습니다.
당신은 관심을 가질 수 있습니다
기술의 오용을 방지하기 위해 OpenAI는 생성된 이미지에 C2PA 메타데이터를 통합했습니다. 이는 누군가가 이미지를 비윤리적으로 사용하거나 허위 정보를 퍼뜨리려고 할 경우를 의미합니다.mac그러면 그들의 기원을 추적하는 것이 가능할 것이다. 이를 통해 OpenAI는 책임감 있게 AI에 접근하고 오용을 방지하려고 노력하고 있음을 보여줍니다.