GLIGEN에 직관적인 그래픽 인터페이스의 부족에 만족하지 못한 Reddit 임원은 스스로 문제를 해결하기 위해 행동에 나선 후 사용자 친화적인 플랫폼을 만들어, 정확한 사양으로 이미지를 제작할 수 있게 했습니다.
손끝에서 가능한 기능들:
-
지향적인 구성: 고양이와 같은 주제물을 정확히 원하는 위치에 배치하세요 - 중앙 무대에 또는 한쪽으로. 크기를 조절하여 고양이를 중심에 두거나 시각적 이야기에서 작은 부분으로 두세요.
-
사용자 정의 가능한 요소: 놀라운 은색 우주복부터 달의 험한 지형까지 가장 작은 세부사항까지 선택하세요. 심지어 밤 하늘의 별들의 밀도까지 결정할 수 있습니다.
GLIGEN - 당신의 창작 제어판:
-
텍스트에서 이미지로 변경: 단어부터 시작해서 객체부터 장면까지 모든 것을 포함하는 이미지를 GLIGEN이 정확하게 상상력을 발휘하여 만들어냅니다.
-
기하학적 정확도: 개별 세부사항을 정렬하기 위한 기하학적 레이아웃 제어를 사용하여 일반적인 것과는 다른 방식으로 세부사항을 정렬하고 크기와 위치 및 객체 간 상호작용을 설정할 수 있습니다.
-
강화된 일관성: GLIGEN을 통해 생성된 이미지가 사용자의 비전과 일치하도록 요소들의 특정 배치를 설정하여, 일관성과 정확성을 강화할 수 있습니다.
-
창의성과 유연성의 해방: GLIGEN을 통해 당신은 예술가입니다. 텍스트 설명이 씨앗을 심고, 기하학적 레이아웃을 통한 입력이 예술을 가꾸고 창조하는 데 도움이 됩니다.
이미지 생성의 미래를 엿보고, 자신의 창의성을 시험해보세요 - 당신의 창조성은 GLIGEN 데모에서 기다리고 있습니다.
see the demo here
GLIGEN: Open-Set Grounded Text-to-Image Generation (CVPR 2023, Demo Video)