위의 원본 그림을 wan을 돌려서 보았다그렇게 해서 나온게 아래의 영상(840x480) 이제 이걸 upscale(업스케일) 하고 interpolate(프레임보간)을 해보자 1696x960 해상도에 60프레임이 되었다. 눈에 띄게 화질이 좋아지고 프레임이 부드러워진 것을 알수 있다즉, 영상을 만들고 업스랑 프레임보간은 상당히 매력적인 선택이라고 할 수 있다하지만 여기엔 큰 문제가 있는데 이 추가 작업을 해주는데만 7분40초가 걸렸다는 것이다오히려 영상을 만드는 시간(5분)보다 더 오래 걸려서 총 12분40초정도의 시간이 걸렸다.게다가 5090이 나온이상 내 그래픽 사양인 4090은 하이엔드라고 할 수는 없지만매우 근접한 아랫단계 카드인 점을 고려하면 그 아래급 카드들은 두배에 가깝게 걸..
1️⃣ 토큰(token)의 개념프롬프트 공학에 있어서 가장 중요한 개념이 뭐냐 꼽는다면토큰이라고 해도 과언이 아니다. 이에 대해선 다음글에서 설명하겠다먼저 개념부터 보면 토큰은 '컴퓨터의' 단어이다1girl 이라면 우리로썬 뭐 두단어로 볼수도 있겠지만 보통 한단어로 인식한다하지만 컴퓨터의 감성토큰집에 따르면1 + girl 이렇게 두개의 단어, 즉 2토큰이 된다여기까진 납득가능하지만 1_girl 이러면 3토큰이 되어 버린다. 1과 _밑줄과 girl 이렇게 나뉘기 때문쉼표역시 1토큰취급이다.다행히 기준이 뭐냐라고 물었을때 컴인지감수성 이딴게 나오는게 아니라 명확하게단어집이 존재한다. 이 링크를 클릭해보면 주루룩 정리된 것을 볼 수 있다.(다만 단어집은 이거말고도 있으며 다른거 쓸수도 있다) 단어집 자체는 우..
1️⃣ CFG (classifier-free guidance scale)'이미지 분류기 없는 가이던스 스케일' CFG는 그야말로 AI 그림의 입문, 대문앞에 새겨져있다해도 과언이 아닌 녀석이다즉, '여기가 소림사인가?' 이러고 무림에 입문한 사람이 소림사 대문을 본후아래에 비석을 보니 'Classifier-free guidance scale' 이라고 새겨져있는 수준이다하지만 4단어주제에 하나같이 심오하다보니(뭔소린지 모르겠다보니)대부분의 수행자는 애써 못본척하거나 KFC랑 비슷한거겠지 하고스스로를 속여넘겨 정신적 데미지를 방지한다하지만 한달후엔 다른 입문자가 어설프게 수련하는 것을 보고는미소지으며 '허허 그건 CFG가 7정도가 되어야 가능한 기술이니라' 라고 훈수를 둔다물론 뭘 알아서 그런건 아니고 맨땅..
1️⃣ 단어 vs 문장comfyui 같은 ai에서 작성하는 프롬프트는'1girl, skirt, shirt' 같은 단어의 나열이거나 '1girl is wearing a shirt and skirt' 같은 문장식의 자연어 구조 둘다 사용가능하다그럼 이들은 어떻게 다르며 무엇이 더 효과적일까 결론부터 말하면 어떤 훈련을 중점적으로 한 모델인가에 따라 달라진다예를들면 스테이블디퓨전과 NovelAi의 경우 대부분 Danbooru 태그형을 이용해서 학습했다간단하게 얘기해서 손에 익은 것이 더 나은 작업물이 된다는 것이다'로멘틱, 성공적' 이러면 알만한 사람은 당장 누구를 그리게 되지만'어떤 남자가 로멘틱하게 성공적인 연예를 하자고 합니다' 라고 하면 당장은 뭔개소리일까 갸우뚱하게 되는 원리다즉, 이경우 모델은 학습..
프롬프트 컨디셔닝이란 프롬프트를 작성했을시 clip인코더에 의해AI(스테이블디퓨전)이 알아듣도록 번역된(조건화된) 상태를 얘기한다 위의 comfyui의 기본적인 프롬프트 노드에서 텍스트를 입력하면왼쪽에서 지원되는 clip을 사용해서 번역 CONDITIONING이라는 결과로 출력하게 된다즉, 왼쪽엔 번역기 연결하고 텍스트란에 원하는 프롬프트 적고출력으로 AI가 알아들을 수 있는 번역된 것이 나간다는 얘기다 이 clip이라는 번역기는 따로 불러올수도 있지만보통 모델(체크포인트)와 함께 붙어서 나오기에이와 같이 Load Checkpoint 노드에서 바로 노란색 단자를 빼서 사용하면 된다이때 clip은 왠만하면 다른걸로 변경되지 않는다. 그말은 노란색 단자를 입력으로 하는 모든 노드들이저거 하나를 공유한다는거다..
# Pony Diffusion XL(포니)이름그대로 마이리틀포니를 비롯한 이른바 퍼리(수인)를 중심으로SDXL에서 2D쪽으로 훈련된 checkpoint 모델이다.일반적 2D계열에서 좀 벗어나는 주제기에(말박이..) 그냥 또다른 변태모델의 출현인줄 알았으나포니 오타쿠의 집념이 실체화되어 만들어진 마스터피스급 모델이었던 것이 밝혀지고이후 Civitai에 Pony전용 태그와 아이콘이 만들어지는등 animagazineXL과 함께 SDXL의 보급에 큰 공헌을 하게 되었다 가장 큰 특징은 포즈와 2인이상의 상호작용, 체위, 성기의 구현등기존 모델에선 로라를 써도 구현이 거의 안되던 것들을 제어할 수 있게 되었다는 것,특히나 nsfw(야한거)는 압도적인 제어력을 지녔다어느정도냐면 단순체크포인트를 넘어 모델자체가 버전..