වින්ඩෝස් හි GUI සමඟ දේශීයව ස්ථායී විසරණය ධාවනය කරන්නේ කෙසේද


ඔබට ඔබේ පරිගණකයේ දේශීයව ස්ථායී විසරණය ස්ථාපනය කළ හැක, නමුත් සාමාන්ය ක්රියාවලියට ස්ථාපනය කිරීමට සහ භාවිතා කිරීමට විධාන රේඛාව සමඟ බොහෝ වැඩ ඇතුළත් වේ. අපගේ වාසනාවකට මෙන්, ස්ථාවර විසරණ ප්රජාව එම ගැටළුව විසඳා ඇත. චිත්රක පරිශීලක අතුරුමුහුණතක් සමඟ දේශීයව ක්රියාත්මක වන ස්ථායී විසරණයේ අනුවාදයක් ස්ථාපනය කරන්නේ කෙසේද යන්න මෙන්න!

ස්ථාවර විසරණය යනු කුමක්ද?

ස්ථායී විසරණය යනු MidJourney හෝ DALL-E 2 වැනි පෙළ ප්රේරක වලින් රූප උත්පාදනය කිරීමට හෝ පවතින රූප පෙළ ප්රේරකයකින් වෙනස් කිරීමට හැකි AI ආකෘතියකි. එය ප්රථමයෙන් 2022 අගෝස්තු මාසයේදී Stability.ai විසින් නිකුත් කරන ලදී. එය විවිධ වචන දහස් ගණනක් තේරුම් ගන්නා අතර ඔබේ පරිකල්පනය ඕනෑම ශෛලියකින් පාහේ මැවිය හැකි ඕනෑම රූපයක් නිර්මාණය කිරීමට භාවිතා කළ හැකිය.

අනෙකුත් බොහෝ ජනප්රිය AI කලා ජනක යන්ත්රවලින් ස්ථායී විසරණය වෙනස් කරන තීරණාත්මක වෙනස්කම් දෙකක් ඇත, නමුත්:

  • එය ඔබේ පරිගණකයේ දේශීයව ධාවනය කළ හැක
  • එය විවෘත මූලාශ්ර ව්යාපෘතියකි

අවසාන කරුණ ඇත්තටම මෙහි වැදගත් ප්රශ්නයයි. සම්ප්රදායිකව, ස්ථාවර විසරණය ස්ථාපනය කර විධාන රේඛා අතුරුමුහුණතක් හරහා ක්රියාත්මක වේ. එය ක්රියා කරයි, නමුත් එය අවුල් සහගත, අවබෝධයක් නොමැති විය හැකි අතර, වෙනත් ආකාරයකින් උනන්දුවක් දක්වන පුද්ගලයින්ට ඇතුල් වීමට සැලකිය යුතු බාධාවකි. නමුත්, එය විවෘත මූලාශ්ර ව්යාපෘතියක් බැවින්, ප්රජාව ඉක්මනින් ඒ සඳහා පරිශීලක අතුරුමුහුණතක් නිර්මාණය කරන ලද අතර, වීඩියෝ ram (VRAM) භාවිතය අවම කිරීම සඳහා ප්රශස්තිකරණයන් ඇතුළුව ඔවුන්ගේම වැඩිදියුණු කිරීම් එකතු කිරීම සහ ඉහළ නැංවීම සහ ආවරණ කිරීම ආරම්භ කළහ.

ස්ථායී විසරණයේ මෙම අනුවාදය ධාවනය කිරීමට ඔබට අවශ්ය වන්නේ කුමක්ද?

ස්ථායී විසරණයෙහි මෙම අනුවාදය Stability.ai විසින් නිර්මාණය කර නඩත්තු කරන ලද ප්රධාන ගබඩාවේ (repo) දෙබලකි - ශාඛාවකි. එයට චිත්රක පරිශීලක අතුරුමුහුණතක් (GUI) ඇත - සාමාන්ය ස්ථායී විසරණයට වඩා එය භාවිතා කිරීම පහසු කරයි, එය විධාන රේඛා අතුරුමුහුණතක් පමණක් ඇත - සහ බොහෝ සැකසුම් ස්වයංක්රීයව හසුරුවන ස්ථාපකය.

මෙම දෙබලක GFPGAN, ESRGAN, RealESRGAN, සහ CodeFormer සහ ආවරණ භාවිතා කරමින් අඩු RAM සහිත පරිගණක මත ධාවනය කිරීමට ඉඩ සලසන විවිධ ප්රශස්තිකරණයන්, ගොඩනඟන ලද ඉහළ නැංවීම සහ මුහුණේ හැකියාවන් අඩංගු වේ. ආවරණ කිරීම විශාල ගනුදෙනුවකි - එය ඔබට AI රූප උත්පාදනය වෙනත් කොටස් විකෘති නොකර රූපයේ සමහර කොටස් වලට තෝරා ගැනීමට ඉඩ සලසයි, එය සාමාන්යයෙන් පින්තාරු කිරීම ලෙස හැඳින්වේ.

  • ඔබේ දෘඪ තැටියේ අවම වශයෙන් ගිගාබයිට් 10ක් නොමිලේ
  • 6 GB RAM සහිත NVIDIA GPU (ඔබට 4 GB වැඩ කිරීමට හැකි වුවද)
  • Windows 11, Windows 10, Windows 8.1, හෝ Windows 8 ධාවනය වන පරිගණකයක්
  • The WebUI GitHub Repo, AUTOMATIC1111 විසින්
  • Python 3.10.6 (නව අනුවාද සහ බොහෝ පැරණි අනුවාද හොඳ විය යුතුය)
  • ස්ථායී විසරණ නිල මුරපොල (v1.5 මුරපොල සඳහා නරඹන්න!)
  • GFPGAN v1.4 මුරපොල
  • ඔබට අවශ්ය ඕනෑම අමතර ESRGAN මාදිලි. ඔබට අවශ්ය ප්රමාණයක් හෝ කිහිපයක් භාවිතා කළ හැක.

GUI සමඟ ස්ථායී විසරණය ස්ථාපනය කරන්නේ කෙසේද

ස්ථාපන ක්රියාවලිය සැලකිය යුතු ලෙස විධිමත් කර ඇත, නමුත් ස්ථාපකය භාවිතා කිරීමට පෙර ඔබ අතින් කළ යුතු පියවර කිහිපයක් තිබේ.

මුලින්ම Python ස්ථාපනය කරන්න

ඔබ කළ යුතු පළමු දෙය නම්, repo කතුවරයා විසින් නිර්දේශ කරන ලද Python අනුවාදය, 3.10.6 ස්ථාපනය කිරීමයි. එම සබැඳිය වෙත ගොස්, පිටුවේ පහළට අනුචලනය කර, Windows Installer (64-Bit) ක්ලික් කරන්න.

ඔබ බාගත කළ ක්රියාත්මක කළ හැකි එක ක්ලික් කර විමසුම් හරහා යන්න. ඔබ දැනටමත් Python ස්ථාපනය කර ඇත්නම් (සහ ඔබ නිසැකවම එසේ කරයි), උත්ශ්රේණි කරන්න ක්ලික් කරන්න. එසේ නොමැතිනම් නිර්දේශිත විමසීම් අනුගමනය කරන්න.

Git ස්ථාපනය කර GitHub Repo බාගන්න

ස්ථායී විසරණ ස්ථාපකය ධාවනය කිරීමට හැකි වීමට පෙර ඔබ Windows මත Git බාගත කර ස්ථාපනය කළ යුතුය. 64-bit Git ක්රියාත්මක කළ හැකි බාගත කර, එය ක්රියාත්මක කර, ඔබට නිශ්චිත යමක් මතකයේ නොමැති නම් නිර්දේශිත සැකසුම් භාවිතා කරන්න.

ඊළඟට, ඔබ GitHub repo වෙතින් ගොනු බාගත කළ යුතුය. හරිත කේතය බොත්තම ක්ලික් කරන්න, ඉන්පසු මෙනුවේ පහළින් ඇති Download ZIP ක්ලික් කරන්න.

ZIP ගොනුව ගොනු එක්ස්ප්ලෝරර් හෝ ඔබ කැමති ගොනු සංරක්ෂණ වැඩසටහන විවෘත කර, ඔබට අවශ්ය ඕනෑම තැනක අන්තර්ගතය උපුටා ගන්න. ස්ථාවර විසරණය ධාවනය කිරීමට ඔබට යා යුතු ස්ථානය ෆෝල්ඩරය බව මතක තබා ගන්න. මෙම උදාහරණය C:\ බහලුම වෙත ඒවා උපුටා ගන්නා ලදී, නමුත් එය අත්යවශ්ය නොවේ.

සියලුම මුරපොල බාගන්න

මෙය ක්රියාත්මක වීමට ඔබට අවශ්ය මුරපොලවල් කිහිපයක් තිබේ. පළමු හා වඩාත්ම වැදගත් වන්නේ ස්ථායී විසරණ මුරපොලයි. මුරපොල බාගැනීමට ඔබට ගිණුමක් සෑදිය යුතුය, නමුත් ගිණුම සඳහා බොහෝ දේ අවශ්ය නොවේ - ඔවුන්ට අවශ්ය වන්නේ නමක් සහ විද්යුත් තැපැල් ලිපිනයක් පමණක් වන අතර, ඔබ යාමට සුදුසුයි.

C:\stable-diffusion-webui-master\models\Stable-diffusion ෆෝල්ඩරයට sd-v1-4.ckpt පිටපත් කර අලවන්න, ඉන්පසු sd-v1-4.ckpt දකුණු-ක්ලික් කර නැවත නම් කරන්න ඔබන්න. . පෙළ ක්ෂේත්රයට “model.ckpt” ටයිප් කර Enter ඔබන්න. එය model.ckpt බවට වග බලා ගන්න - මෙය වෙනත් ආකාරයකින් ක්රියා නොකරනු ඇත.

ඔබට GFPGAN මුරපොල බාගැනීමටද අවශ්ය වේ. අපි භාවිතා කරන රෙපෝවේ කතුවරයා GFPGAN v1.4 මුරපොලවල් සඳහා කැඳවා ඇත. පිටුව පහළට අනුචලනය කරන්න, ඉන්පසු V1.4 ආකෘතිය ක්ලික් කරන්න.

එම ගොනුව, “GFPGANv1.4.pth,” “stable-diffusion-webui-master” ෆෝල්ඩරය තුළට දමන්න, නමුත් එය නැත්නම් නැවත නම් නොකරන්න. stable-diffusion-webui-master ෆෝල්ඩරයේ දැන් මෙම ගොනු අඩංගු විය යුතුය:

ඔබට අවශ්ය තරම් ESRGAN මුරපොලවල් බාගත කළ හැකිය. ඒවා සාමාන්යයෙන් ZIP ගොනු ලෙස ඇසුරුම් කර ඇත. එකක් බාගත කිරීමෙන් පසු, ZIP ගොනුව විවෘත කරන්න, ඉන්පසු .pth ගොනුව model/ESRGAN ෆෝල්ඩරයට උපුටා ගන්න. මෙන්න උදාහරණයක්:

ESRGAN මාදිලි වඩාත් නිශ්චිත ක්රියාකාරීත්වයක් ලබා දීමට නැඹුරු වේ, එබැවින් ඔබට ආයාචනා කරන යුවලක් තෝරා ගන්න.

දැන්, ඔබට webui-user.bat ගොනුව දෙවරක් ක්ලික් කළ යුතුය, එය ප්රාථමික ස්ථායී-විසරණය-webui-master ෆෝල්ඩරයේ පිහිටා ඇත. කොන්සෝල කවුළුවක් දිස්වන අතර අනෙකුත් සියලුම වැදගත් ලිපිගොනු ලබා ගැනීම, පයිතන් පරිසරයක් ගොඩනැගීම සහ වෙබ් පරිශීලක අතුරුමුහුණතක් සැකසීම ආරම්භ වේ. එය මේ ආකාරයෙන් පෙනෙනු ඇත:

එය සිදු වූ විට, කොන්සෝලය පෙන්වනු ඇත:

Running on local URL: http://127.0.0.1:7860
To create a public link, set `share=True` in `launch()`

GUI සමඟ ස්ථායී විසරණය භාවිතයෙන් රූප උත්පාදනය කරන්නේ කෙසේද

හරි, ඔබ ස්ථාවර විසරණයේ WebUI ප්රභේදය ස්ථාපනය කර ඇති අතර, එය දේශීය URL: http://127.0.0.1:7860 මත ධාවනය වන බව ඔබේ කොන්සෝලය ඔබට දන්වයි.

ඔබගේ බ්රවුසරය විවෘත කර, ලිපින තීරුව තුළට “127.0.0.1:7860” හෝ “localhost:7860” ඇතුළත් කර, Enter ඔබන්න. ඔබ මෙය txt2img ටැබය මත දකිනු ඇත:

ඔබ මීට පෙර ස්ථායී විසරණය භාවිතා කර ඇත්නම්, මෙම සැකසීම් ඔබට හුරුපුරුදු වනු ඇත, නමුත් මෙහි වඩාත්ම වැදගත් විකල්ප අදහස් කරන්නේ කුමක්ද යන්න පිළිබඳ කෙටි දළ විශ්ලේෂණයක්:

  • ප්රේරකය: ඔබ නිර්මාණය කිරීමට කැමති දේ පිළිබඳ විස්තරය.
  • චිත්රකරුගේ පැලට් බොත්තම: ඔබේ විමසුමට අහඹු කලාත්මක විලාසයක් යොදයි.
  • නියැදි පියවර: ඔබට ප්රතිදානයක් ලැබීමට පෙර රූපය පිරිපහදු කරන වාර ගණන. වැඩිපුර සාමාන්යයෙන් වඩා හොඳයි, නමුත් අඩුවන ප්රතිලාභ තිබේ.
  • නියැදීමේ ක්රමය: නියැදීම හසුරුවන ආකාරය පාලනය කරන යටින් පවතින ගණිතය. ඔබට මේවායින් ඕනෑම එකක් භාවිතා කළ හැක, නමුත් euler_a සහ PLMS වඩාත්ම ජනප්රිය විකල්ප ලෙස පෙනේ. ඔබට මෙම පත්රිකාවෙන් PLMS ගැන වැඩිදුර කියවිය හැක.
  • මුහුණු ප්රතිසාධනය කරන්න: අද්භූත හෝ විකෘති මුහුණු නිවැරදි කිරීමට උත්සාහ කිරීමට GFPGAN භාවිත කරයි.
  • කාණ්ඩ ගණන: ජනනය කළ යුතු පින්තූර ගණන.
  • කාණ්ඩ ප්රමාණය: “කාණ්ඩ” ගණන. ඔබට අතිවිශාල VRAM ප්රමාණයක් නොමැති නම් මෙය 1 හි තබා ගන්න.
  • CFG පරිමාණය: ස්ථායී විසරණය ඔබ ලබා දෙන විමසුම කෙතරම් ප්රවේශමෙන් අනුගමනය කරයිද. විශාල සංඛ්යා යන්නෙන් අදහස් වන්නේ එය ඉතා ප්රවේශමෙන් එය අනුගමනය කරන අතර අඩු සංඛ්යා එයට වැඩි නිර්මාණාත්මක නිදහසක් ලබා දෙන බවයි.
  • පළල: ඔබට ජනනය කිරීමට අවශ්ය රූපයේ පළල.
  • උස: ඔබට ජනනය කිරීමට අවශ්ය රූපයේ පළල.
  • බීජ: අහඹු-සංඛ්යා උත්පාදකයක් සඳහා මූලික ආදානයක් සපයන අංකය. අහඹු ලෙස නව බීජයක් ජනනය කිරීමට එය -1 ට තබන්න.

ප්රේරකය මත පදනම්ව රූප පහක් ජනනය කරමු: “ඉන්ද්රජාලික වනාන්තරයක උස්බිම් ගවයෙක්, මි.මී. 35 චිත්රපට ඡායාරූපකරණය, තියුණු” සහ PLMS නියැදිය, නියැදීම් පියවර 50 සහ CFG පරිමාණය 5 භාවිතයෙන් අපට ලැබෙන දේ බලමු.

ප්රතිදාන කවුළුව මේ ආකාරයෙන් පෙනෙනු ඇත:

ඉහළ-මැද රූපය අපි ටිකක් පසුව ආවරණ කිරීම සඳහා උත්සාහ කිරීමට භාවිතා කරනු ඇත. මෙම නිශ්චිත තේරීම සඳහා පුද්ගලික මනාප හැර වෙනත් හේතුවක් ඇත්ත වශයෙන්ම නොමැත. ඔබ කැමති ඕනෑම පින්තූරයක් ගන්න.

එය තෝරන්න, ඉන්පසු Send to Inpaint ක්ලික් කරන්න.

තීන්ත ආලේප කිරීම සඳහා ඔබ විසින් සාදන ලද පින්තූර ආවරණය කරන්නේ කෙසේද

පින්තාරු කිරීම විශිෂ්ට ලක්ෂණයකි. සාමාන්යයෙන් ස්ථායී විසරණය මඟින් ප්රේරකයකින් සම්පූර්ණ රූප නිර්මාණය කිරීමට භාවිතා කරයි, නමුත් පින්තාරු කිරීම මඟින් ඔබට රූපයේ කොටස් තෝරා ගැනීමට (හෝ ප්රතිජනනය කිරීමට) ඉඩ සලසයි. මෙහි තීරණාත්මක විකල්ප දෙකක් තිබේ: inpaint masked, inpaint not masked.

Inpaint masked ඔබ උද්දීපනය කරන ප්රදේශය තුළ රූප ජනනය කිරීමට ප්රේරකය භාවිතා කරනු ඇත, නමුත් inpaint mask නොකළ ප්රදේශය හරියටම ප්රතිවිරුද්ධ දේ කරයි - ඔබ වසන ප්රදේශය පමණක් සුරැකෙනු ඇත.

අපි මුලින්ම Inpaint masked ගැන ටිකක් ආවරණය කරමු. වම් ක්ලික් කිරීම අල්ලාගෙන සිටින රූපය මත ඔබේ මූසිකය ඇදගෙන යන්න, එවිට ඔබේ රූපයට ඉහළින් සුදු පැහැති තට්ටුවක් දිස්වන බව ඔබට පෙනෙනු ඇත. ඔබට ප්රතිස්ථාපනය කිරීමට අවශ්ය ප්රදේශයේ හැඩය අඳින්න, එය සම්පූර්ණයෙන්ම පිරවීමට වග බලා ගන්න. ඔබ කලාපයක් රවුම් කරන්නේ නැත, ඔබ මුළු කලාපයම ආවරණය කරයි.

අපේ උඩරට හරක් ආදර්ශයට ගෙන ඔහුට චෙෆ් තොප්පියක් දෙමු. ආසන්න වශයෙන් සූපවේදියෙකුගේ තොප්පියක හැඩයෙන් යුත් කලාපයක් ආවරණය කර, කණ්ඩායම් ප්රමාණය 1 ට වඩා සැකසීමට වග බලා ගන්න. පරමාදර්ශී (ඉෂ්) ප්රතිඵලයක් ලබා ගැනීමට ඔබට බොහෝ විට කිහිපයක් අවශ්ය වනු ඇත.

මීට අමතරව, ඔබ පිරවීම, මුල් හෝ ගුප්ත කිසිවක් වෙනුවට ගුප්ත ශබ්දය තෝරාගත යුතුය. ඔබට දර්ශනයක් තුළ සම්පූර්ණයෙන්ම නව වස්තුවක් උත්පාදනය කිරීමට අවශ්ය වූ විට එය හොඳම ප්රතිඵල නිපදවීමට නැඹුරු වේ.

හොඳයි - සමහර විට සූපවේදියෙකුගේ තොප්පිය ඔබේ උස්බිම් ගවයා සඳහා නිවැරදි තේරීම නොවේ. ඔබේ උස්බිම් ගවයා 20 වැනි සියවසේ මුල් භාගයේ කම්පනයට පත් වී ඇත, එබැවින් අපි ඔහුට පන්දු යවන්නෙකු ලබා දෙමු.

කෙතරම් ධනාත්මක ලෙස අඳුරුද.

ඇත්ත වශයෙන්ම, ඔබට Inpaint Not Masked සමඟ හරියටම ප්රතිවිරුද්ධ දේ කළ හැකිය. ඔබ නිර්වචනය කරන ප්රදේශ ආපසු හැරවීම හැර එය සංකල්පමය වශයෙන් සමාන වේ. ඔබට වෙනස් කිරීමට අවශ්ය කලාපය සලකුණු කරනවා වෙනුවට, ඔබට සංරක්ෂණය කිරීමට අවශ්ය කලාප සලකුණු කරන්න. ඔබට කුඩා වස්තුවක් වෙනත් පසුබිමකට ගෙන යාමට අවශ්ය විට එය බොහෝ විට ප්රයෝජනවත් වේ.

CUDA මතකයෙන් බැහැර දෝෂය නිවැරදි කරන්නේ කෙසේද?

ඔබ සාදන රූපය විශාල වන තරමට වීඩියෝ මතකය අවශ්ය වේ. ඔබ උත්සාහ කළ යුතු පළමු දෙය නම් කුඩා පින්තූර ජනනය කිරීමයි. ස්ථායී විසරණය 256×256 දී හොඳ - ඉතා වෙනස් වුවත් - රූප නිපදවයි.

512 × 512 පින්තූර සමඟ ගැටළු නොමැති පරිගණකයක විශාල පින්තූර සෑදීමට ඔබ කැසීමෙන් සිටින්නේ නම් හෝ ඔබ විවිධ මතකයේ දෝෂ වලට මුහුණ දෙන්නේ නම්, උපකාර විය යුතු වින්යාසයේ යම් යම් වෙනස්කම් තිබේ.

Notepad හි webui-user.bat හෝ ඔබට අවශ්ය වෙනත් සරල පෙළ සංස්කාරකයක් විවෘත කරන්න. webui-user.bat දකුණු-ක්ලික් කරන්න, සංස්කරණය කරන්න ක්ලික් කරන්න, ඉන්පසු Notepad තෝරන්න. සකසන්න COMMANDLINE_ARGS= කියවන පේළිය හඳුනා ගන්න. ස්ථායී විසරණය ක්රියාත්මක වන ආකාරය ප්රශස්ත කිරීම සඳහා ඔබ විධාන ලබා දීමට යන්නේ එහිදීය.

ඔබට විශාල පින්තූර සෑදීමට අවශ්ය නම්, හෝ ඔබට GTX 10XX ශ්රේණියේ GPU එකක RAM අවසන් වන්නේ නම්, පළමුව --opt-split-attention  උත්සාහ කරන්න. එය මේ ආකාරයෙන් පෙනෙනු ඇත:

ඉන්පසු File > Save ක්ලික් කරන්න. විකල්පයක් ලෙස, ඔබට ඔබේ යතුරුපුවරුවේ Ctrl+S එබිය හැකිය.

ඔබට තවමත් මතක දෝෂ තිබේ නම්, විධාන රේඛා විස්තාරක (COMMANDLINE_ARGS) ලැයිස්තුවට --medvram එකතු කිරීමට උත්සාහ කරන්න.

පෙර විධාන උදව් නොකළේ නම් අමතර මතක ගැටලු විසඳීමට උත්සාහ කිරීමට ඔබට --always-batch-cond-uncond එකතු කළ හැක. VRAM භාවිතය තවත් අඩු කළ හැකි --medvram සඳහා විකල්පයක් ද ඇත, --lowvram, නමුත් එය ඇත්ත වශයෙන්ම ක්රියා කරයිද නැද්ද යන්න අපට සහතික කළ නොහැක. .

පරිශීලක අතුරුමුහුණතක් එකතු කිරීම මෙම ආකාරයේ AI-ධාවන මෙවලම් සෑම කෙනෙකුටම ප්රවේශ විය හැකි තීරනාත්මක ඉදිරි පියවරකි. හැකියාවන් නිමක් නැති තරම් වන අතර, AI කලාව සඳහා කැප වූ සබැඳි ප්රජාවන් දෙස ඉක්මන් බැල්මක් හෙළීම පවා ඔබට එහි ළදරු අවධියේදී පවා තාක්ෂණය කෙතරම් ප්රබලද යන්න පෙන්වනු ඇත. ඇත්ත වශයෙන්ම, ඔබට සූදු පරිගණකයක් නොමැති නම්, හෝ ඔබට සැකසුම ගැන කරදර වීමට අවශ්ය නැතිනම්, ඔබට සැමවිටම සබැඳි AI කලා උත්පාදක යන්ත්රයක් භාවිතා කළ හැකිය. ඔබගේ ඇතුළත් කිරීම් පුද්ගලික යැයි උපකල්පනය කළ නොහැකි බව මතක තබා ගන්න.