AI රූප ජනනය කිරීම සඳහා ඔබේ පරිගණකයේ ස්ථායී විසරණය ධාවනය කරන්නේ කෙසේද
සාරාංශය: ඔබේ පරිගණකයේ දේශීයව ස්ථායී විසරණය ධාවනය කිරීමට, GitHub වෙතින් ස්ථාවර විසරණය සහ HuggingFace.co වෙතින් නවතම මුරපොල බාගත කර ඒවා ස්ථාපනය කරන්න. ඉන්පසු Miniconda භාවිතා කර විශේෂ python පරිසරයක Stable Diffusion ධාවනය කරන්න.
කෘත්රිම බුද්ධිය (AI) කලාව මේ වන විට ඉතා ජනප්රියයි, නමුත් බොහෝ AI රූප ජනක යන්ත්ර ක්ලවුඩ් තුළ ක්රියාත්මක වේ. ස්ථායී විසරණය වෙනස් වේ - ඔබට එය ඔබේම පරිගණකයේ ධාවනය කර ඔබට අවශ්ය තරම් පින්තූර ජනනය කළ හැකිය. ඔබට වින්ඩෝස් මත ස්ථායී විසරණය ස්ථාපනය කර භාවිතා කළ හැකි ආකාරය මෙන්න.
ස්ථාවර විසරණය යනු කුමක්ද?
ස්ථායී විසරණය යනු විවෘත මූලාශ්ර යන්ත්ර ඉගෙනුම් ආකෘතියක් වන අතර එය පාඨයෙන් රූප උත්පාදනය කිරීමට, පෙළ මත පදනම්ව රූප වෙනස් කිරීමට හෝ අඩු විභේදන හෝ අඩු විස්තර සහිත රූපවල විස්තර පිරවීමට හැකිය. එය රූප බිලියන ගණනක් මත පුහුණු කර ඇති අතර ඔබට DALL-E 2 සහ MidJourney වෙතින් ලැබෙන ප්රතිඵල හා සැසඳිය හැකි ප්රතිඵල නිපදවිය හැක. එය ස්ථායිතා AI විසින් වැඩි දියුණු කරන ලද අතර 2022 අගෝස්තු 22 වන දින ප්රථම වරට ප්රසිද්ධියේ නිකුත් කරන ලදී.
ස්ථායී විසරණයට සමහර AI රූප ජනක යන්ත්ර මෙන් (තවමත්) පිළිවෙලට පරිශීලක අතුරුමුහුණතක් නොමැත, නමුත් එයට අතිශයින්ම අවසර ලත් බලපත්රයක් ඇත, සහ - සියල්ලටම වඩා - එය ඔබේම පරිගණකයේ (හෝ Mac.) භාවිතා කිරීම සම්පූර්ණයෙන්ම නොමිලේ.
ස්ථායී විසරණය දැනට විධාන රේඛා අතුරුමුහුණතක (CLI) ක්රියාත්මක වන නිසා බිය නොවන්න. එය ලබා ගැනීම සහ ධාවනය කිරීම ඉතා සරලව ඉදිරියට යයි. ඔබට ක්රියාත්මක කළ හැකි එකක් දෙවරක් ක්ලික් කර කොටුවක ටයිප් කළ හැකි නම්, ඔබට එය මිනිත්තු කිහිපයකින් ක්රියාත්මක කළ හැක.
ඔබේ පරිගණකයේ ස්ථායී විසරණය ධාවනය කිරීමට ඔබට අවශ්ය වන්නේ කුමක්ද?
ස්ථාවර විසරණය ඔබේ දුරකථනයේ හෝ බොහෝ ලැප්ටොප් පරිගණකවල ක්රියාත්මක නොවනු ඇත, නමුත් එය 2022 දී සාමාන්ය ක්රීඩා පරිගණකයක ක්රියාත්මක වේ. මෙන්න අවශ්යතා:
- VRAM හි අවම වශයෙන් ගිගාබයිට් 6ක් (GB) සහිත GPU එකක්
- මෙයට බොහෝ නවීන NVIDIA GPU ඇතුළත් වේ
- ස්ථායී විසරණය Linux සහ macOS මතද ධාවනය කළ හැක
ඔබට දෘඩාංග නොමැති නම්, වෙබ් පාදක AI රූප උත්පාදකයක් භාවිතා කිරීම සලකා බලන්න. ඔබට වෙබයේ ස්ථායී විසරණයේ ආදර්ශනයක් පවා ධාවනය කළ හැකිය.
වින්ඩෝස් මත ස්ථායී විසරණය ස්ථාපනය කර ධාවනය කරන්නේ කෙසේද
ඔබට අවශ්ය මෘදුකාංග දෙකක් තිබේ: Git සහ Miniconda3.
Git ස්ථාපනය කිරීම
Git යනු සංවර්ධකයින්ට ඔවුන් සංවර්ධනය කරන මෘදුකාංගයේ විවිධ අනුවාද කළමනාකරණය කිරීමට ඉඩ සලසන මෙවලමකි. ඔවුන්ට ඔවුන් වැඩ කරන මෘදුකාංගයේ බහු අනුවාද මධ්යම ගබඩාවක එකවර පවත්වාගෙන යා හැකි අතර අනෙකුත් සංවර්ධකයින්ට ව්යාපෘතියට දායක වීමට ඉඩ සලසයි.
ඔබ සංවර්ධකයෙකු නොවේ නම්, Git මෙම ව්යාපෘති වෙත ප්රවේශ වීමට සහ බාගත කිරීමට පහසු ක්රමයක් සපයන අතර, අපි එය මෙම අවස්ථාවේදී භාවිතා කරන්නේ කෙසේද යන්නයි. Git වෙබ් අඩවියෙන් Windows x64 ස්ථාපකය බාගත කර, Git ස්ථාපනය කිරීමට එය ක්රියාත්මක කරන්න.
ස්ථාපකය ක්රියාත්මක වන විට තේරීමට ඔබෙන් විමසනු ලබන විකල්ප කිහිපයක් තිබේ - ඒවා ඒවායේ පෙරනිමි සැකසුම් මත තබන්න. එක් විකල්ප පිටුවක්, ඔබේ PATH පරිසරය සකස් කිරීම විශේෂයෙන් වැදගත් වේ. එය විධාන රේඛාවෙන් සහ තුන්වන පාර්ශවීය මෘදුකාංගයෙන් ලෙස සැකසිය යුතුය.
Miniconda3 ස්ථාපනය කිරීම
ස්ථායී විසරණය විවිධ පයිතන් පුස්තකාල කිහිපයක් මත ඇදී යයි. ඔබ Python ගැන වැඩි යමක් නොදන්නේ නම්, මේ ගැන කරදර නොවන්න - එය පැවසීම ප්රමාණවත්ය, පුස්තකාල යනු ඔබේ පරිගණකයට රූපයක් පරිවර්තනය කිරීම හෝ සංකීර්ණ ගණිතය වැනි නිශ්චිත කාර්යයන් කිරීමට භාවිතා කළ හැකි මෘදුකාංග පැකේජයන් පමණි.
Miniconda3 මූලික වශයෙන් පහසු මෙවලමකි. එය ඔබට ස්ථායී විසරණය සඳහා අවශ්ය සියලුම පුස්තකාල බාගත කිරීමට, ස්ථාපනය කිරීමට සහ කළමනාකරණය කිරීමට ඉඩ සලසයි. එය අපි ඇත්ත වශයෙන්ම ස්ථායී විසරණය භාවිතා කරන ආකාරය ද වනු ඇත.
නවතම ස්ථාපකය ලබා ගැනීමට Miniconda3 බාගැනීම් පිටුවට ගොස් Miniconda3 Windows 64-bit ක්ලික් කරන්න.
ස්ථාපනය ආරම්භ කිරීමට ක්රියාත්මක කළ හැකි එය බාගත කළ පසු එය දෙවරක් ක්ලික් කරන්න. Miniconda3 හි ස්ථාපනය Git කළාට වඩා අඩුවෙන් පිටු හරහා ක්ලික් කිරීම ඇතුළත් වේ, නමුත් ඔබ මෙම විකල්පය ගැන සැලකිලිමත් විය යුතුය:
ඊළඟ ක්ලික් කර ස්ථාපනය අවසන් කිරීමට පෙර ඔබ සියලු පරිශීලකයින් තේරීමට වග බලා ගන්න.
Git සහ Miniconda3 ස්ථාපනය කිරීමෙන් පසු ඔබේ පරිගණකය නැවත ආරම්භ කිරීමට ඔබෙන් විමසනු ඇත. එය අවශ්ය බව අපට පෙනී ගියේ නැත, නමුත් ඔබ එසේ කළහොත් එය හානියක් නොවනු ඇත.
ස්ථායී විසරණ GitHub ගබඩාව සහ නවතම මුරපොල බාගන්න
දැන් අපි පූර්ව අවශ්ය මෘදුකාංගය ස්ථාපනය කර ඇති බැවින්, අපි ස්ථායී විසරණය බාගත කර ස්ථාපනය කිරීමට සූදානම්.
ප්රථමයෙන් නවතම මුරපොල බාගන්න - 1.4 අනුවාදය 5GB පමණ වේ, ඒ නිසා එය යම් කාලයක් ගත විය හැක. මුරපොල බාගැනීමට ඔබ ගිණුමක් සෑදිය යුතුය, නමුත් ඔවුන්ට අවශ්ය වන්නේ නම සහ ඊමේල් ලිපිනය පමණි. අනෙක් සියල්ල විකල්ප වේ.
බාගැනීම ආරම්භ කිරීමට sd-v1-4.ckpt ක්ලික් කරන්න.
එවිට ඔබ GitHub වෙතින් ස්ථායී විසරණය බාගත කළ යුතුය. හරිත කේතය බොත්තම මත ක්ලික් කරන්න, ඉන්පසු Download ZIP ක්ලික් කරන්න. විකල්පයක් ලෙස, ඔබට මෙම සෘජු බාගත කිරීමේ සබැඳිය භාවිතා කළ හැකිය.
දැන් අපි ස්ථායී විසරණ ගොනු සියල්ල ඉවත් කරන ෆෝල්ඩර කිහිපයක් සකස් කළ යුතුය. ආරම්භක බොත්තම ක්ලික් කර ආරම්භක මෙනු සෙවුම් තීරුව තුළ miniconda3 ටයිප් කරන්න, ඉන්පසු විවෘත ක්ලික් කරන්න හෝ Enter ඔබන්න.
අපි විධාන රේඛාව භාවිතා කරමින් ස්ථායී-විසරණය නමින් ෆෝල්ඩරයක් නිර්මාණය කිරීමට යන්නෙමු. පහත කේත බ්ලොක් එක Miniconda3 කවුළුවට පිටපත් කර අලවන්න, ඉන්පසු Enter ඔබන්න.
cd C:/ mkdir stable-diffusion cd stable-diffusion
සෑම දෙයක්ම හොඳින් සිදු වූවා නම්, ඔබට මෙවැනි දෙයක් පෙනෙනු ඇත:
Miniconda3 කවුළුව විවෘතව තබන්න, අපට එය විනාඩියකින් නැවත අවශ්ය වනු ඇත.
ඔබගේ ප්රියතම ගොනු සංරක්ෂණ වැඩසටහනෙන් ඔබ GitHub වෙතින් බාගත කරගත් stable-diffusion-main.zip, ZIP ගොනුව විවෘත කරන්න. විකල්පයක් ලෙස, ඔබ සතුව නොමැති නම් Windows හට ZIP ගොනු තනිවම විවෘත කළ හැක. ZIP ගොනුව එක් කවුළුවක විවෘතව තබා ගන්න, ඉන්පසු තවත් ගොනු එක්ස්ප්ලෝරර් කවුළුවක් විවෘත කර අප විසින් සාදන ලද C:\stable-diffusion ෆෝල්ඩරය වෙත යන්න.
ස්ථායී-විසරණය-ප්රධාන, ZIP ගොනුවේ ඇති ෆෝල්ඩරය ස්ථායී-විසරණය ෆෝල්ඩරය වෙත ඇද දමන්න.
Miniconda3 වෙත ආපසු ගොස්, පහත දැක්වෙන විධානයන් කවුළුව වෙත පිටපත් කර අලවන්න:
cd C:\stable-diffusion\stable-diffusion-main conda env create -f environment.yaml conda activate ldm mkdir models\ldm\stable-diffusion-v1
මෙම ක්රියාවලිය බාධා නොකරන්න. සමහර ගොනු ගිගාබයිට් එකකට වඩා විශාල බැවින් එය බාගත කිරීමට ටිකක් ගත විය හැක. ඔබ අහම්බෙන් ක්රියාවලියට බාධා කරන්නේ නම්, ඔබට පරිසර ෆෝල්ඩරය මකා
conda env create -f environment.yaml
නැවත ධාවනය කිරීමට අවශ්ය වනු ඇත. එය සිදුවුවහොත්, C:\Users\(ඔබේ පරිශීලක ගිණුම)\.conda nvs වෙත සංචාලනය කර ldm ෆෝල්ඩරය මකන්න, ඉන්පසු පෙර විධානය ක්රියාත්මක කරන්න.අපි ධාවනය කළ රේඛා මඟින් “ldm” නමින් නව පරිසරයක් නිර්මාණය කරන ලදී, ස්ථායී විසරණය සඳහා අවශ්ය සියලුම පයිතන් පුස්තකාල බාගත කර ස්ථාපනය කර, ldm පරිසරය සක්රිය කර, පසුව නාමාවලිය නව ෆෝල්ඩරයකට වෙනස් කළේය. අපි ස්ථාපනය කිරීමේ අවසාන අදියරේ සිටිමු. ගොනු එක්ස්ප්ලෝරර් හි C:\stable-diffusion\stable-diffusion-main\models\ldm\stable-diffusion-v1 වෙත සංචාලනය කරන්න, ඉන්පසු මුරපොල ගොනුව (sd-v1-4.ckpt) ෆෝල්ඩරයට පිටපත් කර අලවන්න.
ගොනුව මාරු කිරීම අවසන් වන තෙක් රැඳී සිටින්න, sd-v1-4.ckpt දකුණු-ක්ලික් කර නැවත නම් කරන්න ක්ලික් කරන්න. උද්දීපනය කළ කොටුව තුළ model.ckpt ටයිප් කරන්න, පසුව ගොනු නාමය වෙනස් කිරීමට Enter ඔබන්න.
එපමණයි - අපි ඉවරයි. අපි දැන් ඇත්ත වශයෙන්ම ස්ථායී විසරණය භාවිතා කිරීමට සූදානම්.
ස්ථායී විසරණය භාවිතා කරන්නේ කෙසේද
අප විසින් නිර්මාණය කරන ලද ldm පරිසරය අත්යවශ්ය වන අතර, ඔබට ස්ථායී විසරණය භාවිතා කිරීමට අවශ්ය ඕනෑම අවස්ථාවක එය සක්රිය කළ යුතුය. Miniconda3 කවුළුව තුළට
conda activate ldm
ඇතුළත් කර “Enter” ඔබන්න. වම් පස ඇති (ldm) ldm පරිසරය සක්රීය බව පෙන්නුම් කරයි.එවිට අපට කිසියම් රූපයක් උත්පාදනය කිරීමට පෙර නාමාවලිය (මෙම විධානය
cd
) “C:\stable-diffusion\stable-diffusion-main” ලෙස වෙනස් කළ යුතුය. විධාන රේඛාවටcd C:\stable-diffusion\stable-diffusion-main
අලවන්න.ස්ථායී විසරණයෙන් රූපයක් සාදා ගන්නේ කෙසේද
අපි පෙළ විමසුම් 512×512 රූප බවට පරිවර්තනය කිරීමට ඉඩ සලසන ස්ක්රිප්ට්, txt2img.py අමතන්නෙමු. මෙන්න උදාහරණයක්. සෑම දෙයක්ම නිවැරදිව ක්රියාත්මක වන බව සහතික කර ගැනීමට මෙය උත්සාහ කරන්න:
python scripts/txt2img.py --prompt "a close-up portrait of a cat by pablo picasso, vivid, abstract art, colorful, vibrant" --plms --n_iter 5 --n_samples 1
ඔබගේ කොන්සෝලය පින්තූර නිපදවන බැවින් ඔබට ප්රගති දර්ශකයක් ලබා දෙනු ඇත.
එම විධානය C:\stable-diffusion\stable-diffusion-main\outputs xt2img-samples\samples හි පිහිටා ඇති cat images පහක් නිපදවනු ඇත.
එය පරිපූර්ණ නොවේ, නමුත් එය පැහැදිලිවම පැබ්ලෝ පිකාසෝගේ ශෛලියට සමාන වේ, අප විමසුමේ සඳහන් කළ ආකාරයටම. ඔබේ පින්තූර සමාන විය යුතු නමුත් අනිවාර්යයෙන්ම සමාන නොවිය යුතුය.
ඔබට උත්පාදනය වන රූපය වෙනස් කිරීමට අවශ්ය ඕනෑම වේලාවක ඔබට
--prompt
පහත දැක්වෙන ද්විත්ව උද්ධෘත ලකුණුවල අඩංගු පෙළ වෙනස් කිරීමට අවශ්ය වේ.python scripts/txt2img.py --prompt "YOUR, DESCRIPTIONS, GO, HERE" --plms --n_iter 5 --n_samples 1
මායාකාරියගේ තොප්පියක් පැළඳ ඉන්ද්රජාලික වනාන්තරයක යථාර්ථවාදී පෙනුමක් ඇති ගෝපර් කෙනෙක් ජනනය කිරීමට අපට අවශ්ය වූ බව පවසන්න. අපට විධානය උත්සාහ කළ හැකිය:
python scripts/txt2img.py --prompt "a photograph of a gopher wearing a wizard hat in a forest, vivid, photorealistic, magical, fantasy, 8K UHD, photography" --plms --n_iter 5 --n_samples 1
එය ඇත්තෙන්ම ඉතා පහසුයි - ඔබට අවශ්ය දේ ඔබට හැකි තරම් විස්තර කරන්න. ඔබට ඡායාරූප යථාර්ථවාදී යමක් අවශ්ය නම්, යථාර්ථවාදී රූපයකට අදාළ නියමයන් ඇතුළත් කිරීමට වග බලා ගන්න. ඔබට නිශ්චිත කලාකරුවෙකුගේ විලාසයෙන් ආභාෂය ලබා ගැනීමට අවශ්ය නම්, කලාකරුවා සඳහන් කරන්න.
ස්ථාවර විසරණය ආලේඛ්ය චිත්ර සහ සතුන්ට පමණක් සීමා නොවේ, එය සිත් ඇදගන්නාසුළු භූ දර්ශන ද නිර්මාණය කළ හැකිය.
විධානයේ ඇති තර්ක වලින් අදහස් කරන්නේ කුමක්ද?
ඔබේ ප්රතිඵල අභිරුචිකරණය කිරීමට ඔබට සැපයිය හැකි අතිවිශාල සැකසුම් සහ තර්ක ප්රමාණයක් ස්ථායී විසරණය සතුව ඇත. සාමාන්ය සූදු පරිගණකයක ස්ථායී විසරණය ක්රියාත්මක වන බව සහතික කිරීම සඳහා මෙහි ඇතුළත් කර ඇති කිහිපයක් මූලික වශයෙන් අවශ්ය වේ.
- –plms — පින්තූර නියැදිය යුතු ආකාරය සඳහන් කරයි. ඔබට ගණිතය පරීක්ෂා කිරීමට අවශ්ය නම් ඒ ගැන පත්රිකාවක් ඇත.
- –n_iter — එක් එක් විමසුම සඳහා ඔබට උත්පාදනය කිරීමට අවශ්ය පුනරාවර්තන ගණන නියම කරයි. 5 යනු ඔබට ලැබෙන ප්රතිඵල මොනවාදැයි බැලීමට සුදුසු අංකයකි.
- –n_samples — උත්පාදනය කරනු ලබන සාම්පල ගණන සඳහන් කරයි. පෙරනිමිය 3 වේ, නමුත් බොහෝ පරිගණකවල එයට සහය දැක්වීමට ප්රමාණවත් VRAM නොමැත. ඔබට එය වෙනස් කිරීමට නිශ්චිත හේතුවක් නොමැති නම් 1 සමඟ රැඳී සිටින්න.
ඇත්ත වශයෙන්ම, ස්ථාවර විසරණයට ඔබේ ප්රතිඵල වෙනස් කිරීමට ක්රියාත්මක කළ හැකි විවිධ තර්ක රාශියක් ඇත. ඔබට භාවිතා කළ හැකි විස්තාරක ලැයිස්තුවක් ලබා ගැනීමට
python scripts/txt2img.py --help
ධාවනය කරන්න.විශිෂ්ට ප්රතිඵල ලබා ගැනීම සඳහා අත්හදා බැලීම් සහ දෝෂයන් ටොන් ගණනක් ඇත, නමුත් එය අවම වශයෙන් විනෝදයෙන් අඩක් වේ. ඔබ කැමති ප්රතිඵල ලබා දෙන තර්ක සහ විස්තර ලිවීමට හෝ සුරැකීමට වග බලා ගන්න. ඔබට සියලු අත්හදා බැලීම් ඔබම කිරීමට අවශ්ය නැතිනම්, පින්තූර හුවමාරු කර ගැනීමට සහ ඒවා උත්පාදනය කළ විමසීම් සඳහා කැප වූ Reddit (සහ වෙනත් තැන්වල) ප්රජාවන් වර්ධනය වේ.