DreamBooth

DreamBooth – bul bar bolǵan tekstten súwretke modellerin názik sazlaw arqalı jekeletistiriw ushın qollanılatuǵın tereń oqıtıw generativ modeli. Ol 2022-jılı Google Research hám Boston Universiteti izertlewshileri tárepinen islep shıǵıldı. Dáslep Googledıń óz Imagen tekstten súwretke modeli járdeminde islep shıǵılǵan DreamBooth ámelge asırıwları basqa tekstten súwretke modellerine qollanılıwı múmkin, bul jerde ol modelge bir obyektiń úsh-bes súwretinde oqıtılǵannan keyin dálirek sazlanǵan hám jekelestirilgen nátiyjeler jaratıwǵa múmkinshilik beredi.[1][2]
Texnologiya
Aldınnan oqıtılǵan tekstten súwretke diffuziya modelleri, kóbinese túrli súwret shıǵarıw tipleriniń keń túrliligin usına alatuǵın bolsa da, azǵana belgili obektlerdiń súwretlerin jaratıw ushın talap etiletuǵın anıqlıqqa iye emes, hám belgili obektlerdi túrli jaǵdaylarda hám kontekstlerde súwretlew qábileti sheklengen. DreamBooth ámelge asırıwların iske qosıw ushın qollanılatuǵın metodologiya diffuziya modeliniń tolıq UNet komponentin belgili bir obyektti súwretleytuǵın birneshe súwret (ádette 3-5) járdeminde dál sazlawdı óz ishine aladı. Súwretler obyektiń tiyisli bolǵan klassınıń atın, sonday-aq unikal identifikatorı bar tekstli usınıslar menen juplastırıladı. Mısalı, [Nissan R34 GTR] avtomobiliniń fotosúwreti, bunda «avtomobil» klass bolıp tabıladı; modeldiń dáslepki klass ushın aldınnan oqıtılǵan maǵlıwmatlarına tiykarlanıp obyektiń túrli nusqaların jaratıwın xoshametlew ushın klassqa tán aldınǵı saqlaw joǵaltıwı qollanıladı. Kiris súwretler toplamınan alınǵan tómen anıqlıqtaǵı hám joqarı anıqlıqtaǵı súwretler juplıǵı super-anıqlıq komponentlerin dál sazlaw ushın qollanıladı, bul obyektiń mayda detallarınıń saqlanıwına múmkinshilik beredi.
Qollanıw
DreamBooth Stable Diffusion sıyaqlı modellerdi dál sazlaw ushın qollanılıwı múmkin, bunda ol Stable Diffusionniń belgili jeke adamlardıń súwretlerin jetkilikli dárejede jarata almawı sıyaqlı ulıwma kemshilikti jeńilletiwi múmkin.[3] Biraq, bunday qollanıw jaǵdayı VRAM-ǵa júdá talapshań bolǵanlıqtan, hobbist paydalanıwshılar ushın qımbatqa túsedi. Ásirese, DreamBoothtıń Stable Diffusion ushın beyimlesiwi 2022-jılı Ruis hám basqalar tárepinen járiyalanǵan dáslepki maqalada kórsetilgen texnologiyaǵa tiykarlanǵan biypul hám ashıq kodlı proekt retinde shıǵarıldı.[4] Jaman niyetli adamlar DreamBoothtı zıyanlı maqsetlerde adastırıwshı súwretler jaratıw ushın qollanıwı múmkinligi hám onıń ashıq kodlı tábiyatı hár kimge bul texnologiyanı qollanıwǵa yamasa hátte jetilistiriwler kirgiziwge múmkinshilik bergenligi haqqında alańlawlar bildirildi.[5] Bunnan tısqarı, súwretshiler DreamBoothtı adam súwretshileri menen baylanıslı belgili bir kórkem óner stillerin imitaciya qılıwǵa arnalǵan model tekseriw noqatların oqıtıw etikasınan qáweterlerin bildirdi; sonday sınshılardıń biri – Disney hám Penguin Random House ushın súwretshi bolǵan Holli Mengert, onıń kórkem óner stili DreamBooth arqalı tekseriw noqatı modeline oqıtılǵan hám onıń kelisimisiz onlayn bólisilgen.[6][7]
Derekler
- ↑ Yuki Yamashita. «愛犬の合成画像を生成できるAI 文章で指示するだけでコスプレ 米Googleが開発» (ja). ITmedia Inc. (1-sentyabr 2022-jıl). — „米Google Researchと米ボストン大学の研究チームが開発した...数枚の被写体画像とテキスト入力を使って、与えられた被写体が溶け込んだ新たな合成画像を作成する被写体駆動型Text-to-Imageモデルだ。“. 31-avgust 2022-jılda túp nusqadan arxivlendi.
- ↑ Brendan Murphy. «AI image generation is advancing at astronomical speeds. Can we still tell if a picture is fake?». The Conversation (13-oktyabr 2022-jıl). — „Recently, Google has released Dream Booth, an alternative, more sophisticated method for injecting specific people, objects or even art styles into text-to-image AI systems.“. 30-oktyabr 2022-jılda túp nusqadan arxivlendi.
- ↑ Ryo Shimizu. «まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?» (ja). Yahoo! News Japan (26-oktyabr 2022-jıl). — „Stable Diffusionは、一般に個人の写真や特定の人物を出すのが苦手だが、自分のペットや友人の写真をわずかな枚数から学習させる「Dreambooth」という技術が開発され、これも話題を呼んだ。ただし、Dreamboothでは、巨大なGPUメモリが必要になり、個人ユーザーが趣味の範囲で買えるGPUでは事実上実行不可能なのがネックとされていた。“. 26-oktyabr 2022-jılda túp nusqadan arxivlendi.
- ↑ Benj Edwards. «AI image generation tech can now create life-wrecking deepfakes with ease». Ars Technica (9-dekabr 2022-jıl). — „But not long after its announcement, someone adapted the Dreambooth technique to work with Stable Diffusion and released the code freely as an open source project.“. 12-dekabr 2022-jılda túp nusqadan arxivlendi.
- ↑ Kevin Jiang. «These AI images look just like me. What does that mean for the future of deepfakes?». Toronto Star (1-dekabr 2022-jıl). — „For example, DreamBooth could be used to copy signatures or official signage to fake documents, create misleading photos or videos of politicians, manufacture revenge porn of individuals and more... A specific issue with DreamBooth and Stable Diffusion is that they’re open source, Gupta continued. Unlike centralized AI-generation models that can impose regulations and barriers to image creation, the decentralized models like DreamBooth mean anyone can access and improve on the technology.“. 8-dekabr 2022-jılda túp nusqadan arxivlendi.
- ↑ Isabel Berwick. «Will AI replace human workers?». Financial Times (14-dekabr 2022-jıl). — „Illustrator Hollie Mengert, whose artwork was used to train an AI model without her consent, spoke publicly against the practice of training AI models on artists’ work without permission.“.
- ↑ «Генеративные нейросети и этика: появилась модель, копирующая стиль конкретного художника» (ru). DTF (9-noyabr 2022-jıl). — „Так, совсем недавно известная художница и иллюстратор Холли Менгерт стала своеобразным датасетом для новой нейросети (не давая на то согласия)... «В первую очередь мне показалось бестактным то, что моё имя фигурировало в этом инструменте. Я ничего о нём не знала и меня об этом не спрашивали. А если бы меня спросили, можно ли это сделать, я бы не согласилась».“. 9-noyabr 2022-jılda túp nusqadan arxivlendi.