Шинэ Al Generative Art-ийн дүр төрх

Al Generative Art Энэ бол хүн төрөлхтөн ба бие даасан тогтолцооны хамтын ажиллагаанд тулгуурласан ихэнх тохиолдолд дүрслэх урлагийн төрөл юм. "Автоном систем" гэж тодорхойлогддог Хиймэл оюун Програмистын оролцоогүйгээр нарийн төвөгтэй үйлдлүүдийг гүйцэтгэх чадвартай программ хангамж, алгоритм эсвэл загвар.

Бүтээсэн хачин жигтэй зургуудаас Dall-E Mini нь NFT зах зээл дээр хиймэл оюун ухааны алгоритмаар бүтээгдсэн зургууд ерөнхий төсөөлөлд улам бүр орж байна. Үнэн хэрэгтээ энэ сэдвээр дүн шинжилгээ хийх ёстой хоёр чухал төсөл бол: Замын дунд болон DALL-E2.

Мэдээжийн хэрэг, энэ мэдээ Twitter-д ч мөн адил газар авсан. Энэ талаар бусад хүмүүсийн дунд Чарльз Хоскинсон тайлбар хийжээ.

Al Generative Art: эртний туршилтууд ба онцлогууд

Generative Art гэж юу болохыг ойлгосны дараа түүний үүсгэн байгуулах зарчмуудын нэгийг онцлон тэмдэглэх нь зүйтэй. санамсаргүй байдал. Энэ нь Генератив урлагийн үндсэн өмч юм.

Үнэн хэрэгтээ, програм хангамжийн төрлөөс хамааран автономит систем нь үүсгэх командыг гүйцэтгэх бүрд үргэлж өөр, өвөрмөц байдаг үр дүнг боловсруулах эсвэл хэрэглэгчийн оруулсан хариуд хувьсах тооны үр дүнг буцааж өгөх боломжтой.

Generative Art-ийн анхны туршилтууд нь 1960-аад оны туршилтуудаас үүдэлтэй Харолд Коэн мөн түүний ААРОН хөтөлбөр. Коэн анх Поп урлагийн торгон дэлгэцээс санаа авсан хийсвэр урлагийн бүтээлүүдийг бүтээхийн тулд бие даасан программ хангамжийг ашигласан. Коэний бүтээлүүд одоо Лондон дахь Тейт галерейд дэлгэгдэж байна.

Generative Art-ийн өөр нэг шинж чанар, гэхдээ бага багаар онцгой эрх мэдэл нь программистын өгсөн загвар эсвэл хийсвэр элементүүдийг давтаж, програм хангамжийн кодын хүрээнд хэрэгжүүлдэг.

Нэмж дурдахад, текст дүрсийн холбоонд ажилладаг улам бүр нарийн төвөгтэй мэдрэлийн сүлжээг хөгжүүлэх нь улам бүр бодитой, үнэн зөв дүрсийг бүтээх чадвартай үүсгэгч загваруудыг хөгжүүлэх боломжийг олгосон. Генератив урлагийн энэ ангиллын хамгийн алдартай жишээ бол Далл-Э.

Dall-E нь олон модаль мэдрэлийн сүлжээ юм GPT-3 -аас гүнзгий суралцах загвар Нээлттэй байна, мөн саяхан бий болсон компани GPT чат, чатбот нь 2022 оны XNUMX-р сард гарч, оновчтой болгосон "хяналттай" болон бататгах сургалтын арга техник.

Dall-E руу буцаж ирэхэд энэ систем нь текстийн тайлбараас зураг үүсгэх чадвартай болохыг бид харж байна. "Шуурхай", текст-зураг хосын өгөгдлийн багц дээр үндэслэсэн.

2021 оны 3-р сард олон нийтэд танилцуулагдсан Dall-E-ийн анхны хувилбар нь энэ салбарын цөөн тооны мэргэжилтнүүдийн эрх мэдэлд үлдсэн нь GPT-ийн шинэчлэлээс давж, энэ төрлийн үүсгэгч загварын хувьд жинхэнэ хувьсгал болсон юм. XNUMX өөрөө.

Dall-E-ийн боловсруулсан үр дүнгийн нарийвчлал нь OpenAI-ийн өөр шийдлийн төгс цар хүрээ болж чадсан нь бас чухал юм. КЛИП (Төрсөгч хэл-Зургийн өмнөх бэлтгэл).

Интернэтээс олдсон тайлбар гэх мэт текст-зургийн холбоонд тулгуурлан сургагдсан зургийн ангилал, зэрэглэлийн мэдрэлийн сүлжээ. CLIP-ийн хөндлөнгийн оролцооны ачаар хэрэглэгчдэд санал болгож буй үр дүнгийн тоог 32 болгон бууруулж, Dall-E ихэнх тохиолдолд сэтгэл ханамжтай зургуудыг буцаадаг болохыг тогтоожээ.

Дундаж аялал: дизайн, хүний ​​дэд бүтэц, хиймэл оюун ухаан

Урьдчилан таамаглаж байснаар, Замын дунд нь шинээр гарч ирж буй Al Generative Art үзэл баримтлалын нэг хэсэг болох чухал төсөл юм. Тодруулбал, Midjourney нь хүний ​​төрөл зүйлийн сэтгэн бодох чадварыг өргөжүүлж, сэтгэн бодох шинэ арга хэрэгслийг судалдаг бие даасан судалгааны лаборатори юм.

Үүнийг ашиглах нь энгийн: эхлээд данс үүсгэх ёстой Discord, янз бүрийн нийгэмлэгүүдийг зохион байгуулдаг платформ бөгөөд Midjourney нь тэдний нэг юм. Хэрэглээний дотор хэлэлцүүлэгт идэвхтэй оролцох эсвэл оролцохгүй байх янз бүрийн чат өрөөнүүд байдаг.

Хиймэл оюун ухааныг анх удаа ашиглах гэж оролдохын тулд заавал очиж үзэх хэрэгтэй гэдгийг хэлэх нь чухал юм "шинэхэн" сувгууд, хаана 25 үнэгүй дүрслэл боломжтой байна.

Нэг дүрслэл нь ижил текстийн оролтоор үүсгэгдсэн дөрвөн өөр хувилбарыг үүсгэхэд тохирно.

Тиймээс 25 дүрслэл нь Midjourney роботын гүйцэтгэсэн 25 боловсруулалтын ажлыг илэрхийлдэг. Тиймээс зураг үүсгэхийн тулд Midjourney bot-тай “prompt” хэмээх текст мессежээр харилцах шаардлагатай бөгөөд үүнд хэрэглэгчийн санасан дүрсийг дүрсэлсэн түлхүүр үгс байх болно.

Та хүссэн хэмжээгээрээ дэлгэрэнгүй мэдээлэл нэмж болно, гол зүйл бол түлхүүр үгсийг таслалаар хуваах явдал юм. Тайлбар хийж дууссаны дараа компьютер нь сонгох тайлбар дээр үндэслэн дөрвөн өөр зургийг буцаана.

Нэмж дурдахад, програмыг үзүүлж дууссаны дараа та зураг дээр үндэслэн өөрийн сонголтоо хэлж, хэрэв хүсвэл дахин дөрвөн хувилбар үүсгэх боломжтой.

DALL-E 2: урлагийн бүтээлд зориулсан шинэ хиймэл оюун ухааны систем

Midjourney-ээс гадна DALL-E 2 нь байгалийн хэлээр дүрсэлсэн бодит зураг, урлагийн бүтээлүүдийг бүтээх боломжтой хиймэл оюун ухааны шинэ систем юм. Үүгээр зогсохгүй DALL-E 2 нь ойлголт, шинж чанар, хэв маягийг хослуулж чаддаг.

Шинэ хиймэл оюун ухааны системийн давуу тал нь зургийг анхны зурагт байгаа хэмжээнээс хэтрүүлэн өргөжүүлж, зураг бүтээх чадвартайд оршдог. шинэ өргөн бүрэлдэхүүнтэй. Нэмж дурдахад, энэ нь байгалийн хэл дээрх тайлбараас одоо байгаа зургуудад бодитой өөрчлөлт хийж, сүүдэр, тусгал, бүтэц зэргийг харгалзан элементүүдийг нэмж, хасах боломжтой.

DALL-E 2-ын чадамжид мөн зураг авах, эх хувилбараас нь санаа авсан хэд хэдэн хувилбарыг бүтээх зэрэг багтана. DALL-E 2 нь зураг болон тэдгээрийг дүрслэх текстийн хоорондын хамаарлыг олж мэдсэн.

гэж нэрлэгддэг процессыг ашигладаг "тархалт" Энэ нь санамсаргүй цэгүүдийн хээгээр эхэлж, тухайн зургийн тодорхой талыг таних үед зураг руу аажмаар өөрчлөгддөг.

Тиймээс, OpenAI 2021 оны 2-р сард DALL-E-г нэвтрүүлсний дараа одоо хамгийн сүүлийн үеийн систем болох DALL-E XNUMX нь дөрөв дахин илүү нарийвчлалтай, илүү бодитой, үнэн зөв дүрсийг үүсгэдэг.

DALL-E 2 нь судалгааны төслөөр эхэлсэн бөгөөд одоо ашиглах боломжтой бета хувилбар. Системийн хөгжүүлж, сайжруулсаар байгаа аюулгүй байдлын бууралтад: системийн хүчирхийлэл, үзэн ядалт, насанд хүрэгчдэд зориулсан дүр төрхийг бий болгох чадварыг хязгаарлах, суралцахад суурилсан үе шаттайгаар байршуулах зэрэг орно.

Эх сурвалж: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/