OpenAI болон Microsoft нь Val-E-ийг хэрэгжүүлдэг

OpenAI болон Microsoft хэрэгжүүлснээр хиймэл оюун ухаанд Google-тэй тулалдаанаа үргэлжлүүлээрэй Валл-Э, шинэ дуут чатбот. Энэ нь хүний дуу хоолойг сонсоод гуравхан секундын дараа дуурайж чаддаг ярианы синтезийн программ юм.

Өөрөөр хэлбэл, энэ нь Microsoft болон OpenAI-ийн бүтээсэн хиймэл оюун ухааны системийн хамгийн сүүлийн үеийн хэсэг бөгөөд 2019 оноос хойш ... Билл Гейтс олон жилийн хугацаатай холбоотой, олон тэрбум долларын түншлэл.

Vall-E: OpenAI болон Microsoft-ын шинэ чатботын талаарх бүх мэдээлэл

Valle-E бол AGI-ийн хэрэгсэл юм. Хиймэл ерөнхий оюун ухаан, өөрөөр хэлбэл хүний оюун ухааныг дуурайж чадах "ерөнхий" эсвэл "хүчтэй" хиймэл оюун ухаан. Тиймээс бидний өнөөг хүртэл мэдэж байгаа "нарийн" эсвэл "сул" хиймэл оюун ухаанаас ялгаатай.

Сүүлийнх нь тодорхой даалгаварт урьдчилан тогтоосон үйлдлээр хариу өгөх чадвартай боловч төлөвлөөгүй үйлдэлд хариу үйлдэл үзүүлэхгүй. Сүүлийн жилүүдэд хиймэл оюун ухааны чатботууд нь жижиг ажлуудаар хязгаарлагдаж, алдааны түвшин өндөр байсан тул бүтээгчдийнх нь төсөөлж байсан шиг сайн ажиллаж чадаагүй байна.

Valle-E-тэй хамт хэрэглэхээр бүтээгдсэн Өндөр чанартай ярианы синтезийн хэрэгслүүд болон жишээ түүврээс эх аудио үүсгэх. OpenAI-г Valle-E гэж тодорхойлдог "байгалийн кодек хэлний загвар" хэмээх технологид тулгуурлан үйл ажиллагаа явуулдаг тул InCodec.

Санхүүжүүлсэн стартап Елон Баданга болон Сэм Алтман, бусад зүйлсээс гадна өмнөх үйлдлүүд болон урьд өмнө тохиолдсон үйлдлүүдийг санаж, суралцан хэрэглэгчидтэй харилцан яриа өрнүүлэх боломжтой ChatGPT чатбот бүтээснээрээ сайрхаж байна.

Тиймээс, яг адил GPT чат бие даан код үүсгэх чадвартай, Valle-E нь аудио дээжийг сонсохоос тусдаа аудио кодлогч үүсгэх зориулалттай.

Яг хүн шиг биеэ авч явах.

Хамт GPT-3 текст болон Dall-E/Тогтвортой тархалт зургийн хувьд Valle-E аудио систем нь ChatGPT триптичийг гүйцээж, зургийн салбарт хувьсгал хийхийг зорьдог. үүсгэгч AI.

Speaker Prompt, Ground Truth, Baseline болон Vall-E.

OpenAI болон Microsoft-ын гаргасан шинэ хэрэгслийн боловсронгуй байдал нь Valle-E-ийн таних чадварт оршдог. тембр, уянга, сэтгэл хөдлөлийн өнгө ярьж байгаа хүний тухай, сонссоны дараа гуравхан секундын дараа дахин тоглуул.

Програмууд аудио засварлах Програм хангамжийг залилан, буруугаар ашиглах боломжтой гэсэн шүүмжлэлүүд олон байдаг. ChatGPT-д тохиолдсон үйл явдлаас ялгаатай нь Microsoft нь Vall-E кодыг бусдад туршиж үзэхэд зориулж өгөөгүй нь гайхах зүйл биш юм.

Програм хангамжийн аль хэдийн нэгтгэсэн ярианы дээжийг Valle-E сайтаас олж болно. Ялангуяа түүврийн хэд хэдэн хувилбарыг сонсож болно, үүнд: Speaker Prompt, Ground Truth, Baseline, and Vall-E.

Эхний сонголт бол ярианы утгыг хиймэл оюун ухаанаар хуулбарлах ёстой аудио клип юм; хоёрдугаарт, хиймэл оюун ухаан харьцуулах санал гаргах ёстой өгүүлбэрийг хэлсэн. Нөгөө талаас, гурав дахь нь одоо байгаа ярианы синтезийн технологиор бүтээгдсэн жишээ юм. Эцэст нь хэлэхэд, Vall-E бол Microsoft-ын програм хангамжаар үүсгэсэн анхны яриа юм.

OpenAI болон Microsoft-ын хиймэл оюун ухааны боломж ба аюул.

Microsoft болон OpenAI-ийн судлаачид энэ технологийн хор хөнөөлийг мэддэг бололтой. Үнэндээ тэд олон нийтийн хэвлэлд дараахь зүйлийг мэдэгдэв.

"Vall-E нь чанга яригчийн хувийн шинж чанарыг агуулсан яриаг нэгтгэж чаддаг тул ийм технологи нь дуу хоолойг хуурах, хэн нэгний дүрд хувирах зэрэг загварыг зохисгүй ашиглахтай холбоотой эрсдэлийг үүсгэж болзошгүй юм."

Тиймээс ийм эрсдэлийг бууруулахын тулд Vall-E-ээр аудио клипийг нэгтгэсэн эсэхийг ялгах илрүүлэх загварыг бий болгож болно гэж Майкрософт нэмж хэлэв. Үүнтэй холбогдуулан хоёр аварга компани цаашдын загварыг хөгжүүлэх явцад Microsoft-ын хиймэл оюун ухааны зарчмуудыг хэрэгжүүлэх болно.

Гэсэн хэдий ч эмуляци хийх эрсдэл нь эргэлзээ, айдас төрүүлдэг цорын ганц хүчин зүйл биш юм. Vall-E-г хийсэн LibriLight аудио санг ашиглан сургасан Метаагуулсан 60 мянга Англи хэл дээрх олон цагийн яриаг сайн дурынхан уншсан, олон нийтийн домэйн аудио номноос авсан.

Ямар ч байсан синтезийн хүчин чадлаа нэмэгдүүлэхийн тулд Vall-E сургалтын сангаа интернетэд бүхэлд нь өргөжүүлэх шаардлагатай болно. Энэхүү дараагийн алхам нь ChatGPT-ийн өмнөх GPT-3-д хүрэх боломжийг олгосон зүйл юм гайхалтай өгүүлбэр боловсруулах, бичих, угсрах чадвар.

Гэсэн хэдий ч энэ програм хангамж нь бүхэл бүтэн вэбээс ялгахгүйгээр авсан жишээн дээр ажиллаж байсан тул хүчирхийлэл, хүйсээр ялгаварлан гадуурхах, арьс өнгөөр ялгаварлан гадуурхах контентыг боловсруулах хандлагатай байсан. Энэ нь шинэ Vall-E-д тохиолдож болох зүйл юм.

Энэ тохиолдолд шүүлтүүрийн үйл ажиллагаанд олон тооны боловсон хүчнийг ашиглах шаардлагатай бөгөөд одоогоор том технологид нөлөөлж буй цомхотголын давалгааг харгалзан томоохон дижитал аваргууд үүнийг урьдчилан таамаглаагүй бололтой.

Google OpenAI болон Microsoft-той өрсөлдөхийн тулд Bard-ыг танилцууллаа

Урьдчилан таамаглаж байсанчлан Microsoft болон OpenAI-тай өрсөлдөж буй Google компани нээлтээ хийх гэж байна Бард, чатбот Deepmind, Google-ийн худалдан авсан компани Alphabet. Бард нь ChatGPT-ийн яг хуулбар шиг харагдаж байгаа боловч шинэчлэлтийн алдаагүй.

Sundar Pichai, Google-ийн гүйцэтгэх захирал шинэ программ хангамжийг вэбээс мэдээлэл авч, шинэ, өндөр чанартай хариулт өгөх хэрэгсэл болгон танилцуулсан. "Шинэ" гэдэг нь Microsoft-ын хиймэл оюун ухаан одоог хүртэл хийж чадахгүй байгаа зүйлийг тасралтгүй шинэчилж байх гэсэн үг юм.

Товчхондоо, Бард энгийн асуултуудад дэлгэрэнгүй хариулт өгөхийг зорьдог. Түүний үйл ажиллагаа нь дээр суурилдаг ЛаМДА, Google-ийн өөрийн инженерүүдийн нэг нь өмнө нь "мэдрэмжтэй" гэж тодорхойлсон яриа хэлцлийн хэрэглээний хэлний загвар юм.

Google-ээс Bard-ийн нээлтийн тухай зарлалыг технологи сонирхогчид хүлээж байсныг үгүйсгэх аргагүй. Эцсийн эцэст, мэдээллийн дагуу Wall Street Journal, Google-ийн толгой компани болох Alphabet нь илүү их хөрөнгө оруулалт хийсэн 31 тэрбум $ 2021 онд хиймэл оюун ухаанд бусад өрсөлдөгчөөсөө илүү.

ChatGPT амжилттай болсны дараа компани хамгийн шилдэг үүсгэн байгуулагчдыг дуудахаар шийджээ Ларри Пэйж, Сергей Брин нар. Ямартай ч хиймэл оюун ухааны программ хангамж нь инновацийн салбарт үнэлж баршгүй нөөц болдог нь эргэлзээгүй.

Нээрээ ч гэсэн Амазон, Мета, Apple арга хэмжээ авахгүйгээр бусдын юу хийж байгааг хараад зүгээр суухгүй нь лавтай. Гэсэн хэдий ч өрсөлдөөн нь судалгааны хувьд гайхалтай хурдасгагч боловч шилдэг хиймэл оюун ухааны төлөөх уралдаанд алдаатай, хязгаарлалттай, эрсдэлтэй алдаатай системийг том зураг руу хэт их анхаарал хандуулахгүйгээр ашиглах эрсдэлтэй байдаг.

Эх сурвалж: https://en.cryptonomist.ch/2023/02/14/openai-microsoft-implement-vall-e/