Машины дууны шинэ хиймэл оюун ухаан нь зөвхөн аялгуунаас ч илүү сайжирч магадгүй юм

Холливуд хиймэл оюун ухаан (AI)-ыг санамсаргүй хүмүүсийг орлож, хурцадмал, гол зөрчилдөөнийг бий болгодог дистопи роботуудын үйл ажиллагааны давхарга гэж олон жилийн турш дүрсэлсээр ирсэн. Спилбергийн гэссэн, үерт автсан далайн эрэг орчмын хотуудын ертөнц дэх өөрийгөө мэддэг, хиймэл хүүхэд Дэвидийн дүрд залуу Хейли Жоэл Осмент тоглож байна гэж төсөөлж болно (танил сонсогдож байна уу?) AI: Хиймэл оюун ухаан хэн (спойлер анхааруулга) зөвхөн өөрийгөө хөнөөдөг. Эсвэл та Робин Уильямсын дууг санаж байгаа байх Bicentennial Хүн ахин нэг удаа өөрийгөө мэддэг робот хөгжихийг оролдсон (дахин хорлон сүйтгэгч дохиогоор) эцэст нь түүний цорын ганц хохирогч болж байна. Мэдээжийн хэрэг, бараг л хэвшмэл хэллэг байдаг Терминатор мөн түүний хүмүүсийг устгах гэж оролдсон машинууд болон хэдэн арван жилийн турш олон хохирогчидтой (тийм ч хор хөнөөлгүй) сүйрлийн дараах ертөнц. Гэсэн хэдий ч эдгээр хувилбаруудын аль нь ч дээр хүмүүс зугаа цэнгэл, аюулгүй байдлыг сайжруулах нь бүү хэл сайжруулсан амьдралтай зэрэгцэн оршдоггүй.

Гэсэн хэдий ч энэ бол шинэ бодит байдал юм. Хиймэл оюун ухааны алгоритмуудыг аудио загварт оруулах боломжтой бөгөөд жолоодлогын туршлагыг сайжруулахын тулд агаарын шинэчлэлтүүдээр дамжуулан тасралтгүй сайжруулж болно. Холливудын эдгээр жишээнүүдтэй шууд зөрчилдөж, ийм хиймэл оюун ухаан нь хүний ​​амьд үлдэх магадлалыг сайжруулж магадгүй юм.

Зүгээр л таашаал авахын тулд

Саяхныг хүртэл бүх хэрэглэгчийн интерфэйс (UI) аудио хөгжүүлэлт зэрэг нь тээврийн хэрэгслийн стандарт гучин зургаан (36) сарын турш мэргэжилтэн кодлогчдын нарийн төвөгтэй програмчлалыг шаарддаг. Металл хуудасны загвар болон электрон хайрцагуудыг зөвхөн хөгжүүлэлтийн шатандаа бие даасан элементүүдийг тохируулахын тулд зэрэгцүүлэн боловсруулж, эх сурвалжаас гаргаж авдаг. Брэндийн дуу чимээ. Акустик гарын үсэг. Нэг ижил, цус багадалттай системийн дизайн доторх бүх тусдаа санаачлагууд үйлдвэрлэгчид хэдэн тэрбумаар үнэлэгддэг.

Гэхдээ хиймэл оюун ухаан нь аудио туршлагын загварт ойртох илүү уян хатан, үр дүнтэй аргыг бий болгосон. "Бидний харж байгаа зүйл бол чиг хандлагын нэгдэл юм" гэж DSP Concept-ийн машин сургалтын инженерийн менежер Жош Моррис хэлэв. "Аудио нь автомашинд илүү давамгайлах шинж чанар болж байгаа ч орчин үеийн процессорууд илүү их санах ой, чадавхитай болж хүчирхэгжиж байгааг та харж байна."

Үүний зэрэгцээ, системд төвлөрсөн хөгжлийн платформ, хиймэл оюун ухаан болон эдгээр хүчирхэг процессоруудыг ашиглан жолооч, зорчигчдод дасан зохицох, бодит цагийн хариу үйлдэл үзүүлэх шинэ түвшнийг өгдөг. . DSP Concept-ийн Автомашины бизнесийг хөгжүүлэх хэлтсийн дарга Стив Эрнст хэлэхдээ, "Хиймэл оюун ухаан нь боломжит хувилбар бүрт олон тооны код бичих түүхэн хэрэгцээний оронд хүрээлэн буй орчны нөхцөл байдал, үйл явдлын талаархи мэдлэгт үндэслэн системийн хариу үйлдлийг удирддаг.

Ийм сургалтын системийг ашиглах хамгийн ойлгомжтой арга бол тээврийн хэрэгслийн "дуу чимээг арилгах" бөгөөд ингэснээр өвлийн дугуйгаар сольсон эсвэл орчны бусад өөрчлөлтийг үл харгалзан дээд зэргийн аудиог тохируулж, сайжруулж болно. Гэхдээ LG Electronics нь DSP Concept-ийн Аудио Weaver дээр ажилладаг алгоритмуудыг боловсруулсан Энэхүү платформ нь арын суудалд үзвэрийн үеэр киноны ярианы яриаг кинон доторх тэсрэлтээс илүү тодотгож, дуу хоолойгоор сайжруулж, улмаар зорчигчдод чухал агуулгыг илүү сайн сонсох боломжийг олгодог.

Өөр нэг тодорхой бус тал бол брендийн аудио дууг бусад чимээ шуугиан дунд хэрхэн зохион байгуулах явдал юм. Радио болон хонхны дуу зэрэг бусад дууг автоматаар унтрааж байхад энэ машиныг асаах дарааллыг нэмэгдүүлэх шаардлагатай юу? Туршлага бүрийг тохируулах боломжтой.

Өсөх магадлалтай

Дэлхий нийтээрээ цахилгаан тээврийн хэрэгсэл болон бие даасан жолоодлоготой болж байгаа тул дуут дохионы давтамж, хэрэгцээ эрс өөрчлөгдөх магадлалтай. Жишээлбэл, автомат таксины аюулгүй байдлын инженер нь цаг тухайд нь сэрэмжлүүлэх шаардлагатай үед зорчигчдыг харааны дэлгэцийн ойролцоо байгаа гэж таамаглаж чадахгүй. Мөн энэ сэрэмжлүүлэг нь хэр сонсогдох вэ? бараг 25 сая америкчууд хөгжлийн бэрхшээлтэй Автономит тээврийн хэрэгсэл хэнд шинэ хөдөлгөөн хийх боломжийг нээх ёстой вэ? Эрнст "Одоо аудио бол зөвхөн дуртай дуугаа сонсоход зориулагдсан зүйл биш" гэж хэлэв. "Автономит жолоодлоготой бол жолоочийг хөдөлгөөнд оролцуулахгүй байх эсвэл эргэн тойронд болж буй зүйлийн талаар жолоочийг сэрэмжлүүлэхэд шаардлагатай бүх төрлийн сэрэмжлүүлэг байдаг."

DSP Concepts-ийн Маркетингийн албаны дарга Адам Левенсон хэлэхдээ: "Үүнийг илүү хэцүү болгодог зүйл бол утас, дуу чимээ, орон зайн дуу чимээ, хөдөлгүүрийн дуу чимээ, замын дуу чимээ, тээврийн хэрэгслийн дохиоллын систем. дууны систем гэх мэт. Бид хамгийн төвөгтэй аудио бүтээгдэхүүн бол машин гэж хэлэх дуртай."

Жишээлбэл, жолооч хурдны зам дээр бие даасан жолоодлогын горимыг идэвхжүүлж, аяыг нь чангалж, ойртож буй яаралтай тусламжийн машиныг үл тоомсорлодог хувилбарыг төсөөлөөд үз дээ. Тээврийн хэрэгслийн микрофоныг ашиглан дуут дохиог илрүүлэхэд ямар нарийвчлалтай (болон зайд) машин анхаарал сарнисан жолоочдоо дохио өгдөг вэ? Орчны чимээ шуугианыг даван туулах, хангалттай анхаарал тавих боловч жолоочийг шаардлагагүйгээр айлгахгүй байхын тулд энэ дохиог хэрхэн өгөх ёстой вэ? Энэ бүгдийг урьдчилан боловсруулсан загварууд, янз бүрийн дуут дохиолол бүхий урьдчилсан сургалт, дараа нь үүлэнд суурилсан тохируулгаар тохируулж болно. "Энэ бол ерөнхий зохион байгуулалт үнэхээр чухал болж байна" гэж Моррис тайлбарлав. “Бид [AI илрүүлэх] загварын гаралтыг авч, машины өөр өөр газар руу чиглүүлэх боломжтой. Магадгүй та дууг хааж, дуут анхааруулах дохио өгч, жолооч анхаарлаа хандуулахын тулд хяналтын самбар дээр ямар нэгэн зүйл анивчих болно."

Гадаад дохиоллын хувьд ч мөн адил. Жишээлбэл, чимээгүй цахилгаан машин нь явган зорчигчдод зориулсан дохиололтой байж болно. Тиймээс шинэ шалгалт тохируулгыг офлайнаар үүсгэж, идэвхжүүлсэн инновацид суурилсан програм хангамжийн шинэчлэлт болгон тээврийн хэрэгсэлд татаж авах боломжтой.

Хаа сайгүй инноваци. Хиймэл оюун ухаан нь Холливудын дистопи ертөнцийг бий болгохоос илүүтэйгээр утопи туршлагыг тэжээдэг.

Зохиогчийн таамаглал

Долоо хоногийн талаарх миний таамаглал энд байна (энэ бол зөвхөн Мягмар гараг шүү дээ, хүмүүсээ): аудионы дараагийн хувьсал нь бодит цагийн хэрэглэгчдийн таашаал ханамжийг багтаасан бүрэн, агшин зуурын санал хүсэлтийг агуулсан байх болно. Тийм ээ, одоогийн дизайны ихэнх нь туршлагыг сайжруулж магадгүй ч Хэрэглэгч төвтэй дизайн (UCD) -ийн байнгын тохируулга нь зорчигчдын илэрхийлэл, биеийн хэлэмж, сэтгэгдлүүд дээр үндэслэн нэмэлт сайжруулж, ингэснээр сэтгэл ханамжийг бодит цаг хугацаанд тус тусад нь тохируулж болно. Камер, хиймэл оюун ухаан, процессорууд болон дасан зохицох платформ зэрэг бүх идэвхжүүлэгчид байдаг.

Тийм ээ, бид өмнө нь сонсож байсан дасан зохицох сэтгэлийн гэрэлтүүлэг Аюулгүй байдлыг сайжруулахын тулд уйтгар гуниг, стресс гэх мэтийг алсаас илрүүлдэг боловч хэрэглэгчийн чиглүүлсэн бүх мэдрэгчийн бодит цагийн, суралцах алгоритм дээр тулгуурласан хосолсон туршлагыг сайжруулдаг зүйл байхгүй.

Магадгүй би хэт их экстраполяци хийж байгаа байх. Гэхдээ яг л Робин Уильямсын дүртэй адил би хоёр зуун жилийг туулсан... тиймээс би ч бас хүн төрөлхтний юу хүсч байгааг мэдэрдэг байх.

Эх сурвалж: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/