ភាពវៃឆ្លាត​សិប្បនិម្មិត​ថ្មី​នៃ​អូឌីយ៉ូ​រថយន្ត​អាច​នឹង​ប្រសើរឡើង​ជាង​បទភ្លេង

ហូលីវូដបានបង្ហាញពីភាពវៃឆ្លាតសិប្បនិម្មិត (AI) ជាស្រទាប់ប្រតិបត្តិការនៃមនុស្សយន្ត dystopian ដែលជំនួសមនុស្សដែលមិនមានការសង្ស័យ និងបង្កើតជម្លោះកណ្តាលដែលកំពុងកើនឡើង។ នៅក្នុងឯកសារយោងដ៏ល្អបំផុត អ្នកអាចស្រមៃថាក្មេង Hailey Joel Osment ដើរតួជា David ដែលជាក្មេងសិប្បនិមិត្តដែលស្គាល់ខ្លួនឯងនៅក្នុងពិភពទីក្រុងឆ្នេរសមុទ្ររបស់ Spielberg (ដែលធ្លាប់ស្គាល់?) នៃ AI៖ បញ្ញាសិប្បនិម្មិត អ្នកណា (spoiler alert) គ្រាន់តែសម្លាប់ខ្លួន។ ឬប្រហែលជាអ្នកនឹកឃើញសំឡេងរបស់ Robin Williams ថាជា បុរស Bicentennial ។ ជាថ្មីម្តងទៀត ដែលជាមនុស្សយន្តដែលស្គាល់ខ្លួនឯង ព្យាយាមរីកចម្រើន តើអ្នកណា (ជាថ្មីម្តងទៀតនៅលើការជូនដំណឹងអំពីការរំខាន) ក្លាយជាជនរងគ្រោះតែមួយគត់របស់គាត់។ ហើយជាការពិតណាស់ មានឯកសារយោងជិតដល់ ស្ថានីយ និងពិភពលោកក្រោយ apocalyptic របស់វាជាមួយនឹងម៉ាស៊ីនដែលប៉ុនប៉ងបំផ្លាញមនុស្ស និង (ការដាស់តឿនដែលមិនធ្វើឱ្យខូច) ជនរងគ្រោះជាច្រើនក្នុងរយៈពេលពីរបីទសវត្សរ៍។ ទោះយ៉ាងណាក៏ដោយ គ្មានសេណារីយ៉ូទាំងនេះទេ មនុស្សយើងរួមរស់ជាមួយជីវិតដែលប្រសើរឡើង អនុញ្ញាតឱ្យមានការកម្សាន្ត និងសុវត្ថិភាពកាន់តែប្រសើរឡើង។

ទោះយ៉ាងណាក៏ដោយ នោះគឺជាការពិតថ្មី។ ក្បួនដោះស្រាយបញ្ញាសិប្បនិមិត្តអាចត្រូវបានរួមបញ្ចូលទៅក្នុងការរចនាអូឌីយ៉ូ និងធ្វើឱ្យប្រសើរឡើងជាបន្តបន្ទាប់តាមរយៈការអាប់ដេតពីលើអាកាស ដើម្បីបង្កើនបទពិសោធន៍នៃការបើកបរ។ ហើយផ្ទុយគ្នាដោយផ្ទាល់ទៅនឹងឧទាហរណ៍ហូលីវូដទាំងនេះ AI បែបនេះពិតជាអាចធ្វើឱ្យប្រសើរឡើងនូវលទ្ធភាពរស់រានរបស់មនុស្ស។

គ្រាន់តែសម្រាប់ការសប្បាយ

រហូតមកដល់ពេលថ្មីៗនេះ ចំណុចប្រទាក់អ្នកប្រើទាំងអស់ (UI) រួមទាំងការអភិវឌ្ឍន៍អូឌីយ៉ូ បានទាមទារការសរសេរកម្មវិធីដ៏ស្មុគស្មាញដោយអ្នកសរសេរកូដអ្នកជំនាញលើស្តង់ដារសាមសិបប្រាំមួយ (36) ខែនៃកម្មវិធីយានយន្ត។ រចនាបថដែកសន្លឹក និងប្រអប់អេឡិចត្រូនិចត្រូវបានបញ្ជាក់ ប្រភព និងអភិវឌ្ឍស្របគ្នាតែប៉ុណ្ណោះ ដើម្បីកែតម្រូវធាតុនីមួយៗយឺតក្នុងការអភិវឌ្ឍន៍។ សំឡេងម៉ាក។ ហត្ថលេខាសូរស័ព្ទ។ រាល់គំនិតផ្តួចផ្តើមដាច់ដោយឡែកទាំងអស់នៅក្នុងការរចនាប្រព័ន្ធភាពស្លេកស្លាំងដូចគ្នាដែលមាន ក្រុមហ៊ុនផលិតចំណាយរាប់ពាន់លាន.

ប៉ុន្តែ Artificial Intelligence បានអនុញ្ញាតឱ្យមានវិធីដែលអាចបត់បែនបាន និងមានប្រសិទ្ធភាពជាងក្នុងការចូលទៅជិតការរចនាបទពិសោធន៍សំឡេង។ លោក Josh Morris អ្នកគ្រប់គ្រងផ្នែកវិស្វកម្ម Machine Learning របស់ DSP Concept មានប្រសាសន៍ថា "អ្វីដែលយើងកំពុងឃើញគឺការបញ្ចូលគ្នានៃនិន្នាការ" ។ "អូឌីយ៉ូកំពុងក្លាយជាមុខងារលេចធ្លោជាងនៅក្នុងរថយន្ត ប៉ុន្តែក្នុងពេលជាមួយគ្នានេះ អ្នកកំពុងឃើញប្រព័ន្ធដំណើរការទំនើបកាន់តែរឹងមាំជាមួយនឹងអង្គចងចាំ និងសមត្ថភាពកាន់តែច្រើន។"

ហើយនៅក្នុងនោះ ការប្រើប្រាស់វេទិកាអភិវឌ្ឍន៍ដែលផ្តោតលើប្រព័ន្ធ ភាពវៃឆ្លាតសិប្បនិម្មិត និងដំណើរការដែលខ្លាំងជាងនេះផ្តល់ឱ្យអ្នកបើកបរ និងអ្នកដំណើរនូវកម្រិតថ្មីនៃការសម្របខ្លួន និងការឆ្លើយតបតាមពេលវេលាជាក់ស្តែង។ . លោក Steve Ernst ប្រធានផ្នែកអភិវឌ្ឍន៍អាជីវកម្មរថយន្តរបស់ DSP Concept បាននិយាយថា “ជំនួសឱ្យតម្រូវការជាប្រវត្តិសាស្ត្រក្នុងការសរសេរកូដសម្រាប់គ្រប់សេណារីយ៉ូដែលអាចយល់បាន AI ណែនាំការឆ្លើយតបរបស់ប្រព័ន្ធដោយផ្អែកលើការយល់ដឹងអំពីលក្ខខណ្ឌបរិស្ថាន និងព្រឹត្តិការណ៍នានា។

មធ្យោបាយជាក់ស្តែងក្នុងការប្រើប្រព័ន្ធសិក្សាបែបនេះគឺ "ការបន្លឺសំឡេង" យានជំនិះ ដើម្បីឱ្យអូឌីយ៉ូកម្រិតខ្ពស់អាចត្រូវបានកែសម្រួល និងកែលម្អ ទោះបីជាបានប្តូរទៅសំបកកង់រដូវរងា ឬការផ្លាស់ប្តូរជុំវិញផ្សេងទៀតក៏ដោយ។ ប៉ុន្តែ ក្រុមហ៊ុន LG Electronics បានបង្កើតក្បួនដោះស្រាយដែលកំពុងដំណើរការនៅក្នុង Audio Weaver របស់ DSP Concept វេទិកាដើម្បីអនុញ្ញាតឱ្យមានការកែលម្អសំឡេងនៃការសន្ទនារបស់ភាពយន្តកំឡុងពេលកម្សាន្តនៅកៅអីខាងក្រោយ ដើម្បីសង្កត់សំឡេងវាធៀបនឹងការផ្ទុះនៅក្នុងខ្សែភាពយន្ត ដោយហេតុនេះអនុញ្ញាតឱ្យអ្នកដំណើរស្តាប់ខ្លឹមសារសំខាន់ៗបានកាន់តែច្បាស់។

ទិដ្ឋភាពដែលមិនច្បាស់មួយទៀត អាចជារបៀបដែលសំឡេងអូឌីយ៉ូយីហោត្រូវបានរៀបចំនៅចំកណ្តាលសម្លេងរំខានផ្សេងទៀត។ តើយានជំនិះជាក់លាក់នេះតម្រូវឱ្យមានលំដាប់នៃការចាប់ផ្ដើមដំណើរការកើនឡើងដើម្បីចាក់ ខណៈដែលសំឡេងផ្សេងទៀតដូចជាវិទ្យុ និងសំឡេងរោទ៍ត្រូវបានបិទដោយស្វ័យប្រវត្តិដែរឬទេ? បទពិសោធន៍នីមួយៗអាចត្រូវបានកែតម្រូវ។

ទំនង​ជា​រីក​ចម្រើន​ជាង

នៅពេលដែលពិភពលោកប្រកួតប្រជែងទាំងរថយន្តអគ្គិសនី និងការបើកបរដោយស្វ័យប្រវត្តិ ភាពញឹកញាប់ និងតម្រូវការនៃការព្រមានដែលអាចស្តាប់បានទំនងជានឹងផ្លាស់ប្តូរយ៉ាងខ្លាំង។ ជាឧទាហរណ៍ វិស្វករសុវត្ថិភាពរបស់តាក់ស៊ីស្វយ័តមិនអាចសន្មត់ថាអ្នកដំណើរនៅគ្រប់ទីកន្លែងនៅជិតអេក្រង់ដែលមើលឃើញនៅពេលដែលត្រូវការការជូនដំណឹងទាន់ពេលវេលា។ ហើយ​តើ​ការ​ដាស់តឿន​នោះ​អាច​ស្តាប់​បាន​កម្រិត​ណា ជនពិការជនជាតិអាមេរិកជិត 25 លាននាក់ តើយានជំនិះស្វយ័តមួយណាគួរតែបើកលទ្ធភាពចល័តថ្មី? លោក Ernst មានប្រសាសន៍ថា “អូឌីយ៉ូឥឡូវនេះមិនគ្រាន់តែសម្រាប់ស្តាប់បទចម្រៀងដែលអ្នកចូលចិត្តនោះទេ។ "ជាមួយនឹងការបើកបរដោយស្វ័យភាព មានការដាស់តឿនគ្រប់ប្រភេទដែលតម្រូវឱ្យអ្នកបើកបរចូលរួម ឬជូនដំណឹងដល់អ្នកបើកបរដែលមិនជាប់ពាក់ព័ន្ធអំពីរឿងដែលកើតឡើងនៅជុំវិញពួកគេ។"

លោក Adam Levenson ប្រធានផ្នែកទីផ្សាររបស់ DSP Concepts បាននិយាយថា "ហើយអ្វីដែលធ្វើឱ្យវាកាន់តែលំបាក" គឺអ្វីៗទាំងអស់ដែលត្រូវបានដោះស្រាយក្នុងពេលដំណាលគ្នានៅក្នុងរថយន្ត៖ ទូរស័ព្ទ សំឡេង សំឡេងអសុរស ឬជាលំហ សំឡេងម៉ាស៊ីន សំឡេងរំខានផ្លូវ ប្រព័ន្ធជូនដំណឹងរថយន្តសូរស័ព្ទ។ ប្រព័ន្ធសំឡេង។ល។ យើងចង់និយាយថាផលិតផលអូឌីយ៉ូដែលស្មុគស្មាញបំផុតគឺរថយន្ត។

ជាឧទាហរណ៍ សូមស្រមៃគិតអំពីសេណារីយ៉ូដែលអ្នកបើកបរបានបើករបៀបបើកបរស្វ័យភាពនៅលើផ្លូវហាយវេ បានបង្កើតបទភ្លេងរបស់គាត់ ហើយមិនអើពើនឹងរថយន្តសង្គ្រោះបន្ទាន់ដែលជិតមកដល់។ តើភាពជាក់លាក់ (និងចម្ងាយ) នៃការចាប់ស៊ីរ៉ែនដោយប្រើមីក្រូហ្វូនរបស់រថយន្ត តើរថយន្តជូនដំណឹងដល់អ្នកបើកបរដែលមានការរំខានដោយរបៀបណា? តើត្រូវបង្ហាញការដាស់តឿននេះដោយរបៀបណា ដើម្បីជម្នះសំឡេងរំខានជុំវិញ ផ្តល់ការយកចិត្តទុកដាក់គ្រប់គ្រាន់ ប៉ុន្តែមិនមានការរំខានដល់អ្នកបើកបរដោយមិនចាំបាច់? ទាំងអស់នេះអាចត្រូវបានលៃតម្រូវតាមរយៈម៉ូដែលដែលបានអភិវឌ្ឍជាមុន ការបណ្តុះបណ្តាលជាមុនជាមួយនឹងស៊ីរ៉ែនផ្សេងៗគ្នា និងការលៃតម្រូវតាមពពកជាបន្តបន្ទាប់។ Morris ពន្យល់ថា "នេះគឺជាកន្លែងដែលវង់ភ្លេងទាំងមូលក្លាយជារឿងសំខាន់" ។ “យើងអាចយកលទ្ធផលនៃគំរូ [ការរកឃើញរបស់ AI] ហើយដឹកនាំវាទៅកន្លែងផ្សេងគ្នានៅក្នុងរថយន្ត។ ប្រហែល​ជា​អ្នក​បិទ​សំឡេង​ចុះ បើក​សញ្ញា​ព្រមាន​ដែល​អាច​ស្ដាប់​បាន ហើយ​បញ្ចេញ​អ្វី​មួយ​នៅ​លើ​ផ្ទាំងគ្រប់គ្រង​ដើម្បីឱ្យ​អ្នក​បើកបរ​យកចិត្តទុកដាក់។"

ដូចគ្នា​នឹង​ការ​ជូន​ដំណឹង​ខាង​ក្រៅ។ ជាឧទាហរណ៍ រថយន្តអគ្គិសនីស្ងាត់អាចមានសំឡេងរោទិ៍សម្រាប់អ្នកថ្មើរជើង។ ដូច្នេះហើយ ការក្រិតតាមខ្នាតថ្មីអាចត្រូវបានបង្កើតដោយគ្មានអ៊ីនធឺណិត និងទាញយកទៅយានជំនិះ ជាការអាប់ដេតកម្មវិធីដោយផ្អែកលើការច្នៃប្រឌិតដែលបានបើក។

ការច្នៃប្រឌិតនៅគ្រប់ទីកន្លែង។ និងបញ្ញាសិប្បនិមិត្តផ្តល់បទពិសោធន៍ដល់អ្នកប្រើប្រាស់ជាជាងបង្កើតពិភព dystopian របស់ហូលីវូដ។

ការព្យាករណ៍របស់អ្នកនិពន្ធ

នេះជាការព្យាករណ៍ប្រចាំសប្តាហ៍របស់ខ្ញុំ (ហើយវាមានតែថ្ងៃអង្គារទេមនុស្សទូទៅ)៖ ការវិវត្តន៍បន្ទាប់នៃអូឌីយ៉ូនឹងរួមបញ្ចូលរង្វិលជុំមតិត្រឡប់ភ្លាមៗ រួមទាំងភាពរីករាយរបស់អ្នកប្រើប្រាស់ក្នុងពេលជាក់ស្តែង។ បាទ ការរចនាបច្ចុប្បន្នភាគច្រើនទំនងជាធ្វើអោយបទពិសោធន៍កាន់តែប្រសើរឡើង ប៉ុន្តែការក្រិតតាមខ្នាតដែលកំពុងដំណើរការនៃ User-Centered Design (UCD) អាចត្រូវបានពង្រឹងបន្ថែមដោយផ្អែកលើការបញ្ចេញមតិ ភាសាកាយវិការ និងមតិយោបល់របស់អ្នកដំណើរ ដូច្នេះហើយការកែតម្រូវការពេញចិត្តជាលក្ខណៈបុគ្គលនៅក្នុងពេលវេលាជាក់ស្តែង។ កម្មវិធីបើកដំណើរការទាំងអស់នៅទីនោះ៖ កាមេរ៉ា AI ខួរក្បាល និងវេទិកាសម្របខ្លួន។

បាទ/ចាស៎ យើងធ្លាប់លឺពីមុនមក ពន្លឺនៃអារម្មណ៍ប្រែប្រួល និងការរកឃើញពីចម្ងាយនៃភាពអផ្សុក ភាពតានតឹងជាដើម ដើម្បីបង្កើនសុវត្ថិភាព ប៉ុន្តែគ្មានអ្វីដែលបង្កើនបទពិសោធន៍រួមបញ្ចូលគ្នាដោយផ្អែកលើពេលវេលាជាក់ស្តែង ក្បួនដោះស្រាយការរៀនរបស់ឧបករណ៍ចាប់សញ្ញាចង្អុលអ្នកប្រើប្រាស់ទាំងអស់។

ប្រហែល​ជា​ខ្ញុំ​ហួស​ហេតុ​ពេក។ ប៉ុន្តែដូចជាតួអង្គរបស់ Robin Williams ដែលខ្ញុំបានអូសបន្លាយពីរសតវត្សមកហើយ... ដូច្នេះប្រហែលជាខ្ញុំក៏មានអារម្មណ៍រសើបចំពោះអ្វីដែលមនុស្សចង់បានដែរ។

ប្រភព៖ https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/