ម៉ូដែល AI Ultra Light នេះសមនឹងទូរស័ព្ទរបស់អ្នក ហើយអាចយកឈ្នះ ChatGPT

ក្រុមហ៊ុន Microsoft ថ្ងៃនេះបានអះអាងថាខ្លួនបានចេញផ្សាយ "គំរូភាសាតូចដែលមានសមត្ថភាព និងសន្សំសំចៃបំផុត (SLMs) ដែលអាចប្រើបាន" ដោយនិយាយថា Phi-3 ដែលជាកំណែទីបីនៃគ្រួសារ Phi របស់ខ្លួននៃគំរូភាសាតូច (SLMs) - ដំណើរការជាងម៉ូដែលដែលមានទំហំប្រៀបធៀប និង ធំជាងពីរបី។

គំរូភាសាតូច (SLM) គឺជាប្រភេទគំរូ AI ដែលត្រូវបានរចនាឡើងដើម្បីឱ្យមានប្រសិទ្ធភាពខ្ពស់ក្នុងការអនុវត្តកិច្ចការដែលទាក់ទងនឹងភាសាជាក់លាក់។ មិនដូចគំរូភាសាធំ (LLMs) ដែលស័ក្តិសមសម្រាប់កិច្ចការទូទៅជាច្រើននោះ SLMs ត្រូវបានបង្កើតឡើងនៅលើសំណុំទិន្នន័យតូចជាង ដើម្បីធ្វើឱ្យពួកគេកាន់តែមានប្រសិទ្ធភាព និងសន្សំសំចៃសម្រាប់ករណីប្រើប្រាស់ជាក់លាក់។

ក្រុមហ៊ុន Microsoft បានពន្យល់ថា Phi-3 មាននៅក្នុងកំណែផ្សេងៗគ្នា ដោយតូចបំផុតគឺ Phi-3 Mini ដែលជាគំរូប៉ារ៉ាម៉ែត្រ 3.8 ពាន់លានដែលត្រូវបានបណ្តុះបណ្តាលលើនិមិត្តសញ្ញា 3.3 ពាន់ពាន់លាន។ ទោះបីជាមានទំហំតូចប្រៀបធៀបក៏ដោយ សាកសពរបស់ Llama-3 មានទម្ងន់លើសពី 15 ពាន់ពាន់លាននៃទិន្នន័យ - Phi-3 Mini នៅតែមានសមត្ថភាពគ្រប់គ្រង 128K tokens នៃបរិបទ។ នេះធ្វើឱ្យវាអាចប្រៀបធៀបទៅនឹង GPT-4 និងយកឈ្នះ Llama-3 និង Mistral Large ទាក់ទងនឹងសមត្ថភាពសញ្ញាសម្ងាត់។

ម្យ៉ាងវិញទៀត AI behemoths ដូចជា Llama-3 នៅលើ Meta.ai និង Mistral Large អាចដួលរលំបន្ទាប់ពីការជជែកគ្នាយូរ ឬប្រាប់ឱ្យបានល្អ មុនពេលម៉ូដែលទម្ងន់ស្រាលនេះចាប់ផ្តើមតស៊ូ។

អត្ថប្រយោជន៍ដ៏សំខាន់បំផុតមួយរបស់ Phi-3 Mini គឺសមត្ថភាពរបស់វាក្នុងការបំពាក់ និងដំណើរការលើស្មាតហ្វូនធម្មតា។ ក្រុមហ៊ុន Microsoft បានសាកល្បងម៉ូដែលនៅលើ iPhone 14 ហើយវាដំណើរការដោយគ្មានបញ្ហា ដោយបង្កើត 14 tokens ក្នុងមួយវិនាទី។ ការដំណើរការ Phi-3 Mini ត្រូវការ VRAM ត្រឹមតែ 1.8GB ដែលធ្វើឱ្យវាក្លាយជាជម្រើសស្រាល និងមានប្រសិទ្ធភាពសម្រាប់អ្នកប្រើប្រាស់ដែលមានតម្រូវការផ្តោតអារម្មណ៍ច្រើន។

ខណៈពេលដែល Phi-3 Mini ប្រហែលជាមិនសមរម្យសម្រាប់អ្នកសរសេរកូដកម្រិតខ្ពស់ ឬអ្នកដែលមានតម្រូវការទូលំទូលាយ វាអាចជាជម្រើសដ៏មានប្រសិទ្ធភាពសម្រាប់អ្នកប្រើប្រាស់ដែលមានតម្រូវការជាក់លាក់។ ជាឧទាហរណ៍ ការចាប់ផ្តើមអាជីវកម្មដែលត្រូវការ chatbot ឬមនុស្សដែលប្រើ LLMs សម្រាប់ការវិភាគទិន្នន័យអាចប្រើ Phi-3 Mini សម្រាប់កិច្ចការដូចជា ការរៀបចំទិន្នន័យ ការស្រង់ចេញព័ត៌មាន ការធ្វើហេតុផលគណិតវិទ្យា និងភ្នាក់ងារសាងសង់។ ប្រសិនបើម៉ូដែលនេះត្រូវបានផ្តល់ការចូលប្រើអ៊ីនធឺណិត វាអាចមានថាមពលខ្លាំង ដោយទូទាត់សងសម្រាប់ការខ្វះខាតសមត្ថភាពរបស់វាជាមួយនឹងព័ត៌មានពេលវេលាជាក់ស្តែង។

Phi-3 Mini សម្រេចបានពិន្ទុតេស្តខ្ពស់ដោយសារតែការយកចិត្តទុកដាក់របស់ Microsoft លើការរៀបចំសំណុំទិន្នន័យរបស់ខ្លួនជាមួយនឹងព័ត៌មានដែលមានប្រយោជន៍បំផុតដែលអាចធ្វើទៅបាន។ តាមពិត គ្រួសារ Phi ដ៏ទូលំទូលាយគឺមិនល្អសម្រាប់ការងារដែលទាមទារចំណេះដឹងជាក់ស្តែងនោះទេ ប៉ុន្តែជំនាញហេតុផលខ្ពស់ដាក់ពួកគេឱ្យខ្ពស់ជាងដៃគូប្រកួតប្រជែងធំៗ។ Phi-3 Medium (គំរូប៉ារ៉ាម៉ែត្រ 14 ពាន់លាន) វាយដំ LLM ដ៏មានអានុភាពដូចជា GPT-3.5 — LLM ដែលផ្តល់ថាមពលដល់ ChatGPT កំណែឥតគិតថ្លៃ ហើយកំណែ Mini វាយនឹងម៉ូដែលដ៏មានឥទ្ធិពលដូចជា Mixtral-8x7B នៅក្នុងភាគច្រើននៃស្តង់ដារសំយោគ។

ទោះជាយ៉ាងណាក៏ដោយ គួរកត់សំគាល់ថា Phi-3 មិនមែនជាប្រភពបើកចំហដូច Phi-2 ជំនាន់មុនរបស់វានោះទេ។ ផ្ទុយទៅវិញវាគឺជា ម៉ូដែលបើកចំហមានន័យថាវាអាចចូលប្រើបាន និងអាចប្រើប្រាស់បាន ប៉ុន្តែវាមិនមានអាជ្ញាប័ណ្ណប្រភពបើកចំហដូចគ្នាទៅនឹង Phi-2 ដែលអនុញ្ញាតឱ្យមានការប្រើប្រាស់ទូលំទូលាយ និងកម្មវិធីពាណិជ្ជកម្ម។

ក្នុងប៉ុន្មានសប្តាហ៍ខាងមុខនេះ ក្រុមហ៊ុន Microsoft បាននិយាយថា ខ្លួននឹងបញ្ចេញម៉ូដែលជាច្រើនទៀតនៅក្នុងគ្រួសារ Phi-3 រួមទាំង Phi-3 Small (7 billion parameters) និង Phi-3 Medium ដែលបានរៀបរាប់ខាងលើ។

ក្រុមហ៊ុន Microsoft បានធ្វើឱ្យ Phi-3 Mini មាននៅលើ Azure AI Studio, Hugging Face និង Ollama ។ ម៉ូដែលនេះត្រូវបានកែសម្រួលតាមការណែនាំ និងធ្វើឱ្យប្រសើរសម្រាប់ ONNX Runtime ជាមួយនឹងការគាំទ្រសម្រាប់ Windows DirectML ក៏ដូចជាការគាំទ្រឆ្លងវេទិកានៅទូទាំង GPU, CPU និងសូម្បីតែផ្នែករឹងចល័ត។

ស្ថិតនៅលើកំពូលនៃព័ត៌មានគ្រីបតូ ទទួលបានព័ត៌មានថ្មីៗប្រចាំថ្ងៃនៅក្នុងប្រអប់សំបុត្ររបស់អ្នក។

ប្រភព៖ https://decrypt.co/227974/microsoft-phi-3-mini-small-ai-language-model