Knowledge

Thursday, 10 December 2020

Data Analytics ဆိုသည်မှာ

Data Analytics ဆိုသည်မှာ

Data Analytics ပဲဖြစ်ဖြစ်၊ Data Science ပဲ ဖြစ်ပါစေ "ဆယ်စုနှစ် (နှစ်) ခုလောက်" ဖြတ်ကျော်ခဲ့ရပြီဖြစ်လို့ Data ကောက်ခံခြင်းနဲ့ စိစစ်တွက်ထုတ်ခြင်းနည်းစနစ်များ၊ Software များ၊ Application များ တရှိန်ထိုး တိုးတက်လာခဲ့ပါပြီ။

 

Data Analytics ဆိုတာဟာ စီးပွားရေးရည်ရွယ်ချက် (တိုးချဲ့၊ ရပ်တည်)၊ သိပ္ပံပညာအချက်အလက်များစုစည်းလိုသည့်ရည်ရွယ်ချက်ဖြင့် "အချက်အလက်ကောက်ခံစီစစ်ထုတ်နုတ်ခြင်း" ဖြစ်သည်။ ၂၁ ရာစုနှစ်မှာတော့ Data Analytics အလုပ်ကို သင်္ချာပညာရှင်များ၊ အင်ဂျီနီယာပညာရှင်များ၊ စာရင်းကိုင်များနဲ့ ကွန်ပျူတာသိပ္ပံပညာရှင်တို့ ပိုမိုဝင်ရောက်လုပ်ကိုင်နေကြပါပြီ။

 

ကောက်ယူထားတဲ့ အချက်အလက် Data များပေါ်မူတည်ပြီး Decision မျာချခြင်း၊ ပြသနာများဖြေရှင်းခြင်း၊၊ အဖြေတွက်ထုတ်ခြင်းများ အစရှိသဖြင့် အထောက်အပံ့ပေးနိုင်တဲ့ ဘာသာရပ်တစ်ခုဖြစ်တာကြောင့် ဒီနေ့ခေတ်မှာ ပိုမိုခေတ်စားလာတာကို တွေ့ရပါတယ်။

Data Analytics ပြုလုပ်ရာတွေ ထိုပညာရှင်များမှာ သူတို့နယ်ပယ်ဆိုင်ရာ Analytics Tools များကိုသာ အသုံးပြုတတ်ကြသည်။ ဒါကြောင့် အနာဂတ်အလုပ်အကိုင်ရည်မှန်းချက်ဖြင့် အခုခေတ်လူငယ်တို့ Data Analytics သင်တန်းများကို ကြိုတင်တက်ရောက်လေ့လာထားသင့်နေပါပြီ။

 

Data Analysis လို့ဆိုတာနဲ့ အခြေခံအားဖြင့်
(1) Data Set
(2) Data Mining
(3) Data Visualization
(4) Data Modeling
(5) Data Wrangling
(6) Big Data
(7) Algorithm
(8) Machine Learning
(9) Deep Learning
(10) Supervised Learning
(11) Unsupervised Learning
(12) Reinforcement Learning ဆိုတာတွေကို အရင်ဆုံး နားလည်ထားဖို့လိုအပ်ပါတယ်။

 

Data Set
Structured data တွေ ဖြစ်ပြီး analysisလုပ်ရာမှာ အသုံးပြုနိုင်အောင် စီစဉ်ထားရှိထားတဲ့ data collection setတွေဖြစ်ပါတယ်။

 

Data Mining
Data Scientistတွေလုပ်လေ့ရှိတဲ့ Data set တွေထဲကနေ အသုံးပြုလိုရလောက်မယ့် usable modelsတွေ ရှာဖွေခြင်း processတစ်ခုပဲဖြစ်ပါတယ်။အဲ့အတွက်လဲ techniques အမျိုးမျိုးကိုသုံးပါတယ်။eg. Regression, Classification, Cluster Analysis , Outlier Analysis...

 

Data Visualization
ရရှိထားတဲ့Dataနဲ့ Informationတွေကို Charting, Graphing, Infographingတွေသုံးပြီး visual ပြသတဲ့ processဖြစ်ပါတယ်။

 

Data Modeling
Data Modelingကတော့Complex dataတွေကို predictive and actionable informationတွေအဖြစ်ပြောင်းပေးတာပါ။

 

Data Wrangling
Raw Data တွေကို Formatလုပ်တာတွေ Restructuringပြန်လုပ်တာတွေ မိမိ အလုပ်နဲ့ကိုက်ညီတဲ့အထိလိုအပ် သလောက် ပြန်လုပ်တဲ့ processဖြစ်ပါတယ်။Data Scientistတွေကတော့ သူတို့ အလုပ်တွေအတွက်ဒီအဆင့်မှာ 50က နေ 80 ရာခိုင်နှုန်းလောက်အထိ အချိန်ယူကြပါတယ်။

 

Big Data
Computer တစ်လုံးထဲမှာပဲ သိမ်းထားလို့မရတဲ့ large amount of dataတွေပါ။data အမျိုးမျိူးပါဝင်ပြီး Sqlတို့ Excelတို့လောက်နဲ့တော့ handleလုပ်လို့မရနိုင်ပါဘူး။

 

Algorithm
DS လုပ်ငန်းစဉ်တွေနဲ့ problem solving လုပ်မယ်ဆိုရင် Algorithmတွေကမဖြစ်မနေသုံးရပါတယ်။ဒါ့အပြင် data science သမား တစ်ယောက်ဟာ သူ့ လက်ရှိ အလုပ်နဲ့ သင့်တော်တဲ့ algorithmကို အကောင်းဆုံး ရွှေးချယ် သုံးတတ်ရပါတယ်။Algorithmတစ်ခုထဲနဲ့ အလုပ်အကုန်လုံးလုပ်ဖို့ကတော့ အဆင်မပြေနိုင်ပါဘူး။

 

Machine Learning
Data တွေဆီကနေ feedbackတွေအခြေခံပြီး ကိုယ်ပိုင် behaviors တွေ ထိန်းညှိနိုင်တဲ့ တနည်း learningပြန်လုပ်နိုင်တဲ့Computational processပဲဖြစ်ပါတယ်။

 

Deep Learning
Machine learningရဲ့ အခွဲဖြစ်ပြီး neurons တွေ neural networksတွေ လူအတွေး‌‌တွေကို brain system အတိုင်း တုပ နိုင်ဖို့ ကြိုးစားတဲ့ computational processပဲဖြစ်ပါတယ်။
Eg. Speech Recognition, Translation, Image Recognition

 

Supervised Learning
Labeled dataတွေကို အသုံးချပြီး models‌တွေကို label Identifyလုပ်လို့ရတဲ့အထိ trainယူရတယ့် processပဲဖြစ်ပါတယ်။

 

Unsupervised Learning
Unlabeled dataတွေသုံးပြီး modelsတွေကို train ယူတဲ့ processဖြစ်ပါတယ်။labeledမဟုတ်တော့ algorithmက ဘယ်dataက ဘယ်labelဆိုတာ ခွဲခြားမှာမဟုတ်ပါဘူး။ဒါပေမယ့် characteristicsတွေကြည့်ပြီး dataတွေကို groupတွေ အနေနဲ့တော့ခွဲခြားပေးနိုင်ပါတယ်။

 

Reinforcement Learning
Modelsကို past error တွေကနေ learning လုပ်စေပြီး တဖြည်းဖြည်း နဲ့မှန်အောင် ပြင်ပြီး learning လုပ်သွားတဲ့ processပဲဖြစ်ပါတယ်။


Data Analytics နဲ့ပတ်သက်ပြီး ဆက်လက်လေ့လာမယ်ဆိုရင်တော့ အဓိကကျတဲ့ အခြေခံအချက် (၅)ချက်ကို လေ့လာကြရအောင်။

၁။ အချက်အလက်တွေ အားလုံးဟာ အများအားဖြင့် သန့်စင်မနေပါဘူး။
Data Analytics သင်တန်းမှာတော့ အချက်အလက်တချို့ အတည်ပြုဖို့လိုအပ်ပြီဆိုရင် "သီအိုရီများ" ဆီသို့ချည်းကပ်ရင်း အချက်အလက်တွေ မေးမြန်းဖို့ လိုအပ်ပါတယ်။ ဒါပေမဲ့ လက်တွေ့လုပ်ငန်းခွင်မှာတော့ အဲ့လိုမဟုတ်ပါဘူး။ အဖွဲ့အစည်းတော်တော်များများ ကြုံတွေ့ရတဲ့ပြဿနာကတော့ "အချက်အလက်မှားယွင်းဖြည့်သွင်းခြင်းနဲ့ မဖြည့်သွင်းထားခြင်း" မှအပ "ကောက်ခံရယူထားတဲ့ Data Sets" တွေကို တစ်ခုတည်းအဖြစ်သို့ ပေါင်းစပ်ကြခြင်းဖြစ်ပါတယ်။ အဲ့ဒီလိုပေါင်းစပ်ရာမှာ တချို့ Data Sets တွေဟာ လုံးဝကိုပေါင်းစပ်မရတတ်တာမျိုးကြောင့် မှားယွင်းတဲ့အချက်အလက်တွေဖြစ်လာပါတယ်။

 

Data ကောက်ခံခြင်းဆောင်ရွက်တဲ့စီးပွားရေးလုပ်ငန်းတွေကတော့ Front-End ကောက်ခံတဲ့ Software တစ်ခုရယ်၊ ရလာဒ်တွေကို စီစစ်ရတဲ့ အသုံးပြုသူတစ်ယောက်ရယ်ပဲ ပါဝင်တတ်ပါတယ်။ ကောက်ခံထားတဲ့အချက်အလက်တွေကို Data scientist လာရောက်ယူချိန်မှာတော့ လွတ်လပ်စွာဖြည့်သွင်းထားတဲ့အချက်အလက်များသာဖြစ်ပြီး Data Design မှာ မပါဝင်တဲ့အရာများသာဖြစ်နေပါတယ်။

 

၂။ Data ကောက်ခံခြင်းဟာ အသုံးပြုသူကိုယ်တိုင်က တချို့အချက်အလက်တွေကို Manually ဖျက်ပေးဖို့လိုပါတယ်။

Data Analytics အကြောင်း လူတွေတော်တော်များများ အထင်မှားနေကြတဲ့အရာက ဘာလဲဆိုတာ သိကြလား? Data Analytics Tools တွေက ထည့်သွင်းထားတဲ့ Data တွေကို စီစစ်ရလာတဲ့ ရလာဒ်ဟာ သန့်စင်တယ်လို့ ထင်နေတာပါပဲ။

တကယ်တော့ တချို့အချက်အလက်တွေဟာ မှားယွင်းဖြည့်သွင်းထားတာမျိုး၊ ရည်ရွယ်ထားတဲ့ သီအိုရီကိုသွေဖယ်တာမျိုးဖြစ်စေတာဆို အသုံးပြုသူက Manually ဖျက်ပေးဖို့ လိုအပ်ပါတယ်။ ဒါပေမဲ့ အဲ့ဒီလိုပြုလုပ်ပေးရခြင်းကလည်း အချိန်ကုန်၊ လူပင်ပန်းဖြစ်စေလို့ တော်တော်များများက မလုပ်တတ်ကြပါဘူး။

 

၃။ အချက်အလက်အများကြီးတွေဆိုတာ စင်စစ် ကိရိယာတစ်မျိုးသာ ဖြစ်ပါတယ်။ လူတော်တော်များများက "အချက်အလက်အများကြီး" စုဆောင်းမိထားကြတာကို နှစ်သက်ကြပါတယ်။

အဲ့ဒီအချက်အလက်အများကြီးဆိုတာက သင့်ရဲ့လုပ်ငန်းပြဿနာကို မဖြေရှင်းပေးနိုင်သေးပါဘူး။ Data ကောက်ခံတဲ့ Software က အော်တိုကောက်ခံပေးထားခြင်းသာ ဖြစ်ပါတယ်။ အဲ့အချက်အလက်အကြီးတွေကို လက်တွေ့အသုံးချနိုင်ဖို့ စီစစ်တဲ့ကိရိယာအဖြစ် ပညာရှင်တစ်ယောက်နဲ့ အတွေ့အကြုံများတဲ့ မျက်စိတစ်စုံလိုအပ်ပါတယ်။

 

၄။ ရလဒ်သည်သာ ပဓာန

Executives နဲ့ Decision Making ပိုင်းက လူတော်တော်များများက Data Science ရဲ့ အဓိကအသုံးပြုသူဖောက်သည်တွေဖြစ်ပါတယ်။ သူတို့က သင်ကောက်ခံထားတဲ့အချက်အလက်တွေဟာ ဘယ်လိုဘယ်ဝါရလာတာထက် အဲ့အချက်အလက်တွေကို ဘယ်နေရာမှာအသုံးချလို့ရမယ်ဆိုတာကို ပိုပြီးစိတ်ဝင်စားတတ်ကြပါတယ်။

 

၅။ Presentation က အဓိကပါပဲ။

စီစစ်ကောက်ခံထားပြီးရလာတဲ့ အဖြေကို ဝယ်ယူမည့်သူတွေက သင်္ချာပညာရှင်တွေမဟုတ်ပါဘူး။ သက်ဆိုင်ရာနယ်ပယ်က ပညာရှင်တွေပါ။ သူတို့ကို "ဘယ်လိုနည်းစနစ်နဲ့ကောက်ခံတယ်၊ ဘယ်လိုတွက်ထုတ်တယ်" ရှင်းပြတာထက် အသုံးပြုမည့်သူ နားလည်လွယ်အောင်အဓိကထားပြီးရှင်းပြသင့်ပါတယ်။

Ref: ET (Data Science)

 

 

Data Analytics ဆိုသည္မွာ

Data Analytics ပဲျဖစ္ျဖစ္၊ Data Science ပဲ ျဖစ္ပါေစ "ဆယ္စုႏွစ္ (ႏွစ္) ခုေလာက္" ျဖတ္ေက်ာ္ခဲ့ရၿပီျဖစ္လို႔ Data ေကာက္ခံျခင္းနဲ႔ စိစစ္တြက္ထုတ္ျခင္းနည္းစနစ္မ်ား၊ Software မ်ား၊ Application မ်ား တရွိန္ထိုး တိုးတက္လာခဲ့ပါၿပီ။

Data Analytics ဆိုတာဟာ စီးပြားေရးရည္႐ြယ္ခ်က္ (တိုးခ်ဲ႕၊ ရပ္တည္)၊ သိပၸံပညာအခ်က္အလက္မ်ားစုစည္းလိုသည့္ရည္႐ြယ္ခ်က္ျဖင့္ "အခ်က္အလက္ေကာက္ခံစီစစ္ထုတ္ႏုတ္ျခင္း" ျဖစ္သည္။ ၂၁ ရာစုႏွစ္မွာေတာ့ Data Analytics အလုပ္ကို သခ်ၤာပညာရွင္မ်ား၊ အင္ဂ်ီနီယာပညာရွင္မ်ား၊ စာရင္းကိုင္မ်ားနဲ႔ ကြန္ပ်ဴတာသိပၸံပညာရွင္တို႔ ပိုမိုဝင္ေရာက္လုပ္ကိုင္ေနၾကပါၿပီ။

 

ေကာက္ယူထားတဲ့ အခ်က္အလက္ Data မ်ားေပၚမူတည္ၿပီး Decision မ်ာခ်ျခင္း၊ ျပသနာမ်ားေျဖရွင္းျခင္း၊၊ အေျဖတြက္ထုတ္ျခင္းမ်ား အစရွိသျဖင့္ အေထာက္အပံ့ေပးႏိုင္တဲ့ ဘာသာရပ္တစ္ခုျဖစ္တာေၾကာင့္ ဒီေန႔ေခတ္မွာ ပိုမိုေခတ္စားလာတာကို ေတြ႕ရပါတယ္။

 

Data Analytics ျပဳလုပ္ရာေတြ ထိုပညာရွင္မ်ားမွာ သူတို႔နယ္ပယ္ဆိုင္ရာ Analytics Tools မ်ားကိုသာ အသုံးျပဳတတ္ၾကသည္။ ဒါေၾကာင့္ အနာဂတ္အလုပ္အကိုင္ရည္မွန္းခ်က္ျဖင့္ အခုေခတ္လူငယ္တို႔ Data Analytics သင္တန္းမ်ားကို ႀကိဳတင္တက္ေရာက္ေလ့လာထားသင့္ေနပါၿပီ။

 

Data Analysis လို႔ဆိုတာနဲ႔ အေျခခံအားျဖင့္
(1) Data Set
(2) Data Mining
(3) Data Visualization
(4) Data Modeling
(5) Data Wrangling
(6) Big Data
(7) Algorithm
(8) Machine Learning
(9) Deep Learning
(10) Supervised Learning
(11) Unsupervised Learning
(12) Reinforcement Learning ဆိုတာေတြကို အရင္ဆံုး နားလည္ထားဖို႔လိုအပ္ပါတယ္။

 

Data Set
Structured data ေတြ ျဖစ္ၿပီး analysisလုပ္ရာမွာ အသုံးျပဳႏိုင္ေအာင္ စီစဥ္ထားရွိထားတဲ့ data collection setေတြျဖစ္ပါတယ္။

 

Data Mining
Data Scientistေတြလုပ္ေလ့ရွိတဲ့ Data set ေတြထဲကေန အသုံးျပဳလိုရေလာက္မယ့္ usable modelsေတြ ရွာေဖြျခင္း processတစ္ခုပဲျဖစ္ပါတယ္။အဲ့အတြက္လဲ techniques အမ်ိဳးမ်ိဳးကိုသုံးပါတယ္။eg. Regression, Classification, Cluster Analysis , Outlier Analysis...

 

Data Visualization
ရရွိထားတဲ့Dataနဲ႔ Informationေတြကို Charting, Graphing, Infographingေတြသုံးၿပီး visual ျပသတဲ့ processျဖစ္ပါတယ္။

 

Data Modeling
Data Modelingကေတာ့Complex dataေတြကို predictive and actionable informationေတြအျဖစ္ေျပာင္းေပးတာပါ။

 

Data Wrangling
Raw Data ေတြကို Formatလုပ္တာေတြ Restructuringျပန္လုပ္တာေတြ မိမိ အလုပ္နဲ႔ကိုက္ညီတဲ့အထိလိုအပ္ သေလာက္ ျပန္လုပ္တဲ့ processျဖစ္ပါတယ္။Data Scientistေတြကေတာ့ သူတို႔ အလုပ္ေတြအတြက္ဒီအဆင့္မွာ 50က ေန 80 ရာခိုင္ႏႈန္းေလာက္အထိ အခ်ိန္ယူၾကပါတယ္။

 

Big Data
Computer တစ္လုံးထဲမွာပဲ သိမ္းထားလို႔မရတဲ့ large amount of dataေတြပါ။data အမ်ိဳးမ်ိဴးပါဝင္ၿပီး Sqlတို႔ Excelတို႔ေလာက္နဲ႔ေတာ့ handleလုပ္လို႔မရႏိုင္ပါဘူး။

 

Algorithm
DS လုပ္ငန္းစဥ္ေတြနဲ႔ problem solving လုပ္မယ္ဆိုရင္ Algorithmေတြကမျဖစ္မေနသုံးရပါတယ္။ဒါ့အျပင္ data science သမား တစ္ေယာက္ဟာ သူ႔ လက္ရွိ အလုပ္နဲ႔ သင့္ေတာ္တဲ့ algorithmကို အေကာင္းဆုံး ေ႐ႊးခ်ယ္ သုံးတတ္ရပါတယ္။Algorithmတစ္ခုထဲနဲ႔ အလုပ္အကုန္လုံးလုပ္ဖို႔ကေတာ့ အဆင္မေျပႏိုင္ပါဘူး။

 

Machine Learning
Data ေတြဆီကေန feedbackေတြအေျခခံၿပီး ကိုယ္ပိုင္ behaviors ေတြ ထိန္းညႇိႏိုင္တဲ့ တနည္း learningျပန္လုပ္ႏိုင္တဲ့Computational processပဲျဖစ္ပါတယ္။

 

Deep Learning
Machine learningရဲ႕ အခြဲျဖစ္ၿပီး neurons ေတြ neural networksေတြ လူအေတြး‌‌ေတြကို brain system အတိုင္း တုပ ႏိုင္ဖို႔ ႀကိဳးစားတဲ့ computational processပဲျဖစ္ပါတယ္။
Eg. Speech Recognition, Translation, Image Recognition

 

Supervised Learning
Labeled dataေတြကို အသုံးခ်ၿပီး models‌ေတြကို label Identifyလုပ္လို႔ရတဲ့အထိ trainယူရတယ့္ processပဲျဖစ္ပါတယ္။

 

Unsupervised Learning
Unlabeled dataေတြသုံးၿပီး modelsေတြကို train ယူတဲ့ processျဖစ္ပါတယ္။labeledမဟုတ္ေတာ့ algorithmက ဘယ္dataက ဘယ္labelဆိုတာ ခြဲျခားမွာမဟုတ္ပါဘူး။ဒါေပမယ့္ characteristicsေတြၾကည့္ၿပီး dataေတြကို groupေတြ အေနနဲ႔ေတာ့ခြဲျခားေပးႏိုင္ပါတယ္။

 

Reinforcement Learning
Modelsကို past error ေတြကေန learning လုပ္ေစၿပီး တျဖည္းျဖည္း နဲ႔မွန္ေအာင္ ျပင္ၿပီး learning လုပ္သြားတဲ့ processပဲျဖစ္ပါတယ္။


Data Analytics နဲ႔ပတ္သက္ၿပီး ဆက္လက္ေလ့လာမယ္ဆိုရင္ေတာ့ အဓိကက်တဲ့ အေျခခံအခ်က္ (၅)ခ်က္ကို ေလ့လာၾကရေအာင္။

၁။ အခ်က္အလက္ေတြ အားလုံးဟာ အမ်ားအားျဖင့္ သန႔္စင္မေနပါဘူး။
Data Analytics သင္တန္းမွာေတာ့ အခ်က္အလက္တခ်ိဳ႕ အတည္ျပဳဖို႔လိုအပ္ၿပီဆိုရင္ "သီအိုရီမ်ား" ဆီသို႔ခ်ည္းကပ္ရင္း အခ်က္အလက္ေတြ ေမးျမန္းဖို႔ လိုအပ္ပါတယ္။ ဒါေပမဲ့ လက္ေတြ႕လုပ္ငန္းခြင္မွာေတာ့ အဲ့လိုမဟုတ္ပါဘူး။ အဖြဲ႕အစည္းေတာ္ေတာ္မ်ားမ်ား ႀကဳံေတြ႕ရတဲ့ျပႆနာကေတာ့ "အခ်က္အလက္မွားယြင္းျဖည့္သြင္းျခင္းနဲ႔ မျဖည့္သြင္းထားျခင္း" မွအပ "ေကာက္ခံရယူထားတဲ့ Data Sets" ေတြကို တစ္ခုတည္းအျဖစ္သို႔ ေပါင္းစပ္ၾကျခင္းျဖစ္ပါတယ္။ အဲ့ဒီလိုေပါင္းစပ္ရာမွာ တခ်ိဳ႕ Data Sets ေတြဟာ လုံးဝကိုေပါင္းစပ္မရတတ္တာမ်ိဳးေၾကာင့္ မွားယြင္းတဲ့အခ်က္အလက္ေတြျဖစ္လာပါတယ္။

 

Data ေကာက္ခံျခင္းေဆာင္႐ြက္တဲ့စီးပြားေရးလုပ္ငန္းေတြကေတာ့ Front-End ေကာက္ခံတဲ့ Software တစ္ခုရယ္၊ ရလာဒ္ေတြကို စီစစ္ရတဲ့ အသုံးျပဳသူတစ္ေယာက္ရယ္ပဲ ပါဝင္တတ္ပါတယ္။ ေကာက္ခံထားတဲ့အခ်က္အလက္ေတြကို Data scientist လာေရာက္ယူခ်ိန္မွာေတာ့ လြတ္လပ္စြာျဖည့္သြင္းထားတဲ့အခ်က္အလက္မ်ားသာျဖစ္ၿပီး Data Design မွာ မပါဝင္တဲ့အရာမ်ားသာျဖစ္ေနပါတယ္။

 

၂။ Data ေကာက္ခံျခင္းဟာ အသုံးျပဳသူကိုယ္တိုင္က တခ်ိဳ႕အခ်က္အလက္ေတြကို Manually ဖ်က္ေပးဖို႔လိုပါတယ္။

Data Analytics အေၾကာင္း လူေတြေတာ္ေတာ္မ်ားမ်ား အထင္မွားေနၾကတဲ့အရာက ဘာလဲဆိုတာ သိၾကလား? Data Analytics Tools ေတြက ထည့္သြင္းထားတဲ့ Data ေတြကို စီစစ္ရလာတဲ့ ရလာဒ္ဟာ သန႔္စင္တယ္လို႔ ထင္ေနတာပါပဲ။

တကယ္ေတာ့ တခ်ိဳ႕အခ်က္အလက္ေတြဟာ မွားယြင္းျဖည့္သြင္းထားတာမ်ိဳး၊ ရည္႐ြယ္ထားတဲ့ သီအိုရီကိုေသြဖယ္တာမ်ိဳးျဖစ္ေစတာဆို အသုံးျပဳသူက Manually ဖ်က္ေပးဖို႔ လိုအပ္ပါတယ္။ ဒါေပမဲ့ အဲ့ဒီလိုျပဳလုပ္ေပးရျခင္းကလည္း အခ်ိန္ကုန္၊ လူပင္ပန္းျဖစ္ေစလို႔ ေတာ္ေတာ္မ်ားမ်ားက မလုပ္တတ္ၾကပါဘူး။

 

၃။ အခ်က္အလက္အမ်ားႀကီးေတြဆိုတာ စင္စစ္ ကိရိယာတစ္မ်ိဳးသာ ျဖစ္ပါတယ္။

လူေတာ္ေတာ္မ်ားမ်ားက "အခ်က္အလက္အမ်ားႀကီး" စုေဆာင္းမိထားၾကတာကို ႏွစ္သက္ၾကပါတယ္။ အဲ့ဒီအခ်က္အလက္အမ်ားႀကီးဆိုတာက သင့္ရဲ႕လုပ္ငန္းျပႆနာကို မေျဖရွင္းေပးႏိုင္ေသးပါဘူး။ Data ေကာက္ခံတဲ့ Software က ေအာ္တိုေကာက္ခံေပးထားျခင္းသာ ျဖစ္ပါတယ္။ အဲ့အခ်က္အလက္အႀကီးေတြကို လက္ေတြ႕အသုံးခ်ႏိုင္ဖို႔ စီစစ္တဲ့ကိရိယာအျဖစ္ ပညာရွင္တစ္ေယာက္နဲ႔ အေတြ႕အႀကဳံမ်ားတဲ့ မ်က္စိတစ္စုံလိုအပ္ပါတယ္။

 

၄။ ရလဒ္သည္သာ ပဓာန

Executives နဲ႔ Decision Making ပိုင္းက လူေတာ္ေတာ္မ်ားမ်ားက Data Science ရဲ႕ အဓိကအသုံးျပဳသူေဖာက္သည္ေတြျဖစ္ပါတယ္။ သူတို႔က သင္ေကာက္ခံထားတဲ့အခ်က္အလက္ေတြဟာ ဘယ္လိုဘယ္ဝါရလာတာထက္ အဲ့အခ်က္အလက္ေတြကို ဘယ္ေနရာမွာအသုံးခ်လို႔ရမယ္ဆိုတာကို ပိုၿပီးစိတ္ဝင္စားတတ္ၾကပါတယ္။

 

၅။ Presentation က အဓိကပါပဲ။

စီစစ္ေကာက္ခံထားၿပီးရလာတဲ့ အေျဖကို ဝယ္ယူမည့္သူေတြက သခ်ၤာပညာရွင္ေတြမဟုတ္ပါဘူး။ သက္ဆိုင္ရာနယ္ပယ္က ပညာရွင္ေတြပါ။ သူတို႔ကို "ဘယ္လိုနည္းစနစ္နဲ႔ေကာက္ခံတယ္၊ ဘယ္လိုတြက္ထုတ္တယ္" ရွင္းျပတာထက္ အသုံးျပဳမည့္သူ နားလည္လြယ္ေအာင္အဓိကထားၿပီးရွင္းျပသင့္ပါတယ္။

 

Ref: ET (Data Science)

Read times
Rate this articles
(0 votes)