Lecture Notes on Ch1-Ch3 PDF
Document Details
Tags
Summary
These lecture notes cover introductory topics in statistics, including definitions and classifications of different types of statistics. Examples of applications in accounting and computer science are also presented. The notes provide a foundational understanding of statistical concepts.
Full Transcript
Machine Translated by Google ምዕራፍ 1፡ መግቢያ 1.1. የስታቲስቲክስ ፍቺ እና ምደባ ስታቲስቲክስ የመረጃ አሰባሰብን፣ አደረጃጀትን፣ ትንተናን፣ አተረጓጎምን እና አቀራረብን የሚመለከት የሂሳብ ክፍል ነው። በመረጃ ላይ የተመሰረተ ውሳኔ ለማድረግ እና ውስብስብ ክስተቶችን ለመረዳት የሂሳብ አያያዝን ጨምሮ በተለያዩ መስኮች ጥቅም ላይ የሚውል ኃይለኛ መሳሪያ ነው. የ...
Machine Translated by Google ምዕራፍ 1፡ መግቢያ 1.1. የስታቲስቲክስ ፍቺ እና ምደባ ስታቲስቲክስ የመረጃ አሰባሰብን፣ አደረጃጀትን፣ ትንተናን፣ አተረጓጎምን እና አቀራረብን የሚመለከት የሂሳብ ክፍል ነው። በመረጃ ላይ የተመሰረተ ውሳኔ ለማድረግ እና ውስብስብ ክስተቶችን ለመረዳት የሂሳብ አያያዝን ጨምሮ በተለያዩ መስኮች ጥቅም ላይ የሚውል ኃይለኛ መሳሪያ ነው. የስታቲስቲክስ ፍቺ ስታትስቲክስ በሁለት መንገዶች ሊገለጽ ይችላል. ገላጭ ስታቲስቲክስ፡- ይህ መረጃን ማጠቃለል እና መግለጽን ያካትታል። የውሂብ ስብስብ ቁልፍ ባህሪያትን እንድንረዳ ይረዳናል፣ እንደ ማእከላዊ ዝንባሌው (አማካይ፣ መካከለኛ፣ ሁነታ) እና ተለዋዋጭነት (ክልል፣ ልዩነት፣ መደበኛ መዛባት)። ኢንፈረንሻል ስታቲስቲክስ፡- ይህ በናሙና ላይ ተመስርተው ስለ አንድ ህዝብ ግምት መስጠትን ያካትታል። ከወዲያውኑ መረጃ በላይ መደምደሚያዎችን እንድንሰጥ እና ግኝቶችን ወደ ትልቅ ቡድን እንድናጠቃልል ያስችለናል። የስታቲስቲክስ ምደባ ስታቲስቲክስ እንዲሁ በተፈጥሮው ላይ በመመስረት ሊመደብ ይችላል- የቁጥር ስታቲስቲክስ፡- እንደ የሽያጭ አሃዞች፣ የትርፍ ህዳጎች እና የእቃ ዝርዝር ደረጃዎች ያሉ የቁጥር መረጃዎችን ይመለከታል። የጥራት ስታቲስቲክስ፡- እንደ የደንበኛ እርካታ ካሉ አሃዛዊ ያልሆኑ መረጃዎች ጋር ይሰራል ደረጃ አሰጣጦች፣ የምርት ምርጫዎች እና የገበያ አዝማሚያዎች። በአካውንቲንግ ውስጥ ያሉ ምሳሌዎች፡- አካውንቲንግ፣ የፋይናንስ መረጃን የሚመለከት መስክ፣ በስታቲስቲክስ ላይ በጣም የተመካ ነው። አንዳንድ ምሳሌዎች እነሆ፡- የፋይናንሺያል ጥምርታ ትንተና፡- የሒሳብ ባለሙያዎች የፋይናንስ ሬሾዎችን ለማስላት እና ለመተንተን እስታቲስቲካዊ ዘዴዎችን ይጠቀማሉ። እነዚህ ሬሾዎች ስለ ንግድ ሥራ የፋይናንስ ጤና እና አፈጻጸም ግንዛቤዎችን ይሰጣሉ። የወጪ-ጥቅማ ጥቅም ትንተና፡- የኢንቨስትመንት ውሳኔዎችን በሚያደርጉበት ጊዜ፣ የሒሳብ ባለሙያዎች የተለያዩ አማራጮችን ወጪዎች እና ጥቅሞች ለመገመት ስታቲስቲካዊ ቴክኒኮችን ይጠቀማሉ። ይህ በጣም በገንዘብ ረገድ አዋጭ የሆነውን የእርምጃ አካሄድ እንዲወስኑ ይረዳቸዋል። የልዩነት ትንተና፡- የሂሳብ ባለሙያዎች በእውነተኛ እና በበጀት ወጪ መካከል ያለውን ልዩነት ለመተንተን ስታቲስቲካዊ ዘዴዎችን ይጠቀማሉ። ይህም ወጪዎች ከሚጠበቀው በላይ ወይም ያነሰባቸውን ቦታዎች እንዲለዩ እና የማስተካከያ እርምጃዎችን እንዲወስዱ ይረዳቸዋል. ኦዲቲንግ ፡ ኦዲተሮች ለፈተና የግብይቱን ተወካይ ናሙና ለመምረጥ ስታቲስቲካዊ ናሙና ቴክኒኮችን ይጠቀማሉ። ይህም ስለ የሂሳብ መግለጫዎች አጠቃላይ ትክክለኛነት እና አስተማማኝነት መደምደሚያ ላይ እንዲደርሱ ይረዳቸዋል. Machine Translated by Google የፋይናንሺያል ትንበያ ፡ የሒሳብ ባለሙያዎች የወደፊት የፋይናንስ አፈጻጸምን ለመተንበይ ስታቲስቲካዊ ሞዴሎችን ይጠቀማሉ። ይህ ስለ በጀት አወጣጥ፣ የሀብት ድልድል እና የአደጋ አስተዳደር በመረጃ ላይ የተመሰረተ ውሳኔ እንዲያደርጉ ይረዳቸዋል። በኮምፒውተር ሳይንስ ምሳሌዎች፡ ማሽን መማር፡- o የሞዴል ግምገማ ፡ የማሽን መማሪያ ሞዴሎችን አፈጻጸም ለመገምገም ስታቲስቲካዊ ዘዴዎች ጥቅም ላይ ይውላሉ። እንደ ትክክለኛነት፣ ትክክለኛነት፣ አስታዋሽ እና F1-score ያሉ መለኪያዎች አንድ ሞዴል በአዲሱ መረጃ ላይ ምን ያህል ውጤቶችን እንደሚተነብይ ለመገምገም ይሰላሉ። o የባህሪ ምርጫ ፡ እንደ የግንኙነት ትንተና እና መላምት ሙከራ ያሉ ስታትስቲካዊ ቴክኒኮች ለማሽን መማሪያ ሞዴል በጣም ተዛማጅ የሆኑትን ባህሪያት ለመለየት ይረዳሉ፣ ትክክለኛነትን እና ቅልጥፍናን ያሻሽላል። o የሞዴል ምርጫ፡- የተለያዩ የማሽን መማሪያ ሞዴሎችን ለማነፃፀር እና በአፈጻጸም መለኪያዎች እና በስታቲስቲካዊ ጠቀሜታ ፈተናዎች ላይ በመመስረት የስታቲስቲክስ ዘዴዎች ጥቅም ላይ ይውላሉ። የመረጃ ማዕድን ማውጣት ፡ o መረጃን ማፅዳትና ማቀናበር ፡ ስታትስቲካዊ ቴክኒኮች የጎደሉትን መረጃዎችን፣ ውጫዊ መረጃዎችን እና በትልልቅ የመረጃ ቋቶች ውስጥ ያሉ አለመጣጣሞችን ለመለየት እና ለማስተናገድ ይጠቅማሉ። o የውሂብ ትንተና ፡ የስታቲስቲክስ ዘዴዎች በመረጃ ውስጥ ያሉትን ንድፎችን፣ አዝማሚያዎችን እና ግንኙነቶችን ለመለየት ጥቅም ላይ ይውላሉ። ለምሳሌ፣ ክላስተር ስልተ ቀመሮች ተመሳሳይ የመረጃ ነጥቦችን በአንድ ላይ ይቧድናሉ፣ የማህበሩ ህግ ማዕድን ማውጣት ግን በተደጋጋሚ አብረው የሚከሰቱ ነገሮችን ይለያል። o Anomaly Detection ፡ የስታቲስቲካዊ ቴክኒኮች በመረጃ ውስጥ የደህንነት ስጋቶችን፣ የስርዓት ውድቀቶችን ወይም ሌሎች ያልተለመዱ ነገሮችን ሊያመለክቱ የሚችሉ ያልተለመዱ ቅጦችን ወይም ባህሪያትን ለመለየት ጥቅም ላይ ይውላሉ። የአውታረ መረብ ትንተና፡- o የአውታረ መረብ አፈጻጸም ፡ የአውታረ መረብ ትራፊክን ለመተንተን ስታትስቲካዊ ዘዴዎች ጥቅም ላይ ይውላሉ፣ ማነቆዎችን ይለዩ እና የአውታረ መረብ አፈጻጸምን ያሳድጉ። o የደህንነት ትንተና ፡ በኔትዎርክ ትራፊክ ውስጥ የደህንነት ጥሰቶችን ወይም ጥቃቶችን ሊያመለክቱ የሚችሉ እስታቲስቲካዊ ቴክኒኮችን ለመለየት ይጠቅማሉ። o የማህበራዊ አውታረመረብ ትንተና፡- እንደ የመስመር ላይ ማህበረሰቦች እና የማህበራዊ ሚዲያ መድረኮች ያሉ የማህበራዊ አውታረ መረቦችን አወቃቀር እና ተለዋዋጭነት ለማጥናት ስታቲስቲካዊ ዘዴዎች ጥቅም ላይ ይውላሉ። የሶፍትዌር ምህንድስና ፡ o አስተማማኝነት ምህንድስና፡- የሶፍትዌር ውድቀት መረጃን ለመተንተን እና የሶፍትዌር ስርዓቶችን አስተማማኝነት ለመገመት ስታቲስቲካዊ ዘዴዎች ጥቅም ላይ ይውላሉ። o የሶፍትዌር ሙከራ ፡ የስታቲስቲካዊ ናሙና ቴክኒኮች የሶፍትዌርን ጥራት ለመገምገም የፈተና ጉዳዮችን ተወካይ ናሙና ለመምረጥ ያገለግላሉ። o የአፈጻጸም ትንተና ፡ አፈፃፀሙን ለመተንተን ስታትስቲካዊ ዘዴዎች ጥቅም ላይ ይውላሉ የሶፍትዌር ስርዓቶች እና ማነቆዎችን መለየት. Machine Translated by Google የኮምፒውተር እይታ፡- o ምስልን ማቀናበር፡- የስታቲስቲክስ ቴክኒኮች ድምጽን ለማጣራት፣ ምስልን ለማሻሻል ጥቅም ላይ ይውላሉ ጥራት, እና ባህሪያትን ከምስሎች ማውጣት. o የነገር ማወቂያ ፡ ስታቲስቲካዊ ዘዴዎች ነገሮችን በምስል ወይም በቪዲዮ ውስጥ ለመለየት እና ለማግኘት ይጠቅማሉ። o የምስል ምደባ ፡ ስታትስቲካዊ ዘዴዎች ምስሎችን መሰረት በማድረግ ለመመደብ ጥቅም ላይ ይውላሉ ይዘታቸው። 1.2. በስታቲስቲክስ ምርመራ ውስጥ ያሉ ደረጃዎች 1.2.1. ችግርን መለየት እና ፍቺ በሂሳብ አያያዝ ምሳሌ፡- አንድ ኩባንያ የሽያጭ መቀነስ ምክንያቶችን መረዳት ይፈልጋል የተወሰነ የምርት መስመር. እርምጃዎች፡- ችግሩን ይግለጹ፡ የተወሰነውን የምርት መስመር እና የሽያጭ ጊዜን ይለዩ ማሽቆልቆል. መረጃ ማሰባሰብ፡ የሽያጭ አሃዞችን፣ የገበያ አዝማሚያዎችን፣ የተፎካካሪ እንቅስቃሴዎችን እና የደንበኛ ግብረመልስ ላይ መረጃን ሰብስብ። የምርምር ጥያቄዎችን ይቅረጹ፡ የሽያጭ መቀነስን የሚነኩ ነገሮች ምንድን ናቸው? እንዴት መሸጥ ይቻላል ይሻሻላል? በኮምፒውተር ሳይንስ ምሳሌ፡- የሶፍትዌር አፕሊኬሽን ትልቅ ነገር እያጋጠመው ነው። የብልሽት ሪፖርቶች እና የተጠቃሚ ቅሬታዎች መጨመር። እርምጃዎች፡- ችግሩን ይግለጹ፡- o ብልሽቶቹ በጣም የበዙበትን ልዩ የሶፍትዌር ሞጁል ወይም ባህሪን ይለዩ በተደጋጋሚ። o የብልሽት ሪፖርቶች ቁጥር የጨመረበትን ጊዜ ይወስኑ። መረጃ መሰብሰብ፡- o የብልሽት ምዝግብ ማስታወሻዎችን ይሰብስቡ እና የስህተት ሪፖርቶችን ዋና መንስኤዎችን ለመተንተን። ማንኛውም ያልተለመደ የሀብት አጠቃቀምን ወይም አፈጻጸምን ለመለየት የስርዓት ምዝግብ ማስታወሻዎችን ይቆጣጠሩ ማነቆዎች. o ልምዳቸውን ለመረዳት የተጠቃሚዎችን አስተያየት በዳሰሳ ጥናቶች፣ መድረኮች ወይም ማህበራዊ ሚዲያዎች ይሰብስቡ። o ሊከሰቱ የሚችሉ ማንኛቸውም የአጠቃቀም ዘይቤ ለውጦችን ለመለየት የተጠቃሚ ባህሪ መረጃን ይተንትኑ ለጉዳዩ አስተዋፅዖ ማድረግ. የምርምር ጥያቄዎችን መቅረጽ፡ o የሶፍትዌሩ ብልሽቶች ዋና መንስኤዎች ምንድናቸው? o የበለጠ ተጋላጭ የሆኑ ልዩ የሃርድዌር ወይም የሶፍትዌር ውቅሮች አሉ። ለማደናቀፍ? Machine Translated by Google o የሶፍትዌሩ መረጋጋት እና አፈጻጸም እንዴት ሊሻሻል ይችላል? o የተጠቃሚውን ብስጭት ለመቀነስ እና አጠቃላይ ተጠቃሚን ለማሻሻል ምን እርምጃዎች መወሰድ ይችላሉ። ልምድ? 1.2.2. የውሂብ ስብስብ በሂሳብ አያያዝ ምሳሌ፡ ኩባንያው የሽያጭ መረጃን፣ የደንበኞችን ዳሰሳ ምላሽ እና የተፎካካሪ የገበያ ድርሻ መረጃዎችን ይሰበስባል። ዘዴዎች፡- o ዋና መረጃ፡ ጥናቶች፣ ቃለመጠይቆች፣ ምልከታዎች፣ ሙከራዎች (ለምሳሌ፣ ሙከራ አዲስ ምርት ለገበያ ማቅረብ)። o ሁለተኛ ደረጃ መረጃ፡ የውስጥ ኩባንያ መዝገቦች፣ የኢንዱስትሪ ሪፖርቶች፣ መንግሥት ስታቲስቲክስ, የታተመ ምርምር. የኮምፒዩተር ሳይንስ ምሳሌ፡ ኩባንያው የተጠቃሚ መስተጋብር መረጃን፣ የድረ-ገጽ ትራፊክ ሎግዎችን እና የማህበራዊ ሚዲያ ስሜትን ትንተና ይሰበስባል። ዘዴዎች፡- o የመጀመሪያ ደረጃ መረጃ፡ የተጠቃሚ ዳሰሳ እና ግብረመልስ፡ ከተጠቃሚዎች ቀጥተኛ ግብረ መልስ በዳሰሳ ጥናቶች፣ መጠይቆች ወይም ቃለመጠይቆች መሰብሰብ። A/B ሙከራ፡ በተጠቃሚ ባህሪ ላይ ያላቸውን ተጽእኖ ለመለካት በተለያዩ የድርጣቢያ ንድፎች፣ ባህሪያት ወይም የግብይት ስልቶች መሞከር። የተጠቃሚ ምዝግብ ማስታወሻዎች እና ትንታኔዎች፡ የተጠቃሚዎችን ከስርአቱ ጋር ያለውን ግንኙነት መከታተል እንደ ጠቅታዎች ፣ የገጽ እይታዎች እና በተለያዩ ክፍሎች ላይ የሚጠፋ ጊዜ። የአይን መከታተያ ጥናቶች፡ የተጠቃሚውን የአይን እንቅስቃሴ ከተጠቃሚው በይነገጽ ጋር እንዴት እንደሚገናኙ ለመረዳት የመተንተን። o ሁለተኛ ደረጃ መረጃ፡ የዌብ ሰርቨር ምዝግብ ማስታወሻዎች፡ በተጠቃሚ ባህሪ፣ስህተቶች እና የደህንነት ስጋቶች ላይ ያሉ ቅጦችን ለመለየት የአገልጋይ ምዝግብ ማስታወሻዎችን መተንተን። የማህበራዊ ሚዲያ ዳታ፡ የማህበራዊ ሚዲያ መድረኮችን መከታተል የህዝብን መለኪያ አስተያየት, አዝማሚያዎችን መለየት እና የደንበኞችን ስሜት መተንተን. በአደባባይ የሚገኙ የውሂብ ስብስቦች፡ የማሽን መማሪያ ሞዴሎችን ለማሰልጠን እና ለመሞከር እንደ Kaggle ወይም UCI Machine Learning Repository ካሉ ድርጅቶች የተገኙ መረጃዎችን መጠቀም። የውስጥ ኩባንያ መረጃ፡ አዝማሚያዎችን ለመለየት እና በመረጃ ላይ የተመሰረተ ውሳኔዎችን ለማድረግ በተጠቃሚ ባህሪ፣ ሽያጭ እና የግብይት ዘመቻዎች ላይ ታሪካዊ መረጃዎችን መድረስ። 1.2.3. የውሂብ ማጽዳት እና ዝግጅት በሂሳብ አያያዝ ውስጥ ምሳሌ፡- ስህተቶችን፣ አለመጣጣሞችን እና የጎደሉ እሴቶችን በ የተሰበሰበ መረጃ. እርምጃዎች፡ o አርትዕ፡ ስህተቶችን እና አለመግባባቶችን አስተካክል (ለምሳሌ፣ የተባዙ ግቤቶች)። o ኮድ፡ ለመተንተን የቁጥር ወይም የምድብ ኮዶችን ወደ ዳታ መድብ። o ሠንጠረዡ፡ መረጃን ወደ ፍሪኩዌንሲ ሰንጠረዦች ወይም ሌሎች ቅርጸቶች አደራጅ። Machine Translated by Google ምሳሌ በኮምፒዩተር ሳይንስ፡ ዳታ ማዕድን ደረጃዎች፡ o አርትዕ፡ እንደ አማካኝ ግምት፣ ሚዲያን ግምት ወይም ሁነታ ግምትን የመሳሰሉ ቴክኒኮችን በመጠቀም የጎደሉ እሴቶችን አስቡ። ከመጠን በላይ እሴቶችን በመክተት ወይም ወለል በማድረግ የውጭ ዕቃዎችን ይያዙ። የቁጥር መረጃዎችን ወደ አንድ የጋራ ሚዛን መደበኛ ማድረግ ወይም መደበኛ ማድረግ። o ኮድ፡- ምድብ ባህሪያትን ወደ የቁጥር ውክልና ቀይር (ለምሳሌ፣ አንድ-ትኩስ ኢንኮዲንግ፣ መለያ ኢንኮዲንግ)። ቀጣይነት ያላቸውን ባህሪያት መለየት (ለምሳሌ፣ ቢኒንግ)። o ሠንጠረዥ፡ በምድብ መካከል ያለውን ግንኙነት ለመተንተን የድንገተኛ ጊዜ ሠንጠረዦችን ይፍጠሩ ተለዋዋጮች. ሂስቶግራም እና ቦክስ ፕላኖችን በመጠቀም የመረጃ ስርጭቶችን በዓይነ ሕሊናህ ተመልከት። 1.2.4. የውሂብ ትንተና በሂሳብ አያያዝ ውስጥ ያለ ምሳሌ፡ የተሰበሰበውን መረጃ በመመርመር አዝማሚያዎችን፣ ቅጦችን እና ሁኔታዎችን መለየት ግንኙነቶች. ገላጭ ስታቲስቲክስ፡ የማዕከላዊ ዝንባሌ መለኪያዎችን አስሉ (አማካይ፣ መካከለኛ፣ ሞድ) እና መረጃን ለማጠቃለል ስርጭት (ልዩነት ፣ መደበኛ ልዩነት)። ኢንፈረንሻል ስታቲስቲክስ፡- በናሙና መረጃ ላይ ተመስርተው ስለ ህዝቡ አስተያየት ለመስጠት የመላምት ሙከራ እና የመተማመን ክፍተቶችን ይጠቀሙ። የውሂብ ምስላዊ፡ ገበታዎችን እና ግራፎችን (ለምሳሌ ባር ገበታዎች፣ ሂስቶግራሞች፣ የመስመር ገበታዎች) ይፍጠሩ ወደ በእይታ መረጃን እና ግኝቶችን ይወክላል። ምሳሌ በኮምፒውተር ሳይንስ አውድ፡ አዝማሚያዎችን፣ ቅጦችን እና ግንኙነቶችን ለመለየት የተሰበሰበውን መረጃ ተንትን። ገላጭ ስታቲስቲክስ፡ o የአፈጻጸም መለኪያዎች፡ አማካኝ የምላሽ ጊዜን፣ የማህደረ ትውስታ አጠቃቀምን እና አስላ። የሶፍትዌር መተግበሪያ ሲፒዩ አጠቃቀም። o የአውታረ መረብ ትራፊክ ትንተና፡- ከፍተኛውን የአጠቃቀም ጊዜ፣ አማካይ የውሂብ ማስተላለፍን ይወስኑ ተመኖች፣ እና በጣም ተደጋጋሚ ፕሮቶኮሎች በአውታረ መረብ ላይ ጥቅም ላይ ይውላሉ። o የተጠቃሚ ባህሪ ትንተና፡ አማካኝ የክፍለ ጊዜ ቆይታ፣ በአንድ ክፍለ ጊዜ የጠቅታዎች ብዛት እና በድረ-ገጽ ላይ በብዛት የሚጎበኙ ገፆችን አስላ። ኢንፈረንሻል ስታቲስቲክስ፡- o A/B ሙከራ፡ አዲስ ባህሪ ወይም የንድፍ ለውጥ በተጠቃሚ ተሳትፎ ወይም የልወጣ ተመኖች ላይ ከፍተኛ ተጽዕኖ እንደሚያሳድር ለማወቅ የመላምት ሙከራን ይጠቀሙ። o የማሽን መማሪያ ሞዴል ግምገማ፡ የመተማመን ክፍተቶችን ለመገምገም ይጠቀሙ የሰለጠነ ሞዴል ትንበያ ትክክለኛነት እና አስተማማኝነት. Machine Translated by Google o የአውታረ መረብ ያልተለመደ ማወቅ፡ ያልተለመደ አውታረ መረብን ለመለየት ስታቲስቲካዊ ሙከራዎችን ይጠቀሙ የደህንነት ስጋቶችን ሊያመለክቱ የሚችሉ የትራፊክ ቅጦች. የውሂብ እይታ፡- o የሰዓት ተከታታይ ትንተና፡ የድረ-ገጽ ትራፊክ አዝማሚያዎችን ለማየት የመስመር ገበታዎችን ይፍጠሩ፣ የአክሲዮን ዋጋዎች፣ ወይም የዳሳሽ ንባቦች በጊዜ ሂደት። o የስርጭት ትንተና፡- የመረጃ ስርጭትን በዓይነ ሕሊናህ ለማየት ሂስቶግራምን ተጠቀም እንደ የተጠቃሚ ዕድሜዎች ወይም የገቢ ደረጃዎች ስርጭት. o የግንኙነት ትንተና፡- በማስታወቂያ ወጪ እና በሽያጭ መካከል ያለውን ግንኙነት በመሳሰሉት በሁለት ተለዋዋጮች መካከል ያለውን ግንኙነት ለማየት የተበታተኑ ቦታዎችን ይፍጠሩ። o የአውታረ መረብ ቶፖሎጂ ምስላዊነት፡ በምስል ለማሳየት የኔትወርክ ንድፎችን ተጠቀም የአውታረ መረብ መዋቅር እና ግንኙነት. 1.2.5. የውጤቶች ትርጓሜ በሂሳብ አያያዝ ምሳሌ፡- ከመረጃ ትንተና የተገኙትን ግኝቶች መተርጎም እና በምክንያቶቹ ላይ መደምደሚያ ላይ መድረስ ለሽያጭ ማሽቆልቆል. ግኝቶችን ከምርምር ጥያቄዎች ጋር ማያያዝ፡ በችግር መለያ ደረጃ ላይ የተነሱትን ጥያቄዎች ይመልሱ። ውስንነቶችን ግምት ውስጥ ያስገቡ፡- በመረጃ አሰባሰብ እና ትንተና ውስጥ ሊሆኑ የሚችሉ አድሎአዊ ጉዳዮችን ወይም ገደቦችን እውቅና ይስጡ። ምሳሌ በኮምፒውተር ሳይንስ፡ የማሽን መማሪያ ሞዴል አፈጻጸም የግኝቶች ትርጓሜ፡ የማሽን መማሪያ ሞዴል የአፈጻጸም መለኪያዎችን እንደ ትክክለኛነት፣ ትክክለኛነት፣ ማስታወስ እና F1-score ገምግሚ። የተዛባ ምደባዎችን እና መሻሻል ቦታዎችን ለመለየት ግራ መጋባትን ማትሪክስ ይተንትኑ። ግኝቶችን ከምርምር ጥያቄዎች ጋር ማያያዝ፡- o RQ1: የደንበኛ መጨናነቅን ለመተንበይ ሞዴሉ ምን ያህል ትክክለኛ ነው? መልስ: አምሳያው 85% ትክክለኛነትን ያሳካል, ይህም ጠንካራ መሆኑን ያሳያል የመተንበይ ኃይል. o RQ2፡ የደንበኛ መጨናነቅ ላይ ተጽዕኖ የሚያደርጉ ቁልፍ ነገሮች ምንድን ናቸው? መልስ፡ የባህሪ አስፈላጊነት ትንተና የኮንትራት ርዝማኔ እና የደንበኞች አገልግሎት መስተጋብር በጣም አስፈላጊ ነገሮች መሆናቸውን ያሳያል። ገደቦችን ግምት ውስጥ በማስገባት፡ o የአምሳያው አፈጻጸም በጥራት እና በመጠን ሊገደብ ይችላል። የስልጠና መረጃ. o ሞዴሉ ለማይታየው መረጃ በደንብ ላያጠቃልል ይችላል፣ በተለይም ከስር ያለው የውሂብ ስርጭት ለውጦች. 1.2.6. ሪፖርት ማድረግ እና ግንኙነት ግኝቶቹን እና ምክሮችን የሚያጠቃልል ግልጽ እና አጭር ዘገባ ያዘጋጁ። ታዳሚ፡- የታሰቡትን ታዳሚዎች ግምት ውስጥ ያስገቡ (ለምሳሌ፣ አስተዳደር፣ ባለድርሻ አካላት) እና ሪፖርቱን በዚሁ መሰረት አዘጋጁ። Machine Translated by Google የእይታ መርጃዎች፡ ግንዛቤን እና ግንኙነትን ለማሳደግ ቻርቶችን እና ግራፎችን ይጠቀሙ ውጤቶች. በሂሳብ አያያዝ ምሳሌ፡- አንድ ኩባንያ አዲስ የተወዳዳሪ ምርት ይፋ ማድረጉ በሽያጭቸው ላይ ተጽዕኖ እንዳሳደረባቸው ጥርጣሬ አድሮበታል። ላለፈው ዓመት የሽያጭ መረጃዎችን ይሰበስባሉ፣ የደንበኞችን ዳሰሳ ያካሂዳሉ፣ እና የተፎካካሪ የገበያ ድርሻ መረጃን ይመረምራሉ። በመረጃ ትንተና፣ በተወዳዳሪው ምርት ጅምር እና በሽያጭቸው መቀነስ መካከል ያለውን ትስስር ያገኛሉ። በተጨማሪም በውድድሩ የበለጠ ተጽዕኖ ያላቸውን የተወሰኑ የደንበኛ ክፍሎችን ይለያሉ. በእነዚህ ግኝቶች ላይ በመመስረት, ኩባንያው የውድድር ስጋትን ለመፍታት እና የገበያ ድርሻን መልሶ ለማግኘት ስልቶችን ማዘጋጀት ይችላል. የሳይበር ደህንነት ስጋት ግምገማ፡ የሳይበር ደህንነት ቡድን የድርጅቱን የኔትወርክ መሠረተ ልማት በተመለከተ አጠቃላይ የተጋላጭነት ግምገማ ያካሂዳል። እንደ ደካማ የይለፍ ቃሎች፣ ጊዜ ያለፈባቸው ሶፍትዌሮች እና የተሳሳቱ ውቅሮች ያሉ ተጋላጭነቶችን ይለያሉ። የጥቃቶችን እድል ለመገምገም የስጋት መረጃ ሪፖርቶችንም ይተነትናል። ሪፖርት እና ግንኙነት፡- ታዳሚ፡ የሳይበር ደህንነት ቡድን፣ የአይቲ አስተዳደር እና የስራ አስፈፃሚ አመራር። የእይታ መርጃዎች፡ ተጋላጭነትን የሚያጎሉ የአውታረ መረብ ንድፎች፣ የተጋላጭነት አይነቶች ስርጭትን የሚያሳዩ የፓይ ገበታዎች እና የድርጅቱን የደህንነት አቋም ከኢንዱስትሪ መመዘኛዎች ጋር የሚያወዳድሩ የባር ገበታዎች። 1.3. የአንዳንድ መሰረታዊ ቃላት ፍቺ በስታቲስቲክስ ውስጥ, በተደጋጋሚ ጥቅም ላይ የሚውሉ በርካታ መሰረታዊ ቃላት አሉ. እነዚህ ውሎች የሚከተሉትን ያካትታሉ: የህዝብ ብዛት፡- እኛ ልናጠናው የምንፈልገው የግለሰቦች ወይም የነገሮች ቡድን በሙሉ። የኩባንያው ደንበኞች በሙሉ። ሁሉም ሊሆኑ የሚችሉ ግብዓቶች ወደ መደርደር አልጎሪዝም (ለምሳሌ፣ ሁሉም ሊሆኑ የሚችሉ የኢንቲጀር ድርድር)። ናሙና፡ ለጥናት የምንመርጠው የህዝብ ስብስብ። ከህዝቡ የተመረጡ 100 ደንበኞች ስብስብ። 10,000 በዘፈቀደ የተፈጠረ ድርድር። ተለዋዋጭ፡ የተለያዩ እሴቶችን ሊወስዱ የሚችሉ የግለሰቦች ወይም ነገሮች ባህሪ ወይም ንብረት። ደንበኞች ለአንድ ምርት የሚያወጡት የገንዘብ መጠን። በአንድ የተወሰነ ግብአት ላይ የመደርደር ስልተ ቀመር የሚፈጸምበት ጊዜ። ውሂብ፡ ተለዋዋጮች የሚወስዱት ዋጋ። በናሙና የተካተቱት 100 ደንበኞች ለምርቱ ያወጡት የገንዘብ መጠን። በናሙና ውስጥ ለእያንዳንዱ ድርድር የሚለካው የማስፈጸሚያ ጊዜ። Machine Translated by Google መለኪያ፡ የቁጥር እሴት የአንድን ህዝብ ባህሪ የሚገልጽ ነው። ሁሉም የኩባንያው ደንበኞች የሚያወጡት አማካይ የገንዘብ መጠን ለ ምርት. የመደርደር ስልተ ቀመር አማካይ የጉዳይ ጊዜ ውስብስብነት (ለምሳሌ፣ O(n log n) ለፈጣን መደርደር)። ስታትስቲክስ፡ የናሙና ባህሪን የሚገልጽ የቁጥር እሴት። በናሙና የተካተቱት 100 ደንበኞች ለምርቱ ያወጡት አማካይ የገንዘብ መጠን። በ10,000 ድርድሮች ናሙና ላይ የመደርደር አልጎሪዝም አማካይ የአፈፃፀም ጊዜ። ገላጭ ስታቲስቲክስ፡ መረጃን ማጠቃለል እና መግለጽ የሚመለከተው የስታስቲክስ ቅርንጫፍ። በናሙና የተካተቱት 100 ደንበኞች ለምርቱ ያወጡትን የገንዘብ መጠን እንደ አማካኝ፣ ሚድያን፣ ሞድ እና መደበኛ መዛባት ያሉ ማጠቃለያ ስታቲስቲክስ። ለ ናሙና. ኢንፈረንሻል ስታቲስቲክስ፡- ስለ ሀ ግምት መስጠትን የሚመለከተው የስታስቲክስ ቅርንጫፍ በናሙና ላይ የተመሰረተ የህዝብ ብዛት. ሁሉም የኩባንያው ደንበኞች ለምርቱ የሚያወጡትን አማካይ የገንዘብ መጠን በተመለከተ 100 የናሙና ደንበኞች ለምርት ያወጡትን አማካይ የገንዘብ መጠን ግምት ውስጥ ማስገባት። የናሙና ስታቲስቲክስን በመጠቀም የግብአት አከፋፈል ስልተ ቀመር አማካይ የጉዳይ ጊዜ ውስብስብነት ለመገመት ነው። 1.4. የስታቲስቲክስ አፕሊኬሽኖች፣ አጠቃቀሞች እና ገደቦች 1.4.1. የስታቲስቲክስ መተግበሪያዎች ስታቲስቲክስ በሂሳብ አያያዝ ውስጥ ወሳኝ ሚና ይጫወታል፣ ጠቃሚ ግንዛቤዎችን እና መሳሪያዎችን ለፋይናንሺያል ትንተና፣ ውሳኔ አሰጣጥ እና የአደጋ አስተዳደርን ያቀርባል። አንዳንድ ቁልፍ መተግበሪያዎች እነኚሁና፡ የፋይናንሺያል ሪፖርት ማድረግ፡ ስታትስቲክስ የፋይናንስ መረጃዎችን በማጠቃለል እና በመተንተን ትክክለኛ እና መረጃ ሰጭ የሂሳብ መግለጫዎችን ለማዘጋጀት ይረዳል፣ ለምሳሌ የሂሳብ መዝገብ፣ የገቢ መግለጫ እና የገንዘብ ፍሰት መግለጫ። እንደ አማካኝ፣ ሚዲያን እና ሞድ ያሉ የስታቲስቲክስ ቴክኒኮች የፋይናንስ ሬሾዎችን ለማስላት እና በጊዜ ሂደት አዝማሚያዎችን ለመተንተን ጥቅም ላይ ሊውሉ ይችላሉ። የፋይናንሺያል ትንተና፡ የቢዝነስ ፋይናንሺያል ስራን እና አቋምን ለመገምገም ስታትስቲካዊ ዘዴዎች ስራ ላይ ይውላሉ። እንደ ልዩነት ትንተና፣ ሬሾ ትንተና እና የአዝማሚያ ትንተና ያሉ ቴክኒኮች ጥንካሬዎችን፣ ድክመቶችን እና መሻሻሎችን ለመለየት ይረዳሉ። ለምሳሌ፣ የተለያዩ የምርት መስመሮችን ትርፋማነት ለማነፃፀር ወይም የእቃ ማከማቻ አስተዳደርን ውጤታማነት ለመገምገም ስታቲስቲካዊ ትንታኔን መጠቀም ይቻላል። Machine Translated by Google የወጪ ሂሳብ አያያዝ፡ ስታቲስቲክስ ለወጪ ግምት፣ በጀት አወጣጥ እና ልዩነት ትንተና ይረዳል። የስታቲስቲክስ ቴክኒኮችን በታሪካዊ መረጃ ላይ በመመርኮዝ የወደፊት ወጪዎችን ለመገመት ፣ ወጪዎችን ለተለያዩ ምርቶች ወይም ክፍሎች ለመመደብ እና የወጪ ልዩነቶችን ለመለየት ጥቅም ላይ ሊውል ይችላል። ኦዲት ማድረግ፡- ኦዲተሮች የግብይቶች ወይም የሰነድ ተወካይ ናሙና ለመምረጥ ስታቲስቲካዊ ናሙና ቴክኒኮችን ይጠቀማሉ። ይህ የፋይናንስ መዝገቦችን አጠቃላይ አስተማማኝነት ለመገምገም እና ሊከሰቱ የሚችሉ ስህተቶችን ወይም ስህተቶችን ለመለየት ይረዳል. የአደጋ አስተዳደር፡- የፋይናንስ አደጋዎችን ለመለካት እና ለመቆጣጠር የስታቲስቲክስ ሞዴሎችን መጠቀም ይቻላል። እንደ ፕሮባቢሊቲ ትንተና እና መላምት ሙከራ ያሉ ቴክኒኮች የገንዘብ ኪሳራዎችን እድል ለመገምገም እና የአደጋ ቅነሳ ስልቶችን ውጤታማነት ለመገምገም ይረዳሉ። በተለያዩ የኮምፒዩተር ሳይንስ ዘርፎች ውስጥ ስታቲስቲክስ ወሳኝ ሚና ይጫወታል፣ ይህም በመረጃ ላይ የተመሰረተ ውሳኔ አሰጣጥ፣ ሞዴል ልማት እና የስርዓት ማመቻቸት መሰረት ይሰጣል። አንዳንድ ቁልፍ መተግበሪያዎች እነኚሁና፡ የውሂብ ሳይንስ እና የማሽን መማር፡ o የውሂብ ትንተና እና እይታ፡ እንደ ገላጭ ስታቲስቲክስ፣ የቁርኝት ትንተና እና መላምት ሙከራ ያሉ እስታቲስቲካዊ ቴክኒኮች ትልልቅ የውሂብ ስብስቦችን ለመዳሰስ፣ ለማጠቃለል እና ለማየት ያገለግላሉ። o የሞዴል ግንባታ እና ግምገማ፡ የስታቲስቲካዊ ሞዴሊንግ ቴክኒኮች፣ እንደ መስመራዊ ሪግሬሽን፣ የሎጂስቲክ ሪግሬሽን እና የሰዓት ተከታታይ ትንተና ያሉ ግምታዊ ሞዴሎችን ለመገንባት ስራ ላይ ይውላሉ። o የባህሪ ምህንድስና እና ምርጫ፡- የስታቲስቲክስ ዘዴዎች ከከፍተኛ-ዲሜንሽናል ዳታሴቶች ጠቃሚ ባህሪያትን በመምረጥ እና ለሞዴል ስልጠና ወደ ተስማሚ ፎርማት ለመቀየር ይረዳሉ። o የሞዴል ግምገማ እና ማረጋገጫ፡ እንደ ትክክለኛነት፣ ትክክለኛነት፣ አስታዋሽ፣ F1-score እና ROC ከርቭ ያሉ ስታትስቲካዊ መለኪያዎች የማሽን መማሪያ ሞዴሎችን አፈጻጸም ለመገምገም ያገለግላሉ። ሰው ሰራሽ እውቀት፡ o የተፈጥሮ ቋንቋ ሂደት (NLP)፡ ስታቲስቲካዊ ቴክኒኮች ለመሳሰሉት ተግባራት ያገለግላሉ። የጽሑፍ ምደባ, የስሜት ትንተና እና የማሽን ትርጉም. o የኮምፒውተር እይታ፡ እንደ ባዬዥያ ኢንፈረንስ እና ፕሮባቢሊቲ ግራፊክስ ሞዴሎች ያሉ ስታቲስቲካዊ ዘዴዎች ለምስል እና ቪዲዮ ትንተና ይተገበራሉ። o ሮቦቲክስ፡ ስታቲስቲካዊ ቴክኒኮች ለሮቦት እንቅስቃሴ እቅድ፣ ዳሳሽ ውህደት፣ እና ቁጥጥር ስርዓቶች. የሶፍትዌር ምህንድስና፡ o የሶፍትዌር ተዓማኒነት፡ የስታቲስቲክስ ዘዴዎች የሶፍትዌርን አስተማማኝነት ለመገመት እና የውድቀቶቹን ብዛት ለመተንበይ ያገለግላሉ። o የሶፍትዌር ሙከራ፡- የፈተና ጉዳዮችን ተወካይ ናሙና ለመምረጥ የስታቲስቲካዊ ናሙና ዘዴዎች ጥቅም ላይ ይውላሉ። o የአፈጻጸም ትንተና፡ አፈፃፀሙን ለመተንተን ስታትስቲካዊ ቴክኒኮች ጥቅም ላይ ይውላሉ የሶፍትዌር ስርዓቶች እና ማነቆዎችን መለየት. Machine Translated by Google የኔትወርክ እና የስርአት አስተዳደር፡- o የአውታረ መረብ አፈጻጸም ክትትል፡ ስታቲስቲካዊ ቴክኒኮች ለመከታተል ጥቅም ላይ ይውላሉ የአውታረ መረብ ትራፊክ፣ ያልተለመዱ ነገሮችን መለየት እና አለመሳካቶችን መተንበይ። o የስርዓት አፈጻጸምን ማሻሻል፡ ስታቲስቲካዊ ዘዴዎች ስርዓትን ለመተንተን ጥቅም ላይ ይውላሉ የአፈጻጸም መለኪያዎች እና መሻሻል ያለባቸውን ቦታዎች ይለዩ. መረጃ ማግኘት፡- o የፍለጋ ሞተር ማበልጸጊያ (SEO)፡- የስታቲስቲክስ ቴክኒኮችን ለመተንተን ጥቅም ላይ ይውላሉ የፍለጋ ሞተር አልጎሪዝም እና የድር ጣቢያ ይዘትን ያሻሽሉ። o የመረጃ ማግኛ ስርዓቶች፡ የፍለጋ ውጤቶችን ደረጃ ለመስጠት ስታትስቲካዊ ዘዴዎች ጥቅም ላይ ይውላሉ እና የመረጃ መልሶ ማግኛን ትክክለኛነት ያሻሽሉ። 1.4.2. የስታቲስቲክስ አጠቃቀም በሂሳብ አያያዝ ውስጥ አንዳንድ ልዩ የስታቲስቲክስ አጠቃቀሞች፡- የፋይናንስ አፈጻጸምን መገምገም፡- እንደ ትርፋማነት፣ የገንዘብ መጠን፣ እና የመፍታት ሬሾዎች የንግድን አጠቃላይ ጤና ለመገምገም። የወደፊት ገቢዎችን እና ወጪዎችን መተንበይ፡- እንደ ሪግሬሽን ያሉ ስታቲስቲካዊ ሞዴሎችን መጠቀም በታሪካዊ መረጃ ላይ በመመርኮዝ የወደፊቱን የፋይናንስ አፈፃፀም ለመተንበይ ትንታኔ. የወጪ ልዩነቶችን መለየት፡- ትክክለኛ ወጪዎችን ከበጀት ወጪዎች ጋር ማወዳደር እና ስታቲስቲካዊ አጠቃቀም የልዩነት መንስኤዎችን ለመተንተን ቴክኒኮች ። የፋይናንስ መረጃን አስተማማኝነት መገምገም፡- ኦዲት ለማድረግ ስታቲስቲካዊ ናሙና ቴክኒኮችን መጠቀም የገንዘብ መዝገቦችን እና ሊሆኑ የሚችሉ ስህተቶችን ወይም ያልተለመዱ ነገሮችን መለየት. ኢንቨስትመንቶችን እና ፋይናንስን በሚመለከት በመረጃ ላይ የተመሰረተ ውሳኔ ማድረግ፡- የተለያዩ የኢንቨስትመንት አማራጮችን አደጋ እና መመለስን እና የፋይናንስ አማራጮችን ለመገምገም ስታቲስቲካዊ ትንታኔን መጠቀም። በኮምፒውተር ሳይንስ ውስጥ የተወሰኑ የስታቲስቲክስ አጠቃቀሞች፡- የውሂብ ማዕድን እና የማሽን መማር፡ o ስርዓተ-ጥለት ዕውቅና፡ በትልቅ የውሂብ ስብስቦች ውስጥ ያሉ ቅጦችን እና አዝማሚያዎችን እንደ ክላስተር፣ ምደባ እና የማህበር ህግ ማዕድን ማውጣት ያሉ ቴክኒኮችን መለየት። o ትንበያ ሞዴሊንግ፡ እንደ ደንበኛ መጨናነቅ፣ የምርት ሽያጭ ወይም የስርዓት ውድቀቶች ያሉ የወደፊት ውጤቶችን ለመተንበይ ሞዴሎችን መገንባት እንደ ሪግሬሽን፣ የውሳኔ ዛፎች እና የነርቭ አውታረ መረቦች ያሉ ስልተ ቀመሮችን በመጠቀም። o Anomaly Detection፡ ደህንነትን ሊያመለክቱ የሚችሉ ያልተለመዱ ቅጦችን ማግኘት ጥሰቶች፣ የስርዓት ብልሽቶች ወይም የማጭበርበር እንቅስቃሴዎች። የተፈጥሮ ቋንቋ ሂደት (NLP)፡- o የስሜት ትንተና፡ ስሜቱን ለማወቅ የጽሑፍ መረጃን መተንተን (አዎንታዊ፣ አሉታዊ, ወይም ገለልተኛ) በጽሁፉ ውስጥ ተገልጿል. o የጽሑፍ ምደባ፡- የጽሑፍ ሰነዶችን አስቀድሞ በተገለጹ ምድቦች መመደብ እንደ አይፈለጌ መልዕክት/አይፈለጌ መልዕክት ወይም የዜና ዘገባዎች በርዕስ። Machine Translated by Google o የማሽን ትርጉም፡ ስታቲስቲካዊ ሞዴሎችን በመጠቀም ከአንድ ቋንቋ ወደ ሌላ ጽሑፍ መተርጎም። የኮምፒውተር እይታ፡- o የምስል ምደባ፡- ነገሮችን እና ትዕይንቶችን በምስሎች ውስጥ እንደ convolutional neural network ቴክኒኮችን በመጠቀም መለየት። o የነገር ማወቂያ፡ በምስሎች ውስጥ ያሉትን ነገሮች ማግኘት እና መለየት። o የምስል ክፍፍል፡ ምስሎችን ወደ ትርጉም ክልሎች መከፋፈል። የአውታረ መረብ ትንተና፡- o የትራፊክ ትንተና፡ አቅምን ለመለየት የኔትወርክ ትራፊክ ንድፎችን መተንተን ማነቆዎች፣ የደህንነት ስጋቶች ወይም ያልተለመዱ ነገሮች። o የአፈጻጸም ክትትል፡ ጉዳዮችን ለመለየት እና መላ ለመፈለግ እንደ መዘግየት፣ ውፅዓት እና ፓኬት መጥፋት ያሉ የአውታረ መረብ አፈጻጸም መለኪያዎችን መከታተል። የሶፍትዌር ምህንድስና፡ o ተዓማኒነት ምህንድስና፡- አስተማማኝነትን ለመገመት እና የወደፊት ውድቀቶችን ለመተንበይ የሶፍትዌር ውድቀት መረጃን መመርመር። o የሶፍትዌር ሙከራ፡- ሶፍትዌሮችን ለመለየት እና ለማስተካከል ሙከራዎችን መንደፍ እና ማከናወን ጉድለቶች. o የሶፍትዌር መለኪያዎች፡ የሶፍትዌር ጥራት ባህሪያትን መለካት፣ እንደ የኮድ ውስብስብነት፣ ጠብቆ ማቆየት እና መፈተሽ። 1.4.3. የስታቲስቲክስ ገደቦች ስታቲስቲክስ በአካውንቲንግ እና በኮምፒውተር ሳይንስ ውስጥ ኃይለኛ መሳሪያ ቢሆንም የተወሰኑ ገደቦች አሉት፡- በታሪካዊ መረጃ ላይ መደገፍ፡- የስታቲስቲክስ ትንተና ያለፈው መረጃ መሰረት ያደረገ ነው፣ እና የወደፊት አዝማሚያዎች ተመሳሳይ ዘይቤዎችን ለመከተል ዋስትና የለም። የመደበኛነት ግምት፡- ብዙ የስታቲስቲክስ ቴክኒኮች መረጃ መደበኛ ስርጭትን እንደሚከተል ይገምታሉ፣ ይህም ሁልጊዜ በእውነተኛው ዓለም የሂሳብ አያያዝ መረጃ ላይሆን ይችላል። ለወጣቶች ስሜታዊነት፡- የስታቲስቲክስ ትንተና ለውጫዊ አካላት ስሜታዊ ሊሆን ይችላል፣ ይህም ሊያዛባ ይችላል። ውጤቶቹ እና ትክክለኛ መደምደሚያዎችን ለማድረግ አስቸጋሪ ያደርጉታል. የጥራት ሁኔታዎችን የመያዝ አቅም ውስን፡- የስታቲስቲክስ ትንተና በዋናነት በቁጥር መረጃ ላይ ያተኩራል እና በፋይናንሺያል አፈጻጸም ላይ ተጽእኖ ሊያሳድሩ የሚችሉ ጠቃሚ የጥራት ሁኔታዎችን ላይይዝ ይችላል። 1.5. የመለኪያ መለኪያዎች 1.5.1. የስም ልኬት ፍቺ፡- የስም ሚዛን መረጃው ባለበት በጣም ቀላሉ የመለኪያ ደረጃ ነው። ምንም ውስጣዊ ቅደም ተከተል ወይም ደረጃ በሌለው ልዩ ቡድኖች ተከፋፍሏል. ባህሪያት፡- o ምድቦች እርስ በርስ የሚጋጩ ናቸው (ንጥሉ የአንድ ምድብ ብቻ ሊሆን ይችላል)። Machine Translated by Google o ምድቦች የቁጥር እሴት ወይም ትርጉም የላቸውም። በሂሳብ አያያዝ ምሳሌዎች፡ o የግብይቶች ዓይነቶች (ጥሬ ገንዘብ፣ ክሬዲት፣ ጥሬ ገንዘብ ያልሆኑ) o ክፍሎች (ሽያጭ፣ ምርት፣ ፋይናንስ) o የመለያ ምደባዎች (ንብረት፣ ዕዳዎች፣ ፍትሃዊነት፣ ገቢ፣ ወጪዎች) በኮምፒውተር ሳይንስ ምሳሌዎች o የፕሮግራሚንግ ቋንቋዎች፡- የስክሪፕት ቋንቋዎች፡ Python፣ JavaScript፣ Ruby በነገር ላይ ያተኮሩ ቋንቋዎች፡ Java፣ C++፣ C# ተግባራዊ ቋንቋዎች፡ Haskell፣ Lisp፣ Erlang o የውሂብ አይነቶች፡- ቁጥር፡ ኢንቲጀር፣ ተንሳፋፊ፣ ድርብ ጽሑፍ፡ ሕብረቁምፊ፣ ቁምፊ , RAM, Storage o Network Protocos: TCP/IP, HTTP, FTP, SMTP ወይም የስህተት አይነቶች: የአገባብ ስህተት፣ የአሂድ ጊዜ ስህተት፣ ምክንያታዊ ስህተት ወይም የድር ልማት ማዕቀፎች፡ Django፣ Flask፣ Ruby on Rails፣ React አንግል o የውሂብ ጎታ አስተዳደር ስርዓቶች፡ MySQL፣ PostgreSQL፣ Oracle ጎታ፣ የማይክሮሶፍት SQL አገልጋይ ወይም የደመና አገልግሎት አቅራቢዎች፡ Amazon Web Services (AWS)፣ Microsoft Azure፣ ጎግል ክላውድ ፕላትፎርም (ጂሲፒ) o የሶፍትዌር ልማት ዘዴዎች፡ አጊል፣ ፏፏቴ፣ ስክረም፣ ካንባን ወይም የኮምፒውተር ደህንነት ማስፈራሪያዎች፡ ማልዌር፣ ማስገር፣ የአገልግሎት መከልከል (DoS)፣ ሰው-በ-መካከለኛው ጥቃት o የድር አሳሽ ዓይነቶች፡ ጎግል ክሮም፣ ሞዚላ ፋየርፎክስ፣ ማይክሮሶፍት ጠርዝ፣ ሳፋሪ 1.5.2. መደበኛ ልኬት ፍቺ፡- መደበኛ ሚዛን መረጃን በታዘዙ ቡድኖች ይከፋፍላል፣ ትዕዛዙ አንጻራዊ ደረጃን የሚያመለክት ነገር ግን በምድብ መካከል ስላለው ትክክለኛ ልዩነት መረጃ አይሰጥም። ባህሪያት፡- o ምድቦች ግልጽ የሆነ ቅደም ተከተል ወይም ደረጃ አላቸው. o በምድብ መካከል ያለው ልዩነት በቁጥር የሚቆጠር አይደለም። ምሳሌዎች በሂሳብ አያያዝ፡ o የደንበኛ እርካታ ደረጃዎች (በጣም ጥሩ፣ ጥሩ፣ ፍትሃዊ፣ ደካማ) Machine Translated by Google o የሰራተኛ አፈጻጸም ግምገማ (ከሚጠበቀው በላይ፣ የሚጠበቁትን ያሟላል፣ መሻሻል ያስፈልገዋል) o የእቃዎች ደረጃዎች (ከፍተኛ፣ መካከለኛ፣ ዝቅተኛ) በኮምፒውተር ሳይንስ ምሳሌዎች o የሶፍትዌር ጥራት ደረጃ አሰጣጦች፡ ከፍተኛ ጥራት፣ መካከለኛ ጥራት፣ ዝቅተኛ ጥራት o የተጠቃሚ ልምድ ደረጃዎች፡ ምርጥ፣ ጥሩ፣ ፍትሃዊ፣ ደካማ o የአፈጻጸም ደረጃ አሰጣጦች ለአልጎሪዝም፡ ምርጥ፣ ቅርብ-ምርጥ፣ ምርጥ o ቅድሚያ የሚሰጣቸው ደረጃዎች፡ ከፍተኛ፣ መካከለኛ ዝቅተኛ o የደህንነት ስጋት ደረጃዎች፡ ወሳኝ፣ ከፍተኛ፣ መካከለኛ፣ ዝቅተኛ o የሳንካ ክብደት ደረጃዎች፡ ወሳኝ፣ ከፍተኛ፣ መካከለኛ፣ ዝቅተኛ o አስቸጋሪ የፕሮግራም አወጣጥ ችግሮች ደረጃዎች፡ ቀላል፣ መካከለኛ፣ ከባድ o ስሜት ትንተና፡ አወንታዊ፣ ገለልተኛ፣ አሉታዊ o የአውታረ መረብ ትራፊክ መጨናነቅ ደረጃዎች፡ ከፍተኛ፣ መካከለኛ፣ ዝቅተኛ o የተጠቃሚ በይነገጽ ንድፍ ደረጃዎች፡ በጣም ጥሩ፣ ጥሩ፣ ፍትሃዊ፣ ደካማ 1.5.3. የጊዜ ክፍተት መለኪያ ፍቺ፡- የጊዜ ክፍተት መለኪያ መረጃን በእሴቶች መካከል እኩል ክፍተቶችን ይለካል፣ነገር ግን ምንም እውነተኛ ዜሮ ነጥብ የለም። ባህሪያት፡- o ምድቦች ግልጽ የሆነ ቅደም ተከተል እና በመካከላቸው እኩል ልዩነቶች አሏቸው። o ዜሮ የሚለካው መጠን አለመኖርን አይወክልም። በሂሳብ አያያዝ ምሳሌዎች፡ o የሙቀት መጠን (በሴልሺየስ ወይም ፋራናይት የሚለካው) o ጊዜ (በሰዓት፣ ደቂቃ፣ ሰከንድ የሚለካ) o የፋይናንሺያል ጥምርታ (ለምሳሌ የአሁን ሬሾ፣ ከዕዳ-ወደ-ፍትሃዊነት ጥምርታ) በኮምፒውተር ሳይንስ ምሳሌዎች፡ o RGB ቀለም እሴቶች፡ RGB የቀለም እሴቶች የቀይ፣ አረንጓዴ እና ሰማያዊ ጥንካሬዎችን ጥምር ይወክላሉ። እያንዳንዱ የቀለም ቻናል ብዙውን ጊዜ የሚለካው ከ0 ወደ ሚዛን ነው። 255፣ በእሴቶች መካከል እኩል ክፍተቶች ያሉት። ይሁን እንጂ የ 0 እሴት ቀለም አለመኖር ማለት አይደለም. o የሲግናል ጥንካሬ፡- በገመድ አልባ ግንኙነት፣ የሲግናል ጥንካሬ ብዙ ጊዜ የሚለካው በዲሲቤል (ዲቢ) ነው። የዲቢ ሚዛን እኩል ክፍተቶች አሉት፣ ነገር ግን የ0 ዲቢቢ እሴት የምልክት አለመኖር ማለት አይደለም። o የመረጃ ቋት መረጃ ጠቋሚ አፈጻጸም፡ ጠቋሚ ስልተ ቀመሮች ብዙ ጊዜ እንደ ኢንዴክስ መራጭነት ወይም ኢንዴክስ ካርዲናሊቲ ያሉ የአፈጻጸም መለኪያዎች አሏቸው። እነዚህ መለኪያዎች በእኩል ክፍተቶች ሚዛን ሊለኩ ይችላሉ፣ ነገር ግን የ0 እሴት የአፈጻጸም አለመኖር ማለት አይደለም። 1.5.4. የተመጣጠነ ሚዛን ፍቺ፡- የሬሾ ሚዛን መረጃዎችን በእሴቶች እና በእውነተኛ መካከል እኩል ክፍተቶችን ይለካል ዜሮ ነጥብ, የሚለካው መጠን አለመኖርን ይወክላል. Machine Translated by Google ባህሪያት፡- o ምድቦች ግልጽ የሆነ ቅደም ተከተል ፣ እኩል ልዩነቶች እና እውነተኛ ዜሮ ነጥብ አላቸው። o ሬሾን እና መጠንን ትርጉም ያለው ንፅፅር ይፈቅዳል። በሂሳብ አያያዝ ምሳሌዎች፡ o የገንዘብ መጠን (ዶላር፣ ዩሮ፣ ወዘተ) o መጠኖች (የዕቃ ዝርዝር ክፍሎች፣ የደንበኞች ብዛት) o የፋይናንስ አፈጻጸም መለኪያዎች (ለምሳሌ የተጣራ ገቢ፣ የገቢ ዕድገት) ምሳሌዎች በኮምፒውተር ሳይንስ o የፋይል መጠን፡ በባይት፣ ኪሎባይት፣ ሜጋባይት፣ ጊጋባይት ወዘተ... ሁለተኛ (kbps)፣ megabits በሰከንድ (Mbps)፣ ወዘተ o የማህደረ ትውስታ አጠቃቀም፡ የሚለካው በባይት፣ ኪሎባይት፣ ሜጋባይት፣ ጊጋባይት፣ ወዘተ. ምዕራፍ 2፡ የመረጃ አሰባሰብ እና አቀራረብ ዘዴዎች 2.1. የመረጃ አሰባሰብ ዘዴዎች መረጃ መሰብሰብ የምርምር ጥያቄዎችን ለመመለስ ወይም ችግሮችን ለመፍታት ከተለያዩ ምንጮች መረጃ መሰብሰብ ነው። በሂሳብ አያያዝ፣ መረጃ መሰብሰብ ለፋይናንስ ትንተና፣ ውሳኔ አሰጣጥ እና ደንቦችን ለማክበር ወሳኝ ነው። 2.1.1. የመረጃ ምንጭ መረጃ ለፋይናንስ ትንተና ፣ ለውሳኔ አሰጣጥ እና አጠቃላይ የንግድ ሥራ አስተዳደር ጥሬ ዕቃዎችን በማቅረብ የሂሳብ አያያዝ መሠረት ነው። የሂሳብ መረጃን ትክክለኛነት፣ አስተማማኝነት እና ተገቢነት ለማረጋገጥ ተገቢ የመረጃ ምንጮችን መለየት እና መጠቀም አስፈላጊ ነው። ይህ ክፍል ለሂሳብ አያያዝ የሚቀርቡትን የተለያዩ የመረጃ ምንጮች ከሚመለከታቸው ምሳሌዎች ጋር ይዳስሳል። 2.1.1.1. ዋና የመረጃ ምንጮች ዋና ምንጮች ከዋናው ምንጭ በቀጥታ የተሰበሰቡ መረጃዎችን ያመለክታሉ፣ ይህም በቀጥታ መረጃ ይሰጣል። በሂሳብ አያያዝ ውስጥ, ዋና ምንጮች ብዙውን ጊዜ በድርጅቱ ውስጥ ይፈጠራሉ. አንዳንድ የተለመዱ ዋና የመረጃ ምንጮች የሚከተሉትን ያካትታሉ: የፋይናንሺያል ግብይቶች፡- እነዚህ የሂሳብ መረጃዎች መሰረታዊ የግንባታ ብሎኮች ናቸው። እንደ ሽያጮች፣ ግዢዎች፣ ወጪዎች እና ኢንቨስትመንቶች ያሉ እያንዳንዱ የፋይናንስ ግብይቶች በሂሳብ አያያዝ ስርዓቶች ውስጥ የተመዘገቡ መረጃዎችን ያመነጫሉ። Machine Translated by Google የሂሳብ መዛግብት፡- የሒሳብ መዛግብት፣ ጆርናሎች፣ ደብተሮች፣ እና ንዑስ መጽሐፎችን ጨምሮ ስለ ፋይናንስ ግብይቶች ዝርዝር መረጃ ይይዛሉ። እነዚህ መዝገቦች ለፋይናንስ ሪፖርት አቀራረብ እና ትንተና እንደ ዋና የመረጃ ምንጭ ሆነው ያገለግላሉ። የውስጥ ሰነዶች፡- የተለያዩ የውስጥ ሰነዶች እንደ ደረሰኞች፣ ደረሰኞች፣ ኮንትራቶች እና ማስታወሻዎች ለፋይናንሺያል ግብይቶች ደጋፊ ማስረጃዎችን ያቀርባሉ እና ጠቃሚ የመረጃ ምንጮች ሊሆኑ ይችላሉ። የዳሰሳ ጥናቶች እና መጠይቆች፡- የዳሰሳ ጥናቶች እና መጠይቆች ለሰራተኞች፣ ደንበኞች፣ አቅራቢዎች ወይም ሌሎች ባለድርሻ አካላት ከሂሳብ አያያዝ ጋር የተያያዙ ልዩ መረጃዎችን ለመሰብሰብ ሊደረጉ ይችላሉ። ለምሳሌ፣ የደንበኛ እርካታ ዳሰሳ ስለ የሽያጭ አዝማሚያዎች እና የገቢ አቅም ግንዛቤዎችን ሊሰጥ ይችላል። በኮምፒዩተር ሳይንስ ውስጥ ዋና የመረጃ ምንጮች ብዙውን ጊዜ የሚመነጩት ከስርዓቶች፣ አፕሊኬሽኖች ወይም የተጠቃሚ መስተጋብር ነው። አንዳንድ የተለመዱ ምሳሌዎች እነሆ፡- የስርዓት ምዝግብ ማስታወሻዎች፡ o የአገልጋይ ምዝግብ ማስታወሻዎች፡ እነዚህ የስህተት መልዕክቶችን፣ የደህንነት ማንቂያዎችን እና የአፈጻጸም መለኪያዎችን ጨምሮ ስለ አገልጋይ እንቅስቃሴዎች ዝርዝሮችን ይመዘግባሉ። o የመተግበሪያ ምዝግብ ማስታወሻዎች፡ እነዚህ እንደ የውሂብ ጎታ መጠይቆች፣ የአውታረ መረብ ትራፊክ እና የተጠቃሚ መስተጋብር ያሉ ስለ ተወሰኑ መተግበሪያዎች ባህሪ እና አፈጻጸም መረጃን ይይዛሉ። የውሂብ ጎታ መዝገቦች፡- o Relational Databases፡- እነዚህ የተዋቀሩ መረጃዎችን በሠንጠረዦች ውስጥ ያከማቻሉ፣ ከእያንዳንዱ ሠንጠረዥ ጋር አንድ የተወሰነ አካል (ለምሳሌ ደንበኞች፣ ምርቶች፣ ትዕዛዞች) በመወከል። o NoSQL ዳታቤዝ፡ እነዚህ ያልተደራጀ ወይም ከፊል የተዋቀረ ውሂብ በተለዋዋጭ ያከማቻሉ እንደ JSON ወይም XML ያሉ ቅርጸቶች። በተጠቃሚ የመነጨ ይዘት፡- o የማህበራዊ ሚዲያ ልጥፎች፡- በተጠቃሚ የመነጨ ይዘት እንደ ትዊተር፣ ፌስቡክ እና ኢንስታግራም ባሉ መድረኮች ላይ በህዝብ አስተያየት፣ አዝማሚያዎች እና የደንበኛ ስሜት ላይ ጠቃሚ ግንዛቤዎችን ሊሰጥ ይችላል። o የመስመር ላይ ግምገማዎች፡ እንደ Amazon ወይም Yelp ባሉ ድህረ ገፆች ላይ ያሉ ግምገማዎች አስተያየት ሊሰጡ ይችላሉ። ምርቶች ወይም አገልግሎቶች. የዳሳሽ ውሂብ፡- o IoT መሳሪያዎች፡ የነገሮች በይነመረብ መሳሪያዎች እንደ ሙቀት፣ እርጥበት እና እንቅስቃሴ ካሉ ዳሳሾች ያመነጫሉ፣ ይህም ለተለያዩ አፕሊኬሽኖች ማለትም ስማርት ቤቶችን፣ ግብርና እና ማምረቻዎችን ጨምሮ። የኔትወርክ ትራፊክ መረጃ፡- o የአውታረ መረብ ምዝግብ ማስታወሻዎች፡ እነዚህ ስለ አውታረ መረብ እንቅስቃሴ፣ IPን ጨምሮ መረጃን ይመዘግባሉ አድራሻዎች, የፓኬት መጠኖች እና የመተላለፊያ ጊዜዎች. የፕሮግራም ኮድ፡- o የምንጭ ኮድ፡ የፕሮግራሙ ምንጭ ኮድ ቀዳሚ የመረጃ ምንጭ ነው። ስለ ተግባሩ፣ ስልተ ቀመሮቹ እና የውሂብ አወቃቀሮቹ። Machine Translated by Google 2.1.1.2. ሁለተኛ ደረጃ የመረጃ ምንጮች፡- ሁለተኛ ምንጮች በሌላ ሰው የተሰበሰቡ እና የተቀነባበሩ መረጃዎችን ያመለክታሉ። የሁለተኛ ደረጃ መረጃ ምቹ እና ወጪ ቆጣቢ ሊሆን ቢችልም ለሂሳብ አያያዝ ዓላማዎች ከመጠቀምዎ በፊት ትክክለኛነትን ፣ አስተማማኝነቱን እና ተገቢነቱን መገምገም አስፈላጊ ነው። አንዳንድ የተለመዱ የሁለተኛ ደረጃ የመረጃ ምንጮች የሚከተሉትን ያካትታሉ: የታተሙ የፋይናንሺያል መግለጫዎች፡ የታተሙ የኩባንያዎች የሂሳብ መግለጫዎች፣ አመታዊ ሪፖርቶችን፣ የሂሳብ መዛግብትን፣ የገቢ መግለጫዎችን እና የገንዘብ ፍሰት መግለጫዎችን ጨምሮ፣ ጠቃሚ የፋይናንስ መረጃ ምንጭ ናቸው። እነዚህ መግለጫዎች የኩባንያውን የፋይናንስ አፈጻጸም እና አቋም አጠቃላይ እይታ ያቀርባሉ። የመንግስት ህትመቶች፡- የመንግስት ኤጀንሲዎች ከሂሳብ አያያዝ ጋር የተያያዙ ሰፋ ያሉ ስታቲስቲካዊ መረጃዎችን ያትማሉ። ለምሳሌ፣ መንግሥት የዋጋ ግሽበትን፣ የወለድ ምጣኔን፣ የሀገር ውስጥ ምርት ዕድገትን እና የኢንዱስትሪን አዝማሚያን በተመለከተ መረጃን ይፋ ሊያደርግ ይችላል። የኢንዱስትሪ ሪፖርቶች፡- በምርምር ድርጅቶች ወይም በኢንዱስትሪ ማህበራት የሚዘጋጁ የኢንዱስትሪ ሪፖርቶች ስለ ገበያ አዝማሚያዎች፣ ተወዳዳሪ መልክዓ ምድሮች እና የኢኮኖሚ ሁኔታዎች ጠቃሚ ግንዛቤዎችን ሊሰጡ ይችላሉ። የፋይናንሺያል ዳታቤዝ፡ የፋይናንሺያል ዳታቤዝ፣ እንደ ብሉምበርግ ተርሚናል ወይም ሮይተርስ ኢኮን፣ የአክሲዮን ዋጋዎችን፣ የገበያ ኢንዴክሶችን፣ የኩባንያውን ፋይናንሺያል እና ኢኮኖሚያዊ አመልካቾችን ጨምሮ እጅግ በጣም ብዙ የፋይናንሺያል መረጃዎችን ማግኘት ይችላሉ። የውጭ ኦዲት ሪፖርቶች፡- በገለልተኛ ኦዲተሮች የሚዘጋጁ የውጭ ኦዲት ሪፖርቶች የድርጅቱን የሂሳብ መግለጫ እና የውስጥ ቁጥጥር ግምገማ ያቀርባሉ። እነዚህ ዘገባዎች ለባለሀብቶች እና ለሌሎች ባለድርሻ አካላት ጠቃሚ የመረጃ ምንጭ ሊሆኑ ይችላሉ። ሁለተኛ ደረጃ የመረጃ ምንጮች በሌላ ሰው የተሰበሰቡ እና የተቀነባበሩ ቅድመ-ነባር መረጃዎች ናቸው። ለምርምር፣ ለልማት እና ለመተንተን ጠቃሚ ግብአት ሊሆኑ ቢችሉም፣ ከመጠቀምዎ በፊት ጥራታቸውን፣ አስተማማኝነታቸውን እና ተገቢነታቸውን መገምገም በጣም አስፈላጊ ነው። አንዳንድ የተለመዱ ምሳሌዎች እነሆ፡- የወል ውሂብ ስብስቦች o የመንግስት የውሂብ ስብስቦች፡- የሕዝብ ቆጠራ መረጃ (ለምሳሌ፣ የሕዝብ ብዛት፣ ኢኮኖሚያዊ አመላካቾች) የአየር ንብረት መረጃ (ለምሳሌ፣ ሙቀት፣ ዝናብ፣ የአየር ሁኔታ ሁኔታ) የጤና መረጃ (ለምሳሌ የበሽታ መጠን፣ የሞት መጠን) o የምርምር መረጃዎች፡- የአካዳሚክ ምርምር ወረቀቶች እና ተያያዥነት ያላቸው የመረጃ ስብስቦች (ለምሳሌ፡ ምስል የውሂብ ስብስቦች፣ የጽሑፍ ኮርፖሬሽን፣ ባዮሎጂካል መረጃ) እንደ Kaggle እና UCI Machine Learning ያሉ ክፍት ምንጭ ማከማቻዎች ማከማቻ ድረ- ገጽ መቧጨር እና መጎሳቆል o የማህበራዊ ሚዲያ ውሂብ፡- ትዊተር፣ ፌስቡክ፣ ኢንስታግራም ልጥፎች እና አስተያየቶች Machine Translated by Google Reddit ውይይቶች እና አስተያየቶች o የዜና መጣጥፎች እና ብሎጎች፡ የዜና ድረ-ገጾች (ለምሳሌ፡ ቢቢሲ፣ ሲኤንኤን፣ ሮይተርስ) የብሎግ መድረኮች (ለምሳሌ መካከለኛ፣ ዎርድፕረስ) APIs እና የውሂብ ምግቦች o የፋይናንሺያል ውሂብ ኤፒአይዎች፡- የአክሲዮን ዋጋዎች፣ የገበያ ኢንዴክሶች፣ የፎርክስ ተመኖች o የአየር ሁኔታ መረጃ ኤፒአይዎች፡- የእውነተኛ ጊዜ የአየር ሁኔታ ሁኔታዎች፣ ታሪካዊ የአየር ሁኔታ መረጃ o የማህበራዊ ሚዲያ ኤፒአይዎች፡- የተጠቃሚ መገለጫዎች፣ ልጥፎች እና መስተጋብሮች Log Data o የአገልጋይ ምዝግብ ማስታወሻዎች፡- የስርዓት ስህተቶች፣ የአውታረ መረብ ትራፊክ፣ የተጠቃሚ እንቅስቃሴ o የመተግበሪያ ምዝግብ ማስታወሻዎች፡ የተጠቃሚ መስተጋብር፣ የኤፒአይ ጥያቄዎች፣ የአፈጻጸም መለኪያዎች አስቀድመው የሰለጠኑ ሞዴሎች o የቋንቋ ሞዴሎች፡ GPT-3፣ BERT o ምስል ማወቂያ ሞዴሎች፡ ሬስኔት፣ ቪጂጂ o የነገር ማወቂያ ሞዴሎች፡ YOLO፣ ፈጣን R-CNN 2.1.2. የውሂብ አይነቶች በባህሪያቸው እና በባህሪያቸው ላይ በመመስረት መረጃው በተለያዩ ዓይነቶች ሊከፋፈል ይችላል። የፋይናንስ መረጃን በብቃት ለማደራጀት፣ ለመተንተን እና ለመተርጎም ስለሚረዳ እነዚህን ዓይነቶች መረዳት በሂሳብ አያያዝ ውስጥ ወሳኝ ነው። 2.1.2.1. ዋና ውሂብ፡- አንደኛ ደረጃ መረጃ የሚሰበሰበው ለተለየ የምርምር ዓላማ በቀጥታ ከምንጩ ነው። በሂሳብ አያያዝ ውስጥ, ይህ ብዙውን ጊዜ በድርጅቱ ውስጥ ከተለያዩ ምንጮች መረጃ መሰብሰብን ያካትታል. በሂሳብ አያያዝ ምሳሌዎች፡ o የፋይናንሺያል መግለጫዎች (የገቢ መግለጫ፣ የሒሳብ መዝገብ፣ የገንዘብ ፍሰት መግለጫ) o የሂሳብ መዛግብት (አጠቃላይ ደብተር፣ ንዑስ ደብተሮች) o የውስጥ ኦዲት ሪፖርቶች o ከሠራተኞች ወይም ከአመራር ጋር የተደረጉ ቃለመጠይቆች o በድርጅቱ ውስጥ የተደረጉ ጥናቶች በኮምፒውተር ሳይንስ ምሳሌዎች : Machine Translated by Google o የተጠቃሚ ምዝግብ ማስታወሻዎች እና የስርዓት ምዝግብ ማስታወሻዎች፡- የስርዓት ምዝግብ ማስታወሻዎች፡ እነዚህ ምዝግብ ማስታወሻዎች ስለስርዓት ክስተቶች፣ እንደ ስሕተቶች፣ ማስጠንቀቂያዎች እና የደህንነት ክስተቶች ያሉ ዝርዝር መረጃዎችን ይመዘግባሉ። የተጠቃሚ ምዝግብ ማስታወሻዎች፡ እነዚህ መዝገቦች የተጠቃሚውን እንቅስቃሴ ይከታተላሉ፣ የመግባት ሙከራዎችን ጨምሮ፣ የተከናወኑ ተግባራት እና ስህተቶች አጋጥሟቸዋል. o የአውታረ መረብ ትራፊክ መረጃ፡- ፓኬት ቀረጻ፡- የትራፊክ ንድፎችን ለመረዳት፣ ያልተለመዱ ነገሮችን ለመለየት እና የአውታረ መረብ ችግሮችን ለመፍታት የኔትወርክ ፓኬቶችን መቅዳት እና መተንተንን ያካትታል። የወራጅ ምዝግብ ማስታወሻዎች፡- እነዚህ ምዝግብ ማስታወሻዎች እንደ ምንጭ እና መድረሻ አይፒ አድራሻዎች፣ ፕሮቶኮሎች እና ባይት ያሉ ስለ አውታረ መረብ ፍሰቶች አጠቃላይ መረጃ ይሰጣሉ። ይቆጠራል። o የአፈጻጸም ክትትል ዳታ፡ የስርዓት መለኪያዎች፡ ይህ እንደ ሲፒዩ አጠቃቀም፣ ማህደረ ትውስታ ያሉ መለኪያዎችን ያካትታል። አጠቃቀም፣ የዲስክ አይ/ኦ እና የኔትወርክ ባንድዊድዝ። የመተግበሪያ አፈጻጸም ክትትል (ኤፒኤም)፡ የኤፒኤም መሳሪያዎች የምላሽ ጊዜን፣ የስህተት ተመኖችን እና የንብረት አጠቃቀምን ጨምሮ በመተግበሪያ አፈጻጸም ላይ መረጃን ይሰበስባሉ። o የተጠቃሚ ዳሰሳ እና ቃለመጠይቆች፡- የተጠቃሚ ዳሰሳ፡- እነዚህ የዳሰሳ ጥናቶች በተጠቃሚ ተሞክሮዎች፣ ምርጫዎች እና የህመም ነጥቦች ላይ አስተያየት ይሰበስባሉ። የተጠቃሚ ቃለመጠይቆች፡- እነዚህ ቃለመጠይቆች ስለተጠቃሚ ባህሪ፣ ፍላጎቶች እና የሚጠበቁ ጥልቅ ግንዛቤዎችን ይሰጣሉ። o A/B ሙከራ ውሂብ፡- የሙከራ ምዝግብ ማስታወሻዎች፡- እነዚህ ምዝግብ ማስታወሻዎች እንደ እያንዳንዱ ቡድን የተጠቃሚዎች ብዛት፣ ልወጣዎች እና ሌሎች ተዛማጅ መለኪያዎች ያሉ መረጃዎችን ከA/B ሙከራዎች ይመዘግባሉ። o የኮድ ማከማቻዎች፡- የስሪት ቁጥጥር ስርዓቶች፡- እነዚህ ስርዓቶች በጊዜ ሂደት ወደ ኮድ የሚደረጉ ለውጦችን ይከታተላሉ፣ ለኮድ ትንተና እና ለሶፍትዌር የዝግመተ ለውጥ ጥናቶች ጠቃሚ የመረጃ ምንጭ ይሰጣሉ። o ዳሳሽ ውሂብ፡- IoT መሳሪያዎች፡- እነዚህ መሳሪያዎች ከተለያዩ ሴንሰሮች እንደ መረጃ ያመነጫሉ። የሙቀት መጠን, እርጥበት እና የእንቅስቃሴ ዳሳሾች. ተለባሾች፡- እነዚህ መሳሪያዎች የተጠቃሚ እንቅስቃሴን፣ የልብ ምትን እና ሌሎች የጤና መለኪያዎችን መረጃ ይሰበስባሉ። 2.1.2.2 ሁለተኛ ደረጃ መረጃ፡ ሁለተኛ ደረጃ መረጃ አስቀድሞ የተሰበሰበ እና ከውጭ ምንጮች የሚገኝ መረጃ ነው። የሂሳብ ባለሙያዎች ትንታኔያቸውን ለማሟላት ወይም ስለ ሰፊ የኢንዱስትሪ አዝማሚያዎች ግንዛቤን ለማግኘት ሁለተኛ ደረጃ መረጃን መጠቀም ይችላሉ። Machine Translated by Google በሂሳብ አያያዝ ውስጥ ምሳሌዎች፡ o በተመሳሳይ ኢንዱስትሪ ውስጥ ያሉ የሌሎች ኩባንያዎች የታተሙ የፋይናንሺያል ሪፖርቶች o የመንግስት ስታቲስቲክስ (ለምሳሌ የሀገር ውስጥ ምርት፣ የዋጋ ግሽበት) o የኢንዱስትሪ ሪፖርቶች ከተመራማሪ ድርጅቶች o የኢኮኖሚ ጠቋሚዎች (ለምሳሌ የወለድ ተመኖች፣ የምንዛሪ ዋጋዎች) o የፋይናንሺያል ዳታቤዝ (ለምሳሌ፦ ብሉምበርግ ተርሚናል፣ ሮይተርስ ኢኮን) በኮምፒውተር ሳይንቲስቶች ውስጥ ምሳሌዎችን መጠቀም ይችላሉ፡ o የህዝብ መረጃ ስብስቦች፡ የመንግስት የውሂብ ስብስቦች፡- የሕዝብ ቆጠራ መረጃ (ለምሳሌ የሕዝብ ብዛት፣ የገቢ ደረጃዎች) የአየር ሁኔታ መረጃ (ለምሳሌ የሙቀት መጠን፣ እርጥበት፣ ዝናብ) የትራፊክ መረጃ (ለምሳሌ የትራፊክ ፍሰት፣ የአደጋ መጠን) የምርምር መረጃዎች፡- የምስል ዳታ ስብስቦች (ለምሳሌ፣ ImageNet፣ CIFAR-10) የጽሁፍ ዳታሴቶች (ለምሳሌ ዊኪፔዲያ፣ ፕሮጀክት ጉተንበርግ) የድምጽ ዳታሴቶች (ለምሳሌ፡ LibriSpeech፣ Speech Commands Dataset) o የመስመር ላይ ማከማቻዎች፡- GitHub፡- ክፍት ምንጭ ኮድ ማከማቻዎች፣ የተለያዩ ኮድን ጨምሮ የፕሮግራሚንግ ቋንቋዎች፣ ማዕቀፎች እና ቤተመጻሕፍት። ካግል፡- ለዳታ ሳይንስ ውድድሮች እና ዳታሴቶች መድረክ፣ ለተለያዩ ጎራዎች ሰፊ የውሂብ ስብስቦችን ያቀርባል። የዩሲአይ የማሽን መማሪያ ማከማቻ፡ ጥቅም ላይ የሚውሉ የውሂብ ስብስቦች ስብስብ የማሽን ትምህርት ምርምር እና ትምህርት. o የኢንዱስትሪ ዘገባዎች እና ህትመቶች፡- የምርምር ወረቀቶች፡ በኮምፒውተር ሳይንስ ውስጥ በተለያዩ ርዕሰ ጉዳዮች ላይ እንደ አርቴፊሻል ኢንተለጀንስ፣ የማሽን መማሪያ እና የመረጃ ማዕድን ያሉ የምርምር ወረቀቶችን አሳትመዋል። የኢንዱስትሪ ሪፖርቶች፡- እንደ ጋርትነር፣ ፎረስተር፣ እና አይዲሲ ካሉ ኩባንያዎች በቴክኖሎጂ አዝማሚያዎች እና በገቢያ ትንተና ላይ የተደረጉ ዘገባዎች። የቴክኒክ ብሎጎች እና መድረኮች፡ ገንቢዎች እና የመስመር ላይ ማህበረሰቦች ተመራማሪዎች መረጃ እና ግንዛቤዎችን ይጋራሉ. o የማህበራዊ ሚዲያ መረጃ፡- ትዊተር፡- ትዊቶችን እና ሌሎች የማህበራዊ ሚዲያ መረጃዎችን ለስሜት መጠቀም ይቻላል። ትንተና፣ አዝማሚያ ትንተና እና የማህበራዊ አውታረ መረብ ትንተና። Reddit፡ የውይይት መድረኮችን እና ማህበረሰቦችን በተለያዩ ርዕሰ ጉዳዮች ላይ ለዳታ ማዕድን ማውጣት እና ለተፈጥሮ ቋንቋ ማቀነባበር መጠቀም ይቻላል። 2.1.2.3. የቁጥር መረጃ፡ አሃዛዊ መረጃ በመጠን ሊለካ እና ሊገለጽ የሚችል የቁጥር መረጃ ነው። ብዙውን ጊዜ የፋይናንስ አፈጻጸምን፣ ሬሾን እና አዝማሚያዎችን ለመተንተን በሂሳብ አያያዝ ውስጥ ጥቅም ላይ ይውላል። Machine Translated by Google በሂሳብ አያያዝ ውስጥ ያሉ ምሳሌዎች፡ የሽያጭ አሃዞች፣ የትርፍ ህዳጎች፣ የእቃ ዝርዝር ደረጃዎች፣ የሂሳብ መዛግብት ቀሪ ሂሳቦች፣ ከዕዳ- ወደ-ፍትሃዊነት ጥምርታ፣ ወደ ኢንቨስትመንት መመለስ (ROI) በኮምፒውተር ሳይንስ ምሳሌዎች፡ o የአፈጻጸም መለኪያዎች፡- የምላሽ ጊዜ፡- ስርዓቱ ለተጠቃሚው ምላሽ ለመስጠት ምን ያህል ጊዜ ይወስዳል ጥያቄ? የመተላለፊያ ጊዜ፡ አንድ ሥርዓት በሰከንድ ስንት ጥያቄዎችን ማካሄድ ይችላል? መዘግየት፡- በኔትወርክ ውስጥ መረጃ ከአንዱ ነጥብ ወደ ሌላ ለመጓዝ ምን ያህል ጊዜ ይፈጅበታል? የስህተት መጠን፡ በስርአት ውስጥ ስንት ጊዜ ስህተቶች ይከሰታሉ? o የሀብት አጠቃቀም፡- የሲፒዩ አጠቃቀም፡- የሲፒዩ የማቀነባበሪያ ሃይል ምን ያህል ጥቅም ላይ እየዋለ ነው? የማህደረ ትውስታ አጠቃቀም፡ ምን ያህል ማህደረ ትውስታ በፕሮግራም ጥቅም ላይ እንደሚውል ወይም ስርዓት? ዲስክ I/O፡ ምን ያህል ዳታ ከዲስክ እየተነበበ ወይም እየተፃፈ ነው? የኔትወርክ ባንድዊድዝ፡ ምን ያህል ዳታ በ ላይ እየተላለፈ ነው። አውታረ መረብ? o የተጠቃሚ ባህሪ፡- የጠቅታ መጠን (CTR)፡ ተጠቃሚዎች ምን ያህል ጊዜ አገናኝ ወይም ማስታወቂያ ላይ ጠቅ ያደርጋሉ? የልወጣ መጠን፡ ተጠቃሚዎች የሚፈለገውን እርምጃ ምን ያህል ጊዜ ያጠናቅቃሉ፣ ለምሳሌ ግዢ መፈጸም ወይም ለጋዜጣ መመዝገብ? የገጽ እይታዎች፡ ድረ-ገጽ ስንት ጊዜ ነው የሚታየው? የክፍለ ጊዜው ቆይታ፡ ተጠቃሚዎች በድር ጣቢያ ወይም መተግበሪያ ላይ ምን ያህል ጊዜ ያሳልፋሉ? o የሶፍትዌር ጥራት፡- የሳንካዎች ብዛት፡ በሶፍትዌር ውስጥ ስንት ስህተቶች ሪፖርት ተደርጓል ምርት? የኮድ መስመሮች፡ በሶፍትዌር ምርት ውስጥ ስንት የኮድ መስመሮች አሉ? የፈተና ሽፋን፡ ምን ያህል መቶኛ የኮዱ ተፈትኗል? ጉድለት ጥግግት፡- በ1,000 የኮድ መስመር ስንት ጉድለቶች ይገኛሉ? o የውሂብ ትንተና፡- ተያያዥነት፡- ሁለት ተለዋዋጮች ምን ያህል ይዛመዳሉ? ሪግሬሽን፡ አንድ ተለዋዋጭ ከሌላው እንዴት ሊተነበይ ይችላል? ስብስብ፡ መረጃ እንዴት ወደ ተመሳሳይ ዘለላዎች ሊመደብ ይችላል? ምደባ፡- መረጃን በተለያዩ ክፍሎች እንዴት መመደብ ይቻላል? 2.1.2.4. ጥራት ያለው ውሂብ፡ ጥራት ያለው መረጃ ባህሪያትን፣ ጥራቶችን ወይም ባህሪያትን የሚገልጽ ቁጥራዊ ያልሆነ ውሂብ ነው። ስለ ደንበኛ ምርጫዎች፣ የገበያ አዝማሚያዎች እና የአሰራር ቅልጥፍና ጠቃሚ ግንዛቤዎችን ሊሰጥ ይችላል። በሂሳብ አያያዝ ምሳሌዎች፡- Machine Translated by Google o ስለ ምርት ጥራት የደንበኞች አስተያየት o የሰራተኞች እርካታ ዳሰሳ ጥናቶች o በኢንዱስትሪ አዝማሚያዎች ላይ የገበያ ጥናት ሪፖርቶች o የተወዳዳሪዎች ትንተና o የፋይናንስ ሪፖርት አቀራረብ ጥራት ገጽታዎች (ለምሳሌ የፋይናንስ መግለጫዎች ማስታወሻዎች) የኮምፒውተር ሳይንስ ምሳሌ፡ o የተጠቃሚ ልምድ (UX) ምርምር የተጠቃሚ ቃለመጠይቆች ፍላጎቶቻቸውን፣ የህመም ነጥቦቻቸውን እና ምርጫዎቻቸውን ለመረዳት ከተጠቃሚዎች ጋር ጥልቅ ውይይቶች። የአጠቃቀም ሙከራ፡ ተጠቃሚዎችን ለመለየት ከአንድ ምርት ጋር መስተጋብር መፍጠር ግራ መጋባት ወይም ብስጭት ቦታዎች. የዳሰሳ ጥናቶች እና መጠይቆች፡ በተጠቃሚ እርካታ፣ የባህሪ ምርጫዎች እና አጠቃላይ ተሞክሮ ላይ ጥራት ያለው ግብረመልስ መሰብሰብ። o የሶፍትዌር ልማት የኮድ ክለሳዎች፡- ተነባቢነት፣ ተጠብቆ እንዲቆይ እና የኮድ መስፈርቶችን የማክበር ኮድ መተንተን። የገንቢ ዳሰሳ ጥናቶች፡ በልማት መሳሪያዎች፣ ሂደቶች እና የቡድን ተለዋዋጭነት ላይ ግብረመልስ መሰብሰብ። የድህረ-ሞት ትንተና፡ የሶፍትዌር ውድቀቶችን ዋና መንስኤዎችን መመርመር መሻሻል ያለባቸውን ቦታዎች መለየት። o የሳይበር ደህንነት የዛቻ ኢንተለጀንስ ሪፖርቶች፡- በሳይበር ላይ የጥራት መረጃን መተንተን ማስፈራሪያዎች፣ የጥቃት ቬክተሮች እና የአጥቂ ተነሳሽነት። የአደጋ ምላሽ ሪፖርቶች፡ የአጥቂ ስልቶችን፣ ቴክኒኮችን እና ሂደቶችን ጨምሮ የደህንነት ጉዳዮችን ዝርዝሮችን መመዝገብ። የደህንነት ኦዲት፡ በስርዓቶች እና ኔትወርኮች ላይ ሊከሰቱ የሚችሉ ተጋላጭነቶችን እና ድክመቶችን መለየት። o አርቴፊሻል ኢንተለጀንስ እና የማሽን መማር የሞዴል አተረጓጎም፡ የ AI ሞዴሎችን የውሳኔ አሰጣጥ ሂደት መረዳት፣ በተለይም እንደ ጤና አጠባበቅ እና ፋይናንሺያል ባሉ ከፍተኛ ደረጃ ላይ ያሉ መተግበሪያዎች። አድሎአዊ ማወቂያ፡ በ AI ስልተ ቀመሮች ውስጥ አድሎአዊነትን መለየት እና ማቃለል እና የውሂብ ስብስቦች. የስነምግባር ታሳቢዎች፡- እንደ ግላዊነት፣ ፍትሃዊነት እና የስራ መፈናቀል ያሉ የ AI ቴክኖሎጂዎችን ስነምግባር መተንተን። 2.1.2.5. የጊዜ ተከታታይ ውሂብ፡- የጊዜ ተከታታይ መረጃ በተወሰነ ጊዜ ውስጥ የተሰበሰበ መረጃ ነው, ይህም አዝማሚያዎችን, ቅጦችን እና ለውጦችን በጊዜ ሂደት ለመተንተን ያስችላል. የሂሳብ ባለሙያዎች የወደፊቱን የፋይናንስ አፈፃፀም ለመተንበይ, ወቅታዊነትን ለመለየት እና የአስተዳደር ውሳኔዎችን ውጤታማነት ለመገምገም የጊዜ ተከታታይ መረጃዎችን ይጠቀማሉ. Machine Translated by Google ምሳሌዎች በሂሳብ አያያዝ፡- የወርሃዊ የሽያጭ መረጃ፣ የሩብ አመት ትርፍ አሃዞች፣ አመታዊ ገቢ ዕድገት፣ ታሪካዊ የአክሲዮን ዋጋዎች፣ ዕለታዊ የገንዘብ ፍሰት መግለጫዎች የኮምፒውተር ሳይንስ ምሳሌዎች፡- o የአውታረ መረብ ትራፊክ መረጃ፡- የአውታረ መረብ ባንድዊድዝ አጠቃቀም፡ በአውታረ መረብ ላይ የሚተላለፉትን መረጃዎች በተለያዩ የጊዜ ክፍተቶች መከታተል (ለምሳሌ፡ በሰአት፣ በየቀኑ፣ በየሳምንቱ)። የፓኬት ኪሳራ ተመኖች፡- በጥቅሉ ወቅት የጠፉትን መቶኛ መከታተል በጊዜ ሂደት ማስተላለፍ. የምላሽ ጊዜ፡- ጥያቄ ለመሆን የሚፈጀውን ጊዜ መለካት የተቀነባበረ እና ምላሽ ለመመለስ. o የስርዓት አፈጻጸም መለኪያዎች፡- ሲፒዩ አጠቃቀም፡- ሂደቶች በጊዜ ሂደት የሚጠቀሙባቸውን የሲፒዩ ጊዜ መቶኛ መከታተል። የማህደረ ትውስታ አጠቃቀም፡ የሚፈጀውን የማህደረ ትውስታ መጠን መከታተል የተለያዩ ሂደቶች እና የስርዓት ክፍሎች. ዲስክ I/O፡ በዲስክ እና በ መካከል ያለውን የመረጃ ልውውጥ መጠን መለካት ስርዓት. o የተጠቃሚ ባህሪ ውሂብ፡- የድረ-ገጽ ትራፊክ፡- የድረ-ገጽ ጎብኝዎችን እና ገጽን ብዛት መተንተን በጊዜ ሂደት እይታዎች. የመተግበሪያ አጠቃቀም፡ የመተግበሪያ ተጠቃሚዎችን ቁጥር እና የአጠቃቀም ቅጦችን መከታተል (ለምሳሌ፡- ጊዜ ያለፈበት, ጥቅም ላይ የዋሉ ባህሪያት). የማህበራዊ ሚዲያ ተግባር፡- በማህበራዊ ሚዲያ ልጥፎች ላይ የወደዱትን፣ ሼር እና አስተያየቶችን ቁጥር መከታተል። 2.1.2.6. አቋራጭ ውሂብ ክሮስ-ክፍል ውሂብ ከበርካታ ርዕሰ ጉዳዮች ወይም አካላት የተሰበሰበ መረጃ በአንድ ጊዜ ውስጥ ነው። በአንድ የተወሰነ አውድ ውስጥ የተለያዩ ቡድኖችን ወይም ግለሰቦችን ለማነፃፀር እና ለመተንተን ይጠቅማል። በሂሳብ አያያዝ ውስጥ ምሳሌዎች፡ o በተመሳሳይ ኢንዱስትሪ ውስጥ ያሉ የተለያዩ ኩባንያዎች የንፅፅር የፋይናንስ ትንተና o በተለያዩ ክፍሎች ያሉ የሰራተኞች እርካታ ጥናት ውጤቶች o የደንበኛ ክፍፍል መረጃ በስነ-ሕዝብ ወይም በግዢ ባህሪ ላይ የተመሰረተ በኮምፒውተር ሳይንስ ምሳሌዎች፡ o የአውታረ መረብ ትንተና ቶፖሎጂ ትንተና፡ የኔትዎርክን አወቃቀር በተወሰነ ጊዜ ላይ መተንተን፣ ለምሳሌ የአንጓዎች፣ ጠርዞች እና ግንኙነቶቻቸው። Machine Translated by Google የአፈጻጸም መለኪያዎች፡- ለተለያዩ የአውታረ መረብ ክፍሎች ወይም መሳሪያዎች እንደ መዘግየት፣ የመተላለፊያ ይዘት እና የፓኬት ኪሳራ ያሉ የአውታረ መረብ አፈጻጸም መለኪያዎችን መለካት። የትራፊክ ትንተና፡ የአውታረ መረብ ትራፊክ ንድፎችን መተንተን፣ ለምሳሌ የተላለፈው የውሂብ መጠን፣ ጥቅም ላይ የዋሉ የፕሮቶኮሎች አይነቶች እና የትራፊክ ስርጭት በተለያዩ የኔትወርክ ክፍሎች። o የሶፍትዌር ምህንድስና የኮድ ጥራት መለኪያዎች፡ እንደ ኮድ ውስብስብነት፣ የኮድ ሽፋን እና ለተለያዩ የሶፍትዌር ?