1-1_.pdf
Document Details
Uploaded by CompliantSanAntonio
Tags
Full Transcript
1-1 資料、資訊與知識 資料科學 1. 資料 (Data):未經過整理或不具意義的文數字符號,又稱數據 2. 資訊 (Information):資料經過整理產生有意義的結果 3. 知識:經過分析後,產生有助於推論或決策的知識 4. 資料科學 (Data Science):結合相關技術...
1-1 資料、資訊與知識 資料科學 1. 資料 (Data):未經過整理或不具意義的文數字符號,又稱數據 2. 資訊 (Information):資料經過整理產生有意義的結果 3. 知識:經過分析後,產生有助於推論或決策的知識 4. 資料科學 (Data Science):結合相關技術從資料中取得知識 💡 資料科學包含取得資料、資料處理成資訊、資訊分析成知識 資料處理與分析 1. 資料的處理:將資料轉換成資訊的過程 補值:當資料缺少一個值時,補齊空缺 刪值:資料異常或錯誤時,進行刪除錯誤資料 轉換:同意思轉不同方法 2. 資料分析:資料處理後,提出有效的訊息 3. GIGO (Gargbage In Garbage Out):強調輸入資料的正確性 資料處理的方法 處理方法 說明 批次處理 一段時間內彙整資料,再一次處理完畢 適合 Batch 大量且不需立即處理的資料 即時處理 接收資料後立即做出回應 適合需要 Realtime 時效性的資料 分時處理 各個工作輪流使用 CPU Timesharing 每個資料感覺像是同時進行的 1-1 資料、資訊與知識 1 處理方法 說明 交談式處理 系統與使用者進行一問一答的溝通方式,完成資料處理的工作 Interactive 連線 (線上) 處理 處理過程,CPU 與輸出入設備保持連結狀態 Online 離線處理 處理過程,CPU 與輸出入設備保持未連結狀態 Offline 集中式處理 集中於某一部電腦處理資料 Central 分散式處理 由分散各地的電腦處理資料 Distributed (多個 CPU) 資料處理的重點觀念 1. 即時處理系統一定是連線系統 (連線不一定是即時) 2. ATM 同時具有即時、連線、交談式處理 3. 網路線上測驗系統有下列處理方式 連線處理:伺服器傳送測驗資料到測驗端 集中處理:將答案傳回伺服器批改 即時處理:測驗端可立即查閱分數 4. 購票系統有下列處理方式 連線處理:伺服器與購票端互相傳遞訊息 集中處理:在伺服器上作票卷標記 分散處理:由各地的電腦先處理購票的回應訊息,再傳回中央伺服器 即時處理:購票者可立即獲得購票結果 交談式處理:購票系統會一步一步導引購票者輸入購票資訊 常見資料分析 趨勢預測:用現有的資料,預測未來 分類:取的資料進行分類 (不同屬性 e.g. 貓和狗) 分群:取得的資料進行分群 (同屬性不同性質 e.g. 柴犬和哈士奇) 關聯:找到資料隱藏間的關聯 1-1 資料、資訊與知識 2 1-1 資料、資訊與知識 3