Wednesday, January 19, 2011

Class 9 : Data Management II & Business Intelligence

Data Management II & Business Intelligence

Data Warehouse : Major Benefits
1.Reach data more quickly as they’re located in one place.
2.Reach data easier , more frequent by end users themselves ,using Web browser.

Reasons for data inconsistency
1.เกิดจากข้อมูลมี format ต่างกัน
2.ข้อมูล update ไม่เท่ากัน

Data Warehouse Process
1.Collect Data both from External data and Operational Data
2.Data Staging : Extract, Clean, Transform and Load .AKA “ETCL” คัดกรองเฉพาะข้อมูลที่ต้องใช้จาก Database เก็บข้อมูลไว้ใน Data Cube

The Data Mart : is a small scaled-down version 0f a data warehouse : ไม่ได้มีข้อมูลทุกอย่างเหมือน Data Warehouse แต่ตัดแบ่งข้อมูลมาจาก Data Warehouse ตามมุมมองที่ผู้ใช้ต้องการ

Types of Data Mart
1.Replicated data mart : ในกรณีที่องค์กรมี Data Warehouse ขององค์กรอยู่แล้วและทีผู้ใช้ Data Warehouse ที่หลากหลาย จึงจำเป็นต้องมี of Data Martเพิ่มขึ้นมาโดยนำข้อมูลมาจาก Data Warehouse เพื่อจัดระเบียบให้ตรงกับความต้องการใช้
2.Stand-alone data mart : เกิดขึ้นกับองค์กรที่ยังไม่พร้อมที่จะสร้าง Data Warehouseขององค์กร จึงสร้างเฉพาะ data mart ในส่วนที่พร้อม

The Data Cube
“Multidimensional Databases” (AKA OLAP) : เป็น database ที่มีการจัดเรียงข้อมูลตามมิติต่างๆ เพื่อความสะดวกการวิเคราะห์ข้อมูลที่มีอยู่เป็นจำนวนมาก โดยจะสามารถวิเคราะห์ข้อมูลในลักษณะต่างๆ เช่น
1.Slices and Dices : การดูข้อมูลที่แบ่งออกเป็นมิติต่าง เช่น ข้อมูลเกี่ยวกับ Wine ทั้งในแง่ของราคา ฐานลูกค้าในแต่ละระยะเวลา
2.Rollups : ดูข้อมูลที่เป็นรายละเอียด ไปยังข้อมูลที่เป็นภาพรวม เพื่อความสะดวกในการเปรียบเทียบ และวิเคราะห์แนวโน้ม
3.Drill Downs : ดูข้อมูลจากภาพรวมไปยังรายละเอียด

Business Intelligence : BI : รวมเครื่องมือในการทำงานต่างๆและ database เพื่อทำให้สามารถเข้าถึงข้อมูล จัดการข้อมูลได้อย่าง interactive รวมถึงช่วยให้ผู้บริหารและนักวิเคราะห์สามารถวิเคราะห์ข้อมูลต่างๆได้อย่างดียิ่งขึ้น

Dashboard & Scorecards
Dashboard : innovate ในการนำข้อมูลไปสู่ผู้บริหาร เพื่อใช้ในการประเมิน performance ตาม balance scorecard ทั้ง 4 ด้าน คือ Financial , Customer ,Internal Process และ Learning and Growth

Data Mining : การสกัดข้อมูลที่จำเป็น/มีประโยชน์ออกมาจากข้อมูลทั้งหมด เพื่อใช้ในการตัดสินใจทางธุรกิจ
Yield from Data mining
1.Clustering : เป็นการจัดกลุ่มของข้อมูล โดยแบ่งจากความสัมพันธ์ของกลุ่มข้อมูล
2.Classification : เป็นการจัดกลุ่มข้อมูลโดยมีสมมติฐานล่วงหน้า แล้วดูว่าข้อมูลเป็นไปตามสมมติฐานหรือไม่ ถ้าไม่ แสดงว่าสมมติฐานผิด
3.Association : เป็นผลสืบเนื่องที่เกิดขึ้น เช่น เวลาลูกค้าเปิดบัญชีออมทรัพย์ ต่อไปก็น่าจะมรการเปิดใช้ ATM ต่อด้วย
4.Sequence Discovery
5.Prediction : เป็นการ Forecast ไปข้างหน้า

Text Mining
ข้อมูลส่วนใหญ่ที่อยู่ใน data warehouse จะเป็นข้อมูลแบบ structured คือมีรูปแบบที่แน่นอน มีชื่อ attribute , ขนาดของ fieldว่ามีกี่ character ซึ่งจะสามารถใช้ Data mining ได้ แต่ในกรณีที่เป็นข้อมูลแบบ unstructured data จะไม่สามารถใช้ data mining ได้ เนื่องจากเป็นข้อมูลที่ไม่ได้มีรูปแบบชัดเจน เช่น complain จากลูกค้า ซึ่งข้อมูลประเภท unstructured นี้มีการเติบโตสูงมาก

No comments:

Post a Comment