www.weipinxgt.com www.hdf598.com www.rzkfqcg.com www.ywd100.com www.gzunitrade.com www.5aziyuan.com www.alsclean.com www.ynzsgc.com www.sdldtg.com www.i-sarima.com www.aijianbing.com www.xushiweigou.com www.haoyulongsp.com www.binqimotor.com www.kenminamipainting.com www.erli30.com www.cdhg88.com www.horse-home.com www.myjxzp.com www.dgselling.com www.chenlongjiancai.com www.zhongkuanwuliu.com www.huameide-sz.com www.shouxitongban.com www.scgcjx0207.com www.qdshengqian.com www.3w800.com www.kl-ad.com www.imshenghuo.com www.xxanlhw.com www.hfkaibo.com www.wlwservice.com www.jxguanghua.com www.zkld2009.com www.duanem.com www.hzwjzs.com www.chdlav.com www.lyxszl.com www.xinlaihuijiaju.com www.hrwholecare.com www.yingyang168.com www.honeywell-lk.com www.yushusanjiangyuanbao.com www.kangningyiyuan.com www.xzkjsxx.com www.jztushuguan.com www.gksswh.com www.jakjxx.com www.yyxlzw.com www.dwdzxx.com www.shszjzx.com www.skf-nsk-fag-ntn.com www.shanghailvhua.com www.yomandoors.com www.wenchengvote.com www.cn-sportsprotectors.com www.fuyixuantc.com www.jiayongdiant.com www.reshousuoj.com www.wuxitianzhile.com www.lsallx.com www.ravor-system.com www.jhbrq.com www.mirrvoll.com www.likekiwi.com www.hbclzqcj.com www.cqqfbxgm.com www.nmgdwjlw.com www.zmdjtzfw.com www.xunchengchaju.com www.gssx-pxgl.com www.sha-jing.com www.zysjmbj.com www.131701.com www.tlyhyy.com www.hbfbfz.com www.hljpadm.com www.fenxiangzhuan005.com www.jv001.com www.ruiyucnc.com www.zhuochenglaser.com www.zhaoshudeng.com www.facebook-france.com www.yuxianchu.com www.139yes.com www.lazonaentertainment.com www.eastofedens.com www.latelier-gourmet.com www.kaisyomaru.com www.tenglonghb.com www.bdsmfreevids.com www.gzshbzw.com www.ymgb0991.com www.setonohanayome.com www.attachmentmoms.com www.njmzyjg.com www.hi4r.com www.exotic-nails.com www.ef25.com www.lslcxx.com
ข่าวประชาสัมพันธ์
ผู้อำนวยการส่วนหอสมุดเข้าอบรม การจัดทำคลังข้อมูลสถาบันและจดหมายเหตุดิจิทัล ณ มหาวิทยาลัยขอนแก่น จังหวัดขอนแก่น
18 ส.ค. 54 | ข่าวมหาวิทยาลัย
203
ข่าวมหาวิทยาลัย
ผู้อำนวยการส่วนหอสมุดเข้าอบรม การจัดทำคลังข้อมูลสถาบันและจดหมายเหตุดิจิทัล ณ มหาวิทยาลัยขอนแก่น จังหวัดขอนแก่น
วันที่ ๑๘/๐๘/๒๐๑๑ เข้าชม : ๘๙๒๖ ครั้ง

                         วันที่ ๑๘ สิงหาคม ๒๕๕๔  มหาวิทยาลัยมหาจุฬาลงกราชวิทยาลัย ได้อนุมัติผู้อำนวยการส่วนหอสมุดกลาง เข้าอบรมโครงการฝึกอบรม เรื่อง คลังข้อมูลสถาบันและจดหมายเหตุดิจิทัล Institutional Repositories and Digital Archves ณ คณะมนุษยศาสตร์และสังคมศาสตร์ มหาวิทยาลัยขอนแก่น จังหวัดขอนแก่น พร้อมกันนี้ทีมงานส่วนหอสมุดกลาง ได้ทำการอบรมการใช้โปรแกรมห้องสมุด VTLS เวอร์ชั่น 2010 เวอร์ชั่นใหม่ล่าสุด การสืบค้นฐานข้อมูลออนไลน์ ฐานข้อมูลหนังสืออิเล็กทรอนิกส์ ๒,๐๐๐,๐๐๐ เล่ม และการใช้ฐานข้อมูลอื่นๆ แก่บรรณารักษ์ เจ้าหน้าที่ห้องสมุด มจร วิทยาเขตขอนแก่นอีกด้วย ในวันที่ ๑๙-๒๐ สิงหาคม ทีมงานส่วนหอสมุดกลางมีกำเนิดเดินทางไปติดตาม แนะนำการใช้โปรแกรม VTLS เวอร์ชั่นใหม่ และการใช้ฐานข้อมูลอื่นๆ ร่วมกัน แก่บรรณารักษ์วิทยาเขตหนองคาย  และวิทยาลัยสงฆ์นครพนมอีกด้วย ทั้งนี้เป็นการปฏิบัติตามนโยบายมหาวิทยาลัยพัฒนาห้องสมุดวิทยาเขต วิทยาลัยสงฆ์ให้เป็นมาตรฐานเดียวกัน

                          สำหรับการอบรมครั้งนี้ เป็นการอบรมเรื่อง คลังข้อมูลสถาบันและจดหมายเหตุดิจิทัล เห็นว่าเป็นประโยชน์ด้านการบริหารงานห้องสมุด ทางมหาวิทยาลัยจึงอนุมัติให้ผู้อำนวยการส่วนหอสมุดกลาง สำนักหอสมุดและเทคโนโลยีสารสนเทศ เข้ารับการอบรม พร้อกันนี้จะได้ให้ติดตามงานห้องสมุดวิทยาเขต วิทยาลัยสงฆ์ในภาคอิสานอีกด้วย

                          ผศ.ดร.เยาวลักษณ์ อภิชาติวัลลภ คณบดีคณะมนุษยศาสตร์และสังคมศาสตร์ มหาวิทยาลัยขอนแก่น กล่าวว่า "คลังข้อมูลสถาบัน เป็นแหล่งผลิตความรู้และทรัพย์สินทางปัญญาที่สำคัญ ที่ส่งผลต่อการแก้ปัญหาและการพัฒนาทางวิทยาศาสตร์เทคโนโลยีและสังคม กล่าวได้ว่ามหาวิทยาลัยมีทุนทางปัญญา (Intellectual Capital) ซึ่งมีมูลค่าสูงยิ่งกว่าทรัพย์สินในรูปแบบอื่นๆ จึงมีความจำเป็นอย่างยิ่งที่ต้องมีการความรู้และทรัพย์สินทางปัญญาของสถาบันอย่างเป็นระบบ สถาบันการศึกษาจึงควรให้ความสำคัญในการส่งเสริมและพัฒนาให้มีการจัดการความรู้และทรัพย์สินทางปัญญาโดยนำเทคโนโลยีสมัยใหม่มาใช้ โดยมหาวิทยาลัยชั้นนำต่างๆ ได้นำระบบนี้เข้ามาใช้อย่างมากหมาย เช่น มหาวิทยาลัยขอนแก่น, มหาวิทยาลัยมหิดล, จุฬาลงกรณ์มหาวิทยาลัย แต่ส่วนใหญ่จะมีมากในยุโรป ออสเตรีย ญี่ปุ่น"

                            การอบรมครั้งนี้มี รศ.ดร.กุลธิดา ท้วมสุข กลุ่มวิชาการจัดการสารสนเทศและการสื่อสาร, Prof.Dr.Shigeo Sugimoto Graduate School of Library, Information and Media Studies, The University of tsukuba, Japan, ศ.ดร.วิลาส วูวงศ์ สถาบันเทคโนโลยีแห่งเอเซีย เป็นวิทยากร

                           คลังข้อมูล หมายถึง ฐานข้อมูลขนาดใหญ่ขององค์กรหรือหน่วยงานหนึ่งๆ ซึ่งเก็บรวบรวมข้อมูลจากฐานข้อมูลระบบงานประจำวัน หรือเรียกอีกอย่างว่า operational database และฐานข้อมูลอื่นภายนอกองค์กร หรือเรียกว่า external database โดยข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้น มีวัตถุประสงค์ในการนำมาใช้งานและมีลักษณะของการจัดเก็บแตกต่างไปจากข้อมูลในฐานข้อมูลระบบงานอื่น โดยข้อมูลในคลังข้อมูลจะถูกนำมาใช้เพื่อสนับสนุนการตัดสินใจบริหารงานของผู้บริหาร โดยเฉพาะการเป็นข้อมูลพื้นฐานให้กับระบบงาน เพื่อการบริหารงานอื่น เช่น ระบบ DSS และระบบ CRM เป็นต้น
                           คุณลักษณะเฉพาะของคลังข้อมูล
                         จากนิยามของคลังข้อมูลที่บอกถึงความแตกต่างกันระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ ซึ่งสามารถสรุปคุณลักษณะของคลังข้อมูลได้ดังนี้
  1. Subject oriented หรือการแบ่งโครงสร้างตามเนื้อหา หมายถึง คลังข้อมูลถูกออกแบบมาเพื่อมุ่งเน้นไปในแต่ละเนื้อหาที่สนใจ ไม่ได้เน้นไปที่การทำงานหรือกระบวนการแต่ละอย่างโดยเฉพาะเหมือนอย่างฐานข้อมูลปฏิบัติการในส่วนของรายละเอียดข้อมูลที่จัดเก็บในระบบทั้งสองแบบก็จะแตกต่างกันไปตามความต้องการใช้งานด้วยเช่นกัน คลังข้อมูลจะไม่จำกัดเก็บข้อมูลที่ไม่มีส่วนเกี่ยวข้องกับการประมวลผลเพื่อสนับสนุนการตัดสินใจ ในขณะที่ข้อมูลนั้นจะถูกเก็บไว้ในฐานข้อมูลปฏิบัติการหากมีส่วนที่เกี่ยวข้องกับกระบวนการทำงาน
  2. Integration หรือการรวมเป็นหนึ่ง ซึ่งถือได้ว่าเป็นคุณลักษณะที่สำคัญที่สุดของคลังข้อมูล คือการรวบรวมข้อมูลจากหลายฐานข้อมูลปฏิบัติการเข้าด้วยกัน และทำให้ข้อมูลมีมาตราฐานเดียวกัน เช่นกำหนดให้มีค่าตัวแปรของข้อมูลในเนื่อหาเดียวกันให้เป็นแบบเดียวกันทั้งหมด
  3. Time variancy หรือความสัมพันธ์กับเวลา หมายถึงข้อมูลในคลังข้อมูล จะต้องจัดเก็บโดยกำหนดช่วงเวลาเอาไว้ โดยจะสัมพันธ์กับการดำเนินธุรกิจของหน่วยธุรกิจนั้น เพราะในการตัดสินด้านการบริหารจำเป็นต้องมีข้อมูลเปรียบเทียบในแต่ละช่วงเวลา แต่ละจุดของข้อมูลจะเกี่ยวข้องกับจุดของเวลาและข้อมูลแต่ละจุดสามารถเปรียบเทียบกันได้ตามแกนของเวลา
  4. Nonvolatile หรือความเสถียรของข้อมูล หมายถึงข้อมูลในคลังข้อมูลจะไม่เปลี่ยนแปลงบ่อย ไม่ว่าจะเป็นการเพิ่มเติมข้อมูลใหม่ หรือการปรับปรุงแก้ไขข้อมูลเดิมที่บรรจุอยู่แล้ว ผู้ใช้ทำได้เพียงการเข้าถึงข้อมูลเท่านั้น
 
                           สถาปัตยกรรมคลังข้อมูล (Data Wharehouse Architrcture- DWA) 
  DWA เป็นโครงสร้างมาตราฐานที่ใช้บ่อย เพื่อให้เข้าใจแนวคิด และกระบวนการของคลังข้อมูลนั้นๆ ซึ่งโดยทั่วไปแล้วคลังข้อมูลแต่ละระบบอาจจะมีรูปแบบที่ไม่เหมือนกันได้ เพื่อให้เหมาะสมกับองค์กรนั้นๆ ทั้งนี้ส่วนประกอบต่างๆ ภายใน DWA ที่สำคัฯได้แก่
  1. Operational database หรือ external database layer ทำหน้าที่จัดการกับข้อมูลในระบบงานปฏิบัติการหรือแหล่งข้อมูลภายนอกองค์กร
  2. Information access layer เป็นส่วนที่ผู้ใช้ปลายทางติดต่อผ่านโดยตรง ประกอบด้วยฮาร์ดแวร์และซอฟต์แวร์ ที่ใช้ในการแสดงผลเพื่อวิเคราะห์ โดยมีเครื่องมือช่วย เป็นตัวกลางที่ผู้ใช้ใช้ติดต่อกับคลังข้อมูล โดยในปัจจุบันเครื่องมือที่ได้รับความนิยมเพิ่มขึ้นอย่างรวดเร็วนั้นคือ Online Analytical Processing Tool หรือ OLAP tool ซึ่งเป็นเครื่องมือที่มีความสามารถในการวิเคราะห์ที่ซับซ้อน และแสดงข้อมูลในรูปแบบหลายมิติ
  3. Data access layer เป็นส่วนต่อประสานระหว่าง Information access layer กับ operational layer
  4. Data directory (metadata) layer เพื่อให้เข้าใจถึงข้อมูลได้ง่ายขึ้น และเป็นการเพิ่มความเร็วในการเรียกและดึงข้อมูลของคลังข้อมูล
  5. Process management layer ทำหน้าที่จัดการกระบวนการทำงานทั้งหมด
  6. Application messaging layer เป็นมิดเดิลแวร์ ทำหน้าที่ในการส่งข้อมูลภายในองค์กรผ่านทางเคลือข่าย
  7. Data warehouse (physical) layer เป็นแหล่งเก็บข้อมูลของทั้ง information data และ external data ในรูปแบบที่ง่ายแก่การเข้าถึงและยืดหยุ่นได้
  8. Data staging layer เป็นกระบวนการการแก้ไข และดึงข้อมูลจาก external database


  เทคนิคในการสร้างคลังข้อมูล
  การเคลื่อนที่ของข้อมูลในคลังข้อมูล ข้อมูลที่จัดเก็บภายในคลังข้อมูลมีการเคลื่อนที่ของข้อมูล (information flow) 5 ประเภท ดังนี้
  1. Inflow คือการนำข้อมูลจากฐานข้อมูลอื่นเข้าสู่คลังข้อมูลทั้งฐานข้อมูลภายในและภายนอกองค์กร โดยในขั้นนี้อาจมีการเปลี่ยนแปลงโรงสร้างข้อมูล การทำ denormalize การลบหรือการเพิ่มฟิลด์เพื่อให้ข้อมูลทั้งหมดอยู่ในเนื้อหาที่สนใจเดียวกัน ในขั้นตอนนี้อาจใช้เครื่องมือที่เรียกว่า data warehouse tool
  2. Upflow เมื่อข้อมูลที่เราต้องการอยู่ในคลังข้อมูลแล้ว ในบางครั้งอาจต้องมีการเพิ่มคุณค่าให้กับข้อมูลด้วยเพื่อให้ข้อมูลอยู่ในรูปแบบที่เป็นประโยชน์มากที่สุดต่อการนำเครื่องมือมาใช้ ซึ่งได้แก่การจัดกลุ่มข้อมูลหาค่าทางสถิติที่ซับซ้อน จัดข้อมูลให้อยู่ในรูปแบบหรือเทมเพลตมาตราฐาน
  3. Downflow เป็นขั้นตอนของการปรับปรุงเปลี่ยนแปลงข้อมูลเก่า และไม่อยู่ในเนื่อหาที่องค์กรสนใจออกไปจากคลังข้อมูลขององค์กร
  4. Outflow เป็นขั้นตอนที่ผู้ใช้เรียกใช้ข้อมูลในคลังข้อมูลผ่านเครื่องมือต่างๆ โดยการเรียกใช้อาจมีเพียงขอเรียกเป็นครั้งคราวเป็นประจำทุกวัน/เดือน หรือแม้กระทั่งต้องการแบบทันที
  5. Metaflow ข้อมูลที่จัดเก็บในคลังข้อมูลจะถูกทำข้อมูลไว้อีกชุดหนึ่ง เป็นแหล่งที่มาของข้อมูลนั้น หรือแม้กระทั่งที่อยู่ของข้อมูลนั้นในคลังข้อมูลและข้อมูลอื่นที่เกี่ยวข้อง

  วิธีการออกแบบฐานข้อมูลสำหรับคลังข้อมูล
  วิธีการนี้ถูกเสนอโดย Kimball ในปี 1996 เรียกว่าระเบียบวิธี 9 ชั้น หรือ Nine-Step Methodology โดยวิธีการนี้เริ่มจากการออกแบบจากส่วนย่อยที่แสดงถึงแต่ละระบบงานขององค์กร หรือเรียกอีกอย่างหนึ่งว่าดาต้ามาร์ท (data mart) โดยเมื่อออกแบบแต่ละส่วนสำเร็จแล้ว จึงนำมารวมกันเป็นคลังข้อมูล ขององค์กรในขั้นสุดท้าย ซึ่งขั้นตอนทั้ง 9 ขั้นตอน มีรายละเอียดดังนี้
  1. กำหนดดาต้ามาร์ท คือการเลือกว่าจะสร้างดาต้ามาร์ทของระบบงานใดบ้าง และระบบงานใดเป็นระบบงานแรกโดยองค์กรจะต้องสร้าง E-R model ที่รวมระบบงานทุกระบบขององค์กรไว้ แสดงการเชื่อมโยงของแต่ละระบบงานอย่างชัดเจน และสิ่งที่ต้องคำนึงถึงในการเลือกระบบงานที่จะเป็นดาต้ามาร์ทแรกนั้น มี 3 ปัจจัยที่เกี่ยวข้อง ได้แก่ จะต้องสามารถพัฒนาออกมาได้ทันตามเวลาที่ต้องการ โดยอยู่ในงบประมาณที่กำหนดไว้และต้องตอบปัญหาทางธุรกิจให้แก่องค์กรได้ ดังนั้นดาต้ามาร์ทแรกควรจะเป็นของระบบงานที่นำรายได้เข้ามาสู่องค์กรได้ เช่น ระบบงานขาย เป็นต้น
  2. กำหนด fact table ของดาต้ามาร์ท คือกำหนดเนื่อหาหลักที่ควรจะเป็นของดาต้ามาร์ท โดยการเลือกเอนทิตีหลักและกระบวนการที่เกี่ยวกับเอนทริตีนั้นๆ ออกมาจาก E-R model ขององค์กร นั้นหมายถึงว่าจะทำให้เราทราบถึง dimension table ที่ควรจะมีด้วย
  3. กำหนดแอตทริบิวต์ที่จำเป็นในแต่ละ dimension table คือการกำหนดแอตทริบิวต์ที่บอกหรืออธิบายรายละเอียดของ dimension ได้ ทั้งนี้แอตทริบิวต์ที่เป็น primary key ควรเป็นค่าที่คำนวณได้ กรณีที่มีดาต้ามาร์ทมากกว่าหนึ่งดาต้ามาร์ทมี dimension เหมือนกัน นั่นหมายถึงว่า แอตทริบิวตืใน dimension นั้นจะต้องเหมือนกันทุกประการ นั้นไม่อาจจะแก้ไขปัญหาการจัดเก็บข้อมูลซ้ำซ้อน อันนำมาสู่ความแตกต่างกันของข้อมูลชุดเดียวกัน ปัญหานี้จึงเป็นการดีที่จะมีการใช้ dimension table ร่วมกันในแต่ละ fact table ที่จำเป็นต้องมี dimension ดังกล่าว โดยเรียก dimension table ลักษณะแบบนี้ว่า comformed และเรียก fact table ว่า fact constellation เราสามารถกำหนดข้อดีของการใช้ dimension table ร่วมกันได้ดังนี้
  (1) แน่ใจได้ว่าในแต่ละรายงานจะออกมาสอดคล้องกัน
  (2) สามารถสร้างดาต้ามาร์ทในเวลาต่างๆ กันได้
  (3) สามารถเข้าถึงดาต้ามาร์ทโดยผู้พัฒนากลุ่มอื่นๆ
  (4) สามารถรวบรวมดาต้ามาร์ทหลายๆ อันเข้าด้วยกัน
  (5) สามารถออกแบบคลังข้อมูลร่วมกันได้
  4. กำหนดแอตทริบิวต์ที่จำเป็นใน fact table โดยแอตทริบิวต์หลักใน fact table จะมาจาก primary key ในแต่ละ dimension table นอกจากนี้แล้ว ยังสามารถมีแอตทริบิวต์ที่จำเป็นอื่นๆ ประกอบอยู่ด้วย เช่น แอตทริบิวต์ที่ได้จากการคำนวณค่าเบื่องต้นที่จำเป็นสำหรับการคงอยู่ของแอตทริบิวต์อื่นใน fact table เรียกอีกอย่างหนึ่งว่า measure การกำหนดแอตทริบิวต์นี้ไม่ควรจะเลือกแอตทริบิวต์ที่คำนวณไม่ได้ เช่นเป็นตัวหนังสือหรือไม่ใช่ตัวเลข เป็นต้น และไม่ควรเลือกแอตทริบิวต์ที่ไม่เกี่ยวข้องกับเนื่อหาของ fact table ที่เราสนใจด้วย
  5. จัดเก็บค่าการคำนวณเบื้องต้นใน fact table คือการจัดเก็บที่ได้จากการคำนวณให้เป็นแอตทริบิวต์ใน fact table ถึงแม้ว่าจะสามารถหาค่าได้จากแอตทริบิวต์อื่นๆ ก็ตาม ทั้งนี้เพื่อให้การสอบถามมีประสิทธิภาพมากขึ้น สามารถทำงานด้วยความเร็วที่เพิ่มขึ้น เนื่องจากไม่ต้องคำนวณค่าใหม่ทั้งหมด ถึงแม้ว่าจะเกิดความซ้ำซ้อนของข้อมูลในการจัดเก็บบ้างก็ตาม
  6. เขียนคำอธิบาย dimension table ทั้งนี้ก็เพื่อให้ผู้ใช้สามารถใช้งานดาต้ามาร์ทได้อย่างมีประสิทธิภาพเพราะเกิดความเข้าใจอย่างดีในส่วนต่างๆ
  7. กำหนดระยะเวลาในการจัดเก็บข้อมูลในฐานข้อมูล โดยอาจจะเป็นการจัดเก็บเพียงช่วงระยะเวลา 1-2 ปี หรือนานกว่านั้น ขึ้นอยู่กับความต้องการขององค์กร เนื่องจากองค์กรแต่ละประเภทมีความต้องการในการจัดเก็บข้อมูลต่างช่วงเวลากัน ทั้งนี้ขึ้นอยู่กับความจำเป็นหรือข้อกำหนดในการดำเนินธุรกิจมีข้อสังเกตอยู่ 2 ประการที่น่าสนใจและสำคัญสำหรับการออกแบบแอตทริบิวต์ในเรื่องของการจัดเก็บข้อมูล ดังนี้
  (1) ข้อมูลที่ถูกจัดเก็บไว้นานเกินไปมักเกิดปัญหาการอ่าน หรือแปลข้อมูลนั้นๆ จากแฟ้มหรือเทปเก่า
  (2) เมื่อมีการนำรูปแบบเก่าของ dimension table มาใช้อาจเกิดปัญหาการเปลี่ยนแปลงของ dimension อย่างช้าๆ ได้
  8. การติดตามปัญหาการเปลี่ยนแปลงของ dimension อย่างช้าๆ คือ การเปลี่ยนเอาแอตทริบิวต์ของ dimension table เก่ามาใช้แล้วส่งผลกระทบต่อข้อมูลปัจจุบันของ dimension table โดยสามารถแบ่งประเภทของปัญหาที่เกิดได้ 3 ประเภท ดังนี้
  (1) เกิดการเขียนทับข้อมูลใหม่โดยข้อมูลเก่า
  (2) เกิดเรคอร์ดใหม่ๆ ขึ้นใน dimension
  (3) เกิดเรคอร์ดที่มีทั้งค่าเก่าและใหม่ปนกันไป
  9. กำหนดคิวรี่เป็นการออกแบบด้านกานภาพเพื่อให้ผู้ใช้เกิดความสะดวกในการใช้งานและสามารถทำงานได้อย่างมีประสิทธิภาพเมื่อดำเนินการทั้ง 9 ขั้นตอนสำหรับแต่ละดาต้ามาร์ทเสร็จแล้ว จึงจะนำทั้งหมดมารวมกันเป็นภาพของคลังข้อมูลขององค์กรต่อไป
 
  การแปลงข้อมูลเข้าสู่ดาต้ามาร์ท
  เมื่อเราออกแบบฐานข้อมูลสำหรับแต่ละดาต้ามาร์ทเสร็จแล้ว ขั้นตอนต่อไปที่สำคัญยิ่งก็คือการนำข้อมูลจากแหล่งข้อมูลไปแปลงให้อยู่ในแพลตฟอร์มของฐานข้อมูลที่ได้ออกแบบไว้ นั่นก็คือการแปลงข้อมูล หรือ Extraction Transformation and Loading (ETL) นั่นเอง โดยที่คุณภาพของการแปลงข้อมูลเป็นสิ่งสำคัญมากสำหรับการสร้างคลังข้อมูล จะแตกต่างกันไปตามคลังข้อมูลที่แต่ละองค์กรต้องการ โดยที่การแปลงข้อมูลหมายรวมตั้งแต่การวิเคราะห์แหล่งข้อมูล กำหนดการส่งข้อมูลรวบรวมหรือสร้างข้อมูลภายนอก วางแผนและสร้างรูทีนของการแปลงข้อมูล และตรวจสอบความถูกต้องของข้อมูลที่ได้สามารถสรุปเป็นขั้นตอนได้ดังนี้
  1. วิเคราะห์แหล่งข้อมูล เช่น ปริมาณของข้อมูล จำนวนและชนิดของการเข้าถึงแหล่งข้อมูล แพลตฟอร์มและภาษาโปรแกรมที่ใช้ เป็นต้น
  2. ย้ายข้อมูลที่ต้องการจากระบบเดิมมาไว้ในบริเวณที่ใช้ปรับแต่งข้อมูล หรือเรียกบริเวณนี้ว่า staging area เพื่อนำมาเลือกเฉพาะส่วนที่ต้องการแปลงข้อมูลและตรวจสอบความถูกต้อง หรือการทำความสะอาดข้อมูล
  3. กำหนด primary key ของ fact table และ dimension table และกำหนด foreign key ระหว่าง fact table กับ dimension table
  4. ย้ายข้อมูลที่ทำความสะอาดแล้วจาก staging area ลงสู่เซิร์ฟเวอร์ของดาต้ามาร์ท
  5. สร้าง metadata ของแต่ละดาต้ามาร์ท โดยเก็บรายละเอียดของข้อมูลการอัปเดตและส่งออกไปไว้ในดาต้ามาร์ท
  6. ตรวจสอบความถูกต้องของข้อมูล ซึ่งจะต้องกระทำตลอดทั้งกระบวนการแปลงข้อมูลจำทำได้ดังนี้
  (1) ตรวจสอบผลรวมทั้งหมดของจำนวนข้อมูลที่ดึงมาจากแหล่งข้อมูลที่เพิ่มเข้าไป
  (2) ตรวจแก้ข้อมูลในระบบเดิมของแหล่งข้อมูล หรือในรูทีนของการแปลง ซึ่งควรจะเก็บข้อมูลในการตรวจแก้ไว้ใน metadata ของการแปลงข้อมูลด้วย
  (3) ตรวจสอบค่าของข้อมูลให้ถูกต้องในกระบวนการรวบรวมข้อมูล
  (4) ตรวจสอบผลรวมของข้อมูลหลังจากย้ายข้อมูลลงสู่ดาต้ามาร์ทแล้ว


  สรุป
  คลังข้อมูลเป็นการรวบรวมข้อมูลจากฐานข้อมูลของระบบงานปฏิบัติงานประจำวันขององค์กร แล้วนำมาแปลงข้อมูลให้อยู่ในรูปแบบ ที่เหมาะสมในการเก็บและสะดวกในการใช้งาน แล้วจึงนำข้อมูลนั้นเข้าไปเก็บในคลังข้อมูล
  การพัฒนาหรือสร้างคลังข้อมูลจากฐานข้อมูลจะต้องมีการพิจารณาถึงองคืประกอบที่จำเป็นในการสร้างให้เหมาะสมด้วย ทั้งนี้เพื่อให้เกิดความคุ้มค่าในการลงทุนและเกิดประโยชน์สูงสุดต่อองค์กร ถึงแม้ว่าเทคโนโลยีคลังข้อมูล จะให้ประสิทธิภาพในการใช้ข้อมูลอย่างมากก็ตาม แต่สิ่งที่ต้องคำนึงด้วยคือทรัพยากรที่องค์กรจะต้องทุ่มเทลงไปในการพัฒนาที่อาจจะเกิดขึ้นจนองค์กรไม่สามารถจะพัฒนาระบบนี้จนสำเร็จ และนำมาใช้งานได้ เกิดการลงทุนที่สูญเปล่า ดังนั้นจึงต้องมีการวางแผนควบคุมและจัดการให้รอบคอบ

ที่มา : http://www.pwstation.com/datawarehouse1.htm


แหล่งข่าว : ส่วนเทคโนโลยีสารสนเทศ
Print This Page    Sent to Friend
แสดงความคิดเห็น

ข่าวที่เกี่ยวข้อง

  • มจร จัดพิธีถวายพระพรชัยมงคล และเจริญพระพุทธมนต์ เฉลิมพระเกียรติพระวชิรเกล้าเจ้าอยู่หัว เนื่องในโอกาสวันเฉลิมพระชนมพรรษา ๖ รอบ ๒๘ กรกฎาคม ๒๕๖๗
    26 ก.ค. 67 | ข่าวมหาวิทยาลัย
    136
  • ขอขอบคุณ ดร.สุวรา นาคยศ อาจารย์ประจำภาควิชาหลักสูตรและการสอน คณะครุศาสตร์ มอบเงินจำนวน 500,000 บาท สนับสนุนโครงการส่งเสริมสุขภาพฯ
    25 ก.ค. 67 | ข่าวมหาวิทยาลัย
    384
  • ขอเชิญลงทะเบียนเข้าร่วมพิธีถวายพระพรชัยมงคลและพิธีเจริญพระพุทธมนต์เฉลิมพระเกียรติ พระบาทสมเด็จพระเจ้าอยู่หัว และเข้าร่วมกิจกรรมจิตอาสาเฉลิมพระเกียรติ เนื่องในวันเฉลิมพระชนมพรรษา ประจำปี พ.ศ.๒๕๖๗
    23 ก.ค. 67 | ข่าวมหาวิทยาลัย
    473
  • การตรวจประเมินคุณภาพการศึกษาภายนอก สมศ. รอบสี่ ระดับอุดมศึกษา มหาวิทยาลัยมหาจุฬาลงกรณราชวิทยาลัย
    19 ก.ค. 67 | ข่าวมหาวิทยาลัย
    141
  • องคมนตรี เชิญหิรัญบัฏ พัดยศ ผ้าไตร และเครื่องยศสมณศักดิ์ ถวายแด่ พระพรหมวัชรธีราจารย์ (สมจินต์ สมฺมาปญฺโญ ป.ธ.๙,ศ.ดร.) วัดปากน้ำ พระอารามหลวง
    18 ก.ค. 67 | ข่าวมหาวิทยาลัย
    154