บทที่ 5 : 5.2หลักการและความหมายฐานข้อมูล
บทที่ ๕ ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์
๕.๒ หลักการและความหมายของฐานข้อมูล
๕.๒.๑ นิยามของคำว่า “ข้อมูล” (Definition of Data)
ในทางทฤษฎี คำว่า “ข้อมูล” (Data), “ข่าวสาร” (News) และ “สารสนเทศ” (Information) แม้จะมีความใกล้เคียงกันในความหมายทั่วไป แต่ในเชิงระบบสารสนเทศนั้นถือว่ามี นัยที่แตกต่างกันอย่างมีนัยสำคัญ
ข้อมูล (Data) หมายถึง ข้อเท็จจริง ที่เกิดขึ้นตามธรรมชาติหรือจากการสังเกต ซึ่งอาจอยู่ในรูปของ ตัวเลข, ภาษา, หรือ สัญลักษณ์ ที่ยัง มิได้ผ่านการวิเคราะห์หรือประมวลผล เพื่อสร้างความหมาย เช่น ตัวเลขประชากร รหัสพื้นที่ หรือรายการชื่อสถานที่ ฯลฯ
ตามลักษณะของเนื้อหา สามารถจำแนกข้อมูลได้เป็น ๓ ประเภทหลัก ได้แก่:
1, ข้อมูลที่เป็นข้อเท็จจริงเชิงปริมาณ (Quantitative Data) เช่น จำนวนประชากร ระยะทาง ความสูง หรือพื้นที่เพาะปลูก ซึ่งสามารถวัดหรือคำนวณได้
2, ข้อมูลที่ไม่อยู่ในรูปของตัวเลข (Qualitative Data) เช่น ชื่อบุคคล ที่อยู่ ประวัติการศึกษา หรือสถานภาพทางครอบครัว ซึ่งใช้ระบุลักษณะเฉพาะของสิ่งใดสิ่งหนึ่งโดยไม่เกี่ยวข้องกับค่าทางคณิตศาสตร์
3, ข้อมูลในลักษณะข่าวสารหรือข้อความดิบที่ยังไม่ผ่านการตีความ (Raw Records or Unprocessed Reports) เช่น รายงานประจำเดือน บันทึกเหตุการณ์ คำสั่งราชการ กฎหมาย หรือเหตุการณ์เฉพาะหน้า ทั้งหมดนี้ถือเป็น “ข้อมูล” ที่อาจนำไปวิเคราะห์เพื่อสังเคราะห์เป็น “สารสนเทศ” ได้ต่อไป
ในทางทฤษฎีระบบสารสนเทศและวิทยาการข้อมูล คำว่า “ข้อมูล” (Data), “ข่าวสาร” (News) และ “สารสนเทศ” (Information) แม้จะมักถูกใช้แทนกันในภาษาพูดทั่วไป แต่ในเชิงวิชาการและเทคโนโลยีสารสนเทศนั้น แต่ละคำมี นิยามเฉพาะที่แตกต่างกันอย่างมีนัยสำคัญ โดยสามารถอธิบายเชิงลำดับขั้นและเชิงกระบวนการได้ดังนี้:
🧩 1. ข้อมูล (Data)
ข้อมูล หมายถึง ข้อเท็จจริงดิบ (Raw Facts) ซึ่งอาจอยู่ในรูปของตัวเลข ตัวอักษร สัญลักษณ์ รูปภาพ หรือเสียง ที่ ยังไม่มีการประมวลผล หรือแปลความหมายใด ๆ โดยตรง เช่น:
- ตัวเลข:
3,500
,7.2
,2025
- ข้อความ:
ชาย
,ลำปาง
,NDVI
- สัญลักษณ์: ✔️ ❌ 📍
ในระบบ GIS ข้อมูลดิบอาจหมายถึงพิกัด X,Y ของตำแหน่งหนึ่งๆ หรือรหัสการใช้ที่ดิน เช่น A1
, F3
โดยที่ยังไม่ได้เชื่อมโยงกับความหมายเชิงนโยบายหรือวิเคราะห์ทางพื้นที่
🗞️ 2. ข่าวสาร (News)
ข่าวสาร หมายถึง เหตุการณ์หรือความเคลื่อนไหวที่ได้รับการสื่อสารผ่านสื่อหรือผู้เผยแพร่ ซึ่งเน้นลักษณะ การถ่ายทอดหรือแจ้งให้ทราบ ในเชิงเวลา (Timeliness) และสถานการณ์ (Context)
- ตัวอย่าง: “ฝนตกหนักในพื้นที่ลุ่มแม่น้ำปิง”, “ชุมชนบ้านใหม่มีน้ำท่วมขังเกิน 3 วัน”
ข่าวสารอาจใช้ ข้อมูล เป็นองค์ประกอบ เช่น ปริมาณฝนที่ตกลงมา (Data) แต่มีการเชื่อมโยงกับ สถานการณ์จริง ซึ่งถูกเผยแพร่ผ่านช่องทางสื่อมวลชนหรือระบบเตือนภัย เช่น News Feed หรือ Real-time Alert Systems
🧠 3. สารสนเทศ (Information)
สารสนเทศ หมายถึง ข้อมูลที่ผ่านการรวบรวม ประมวลผล วิเคราะห์ หรือจัดระเบียบ เพื่อให้สามารถ สื่อความหมาย มีคุณค่า และสามารถนำไปใช้ในการตัดสินใจได้ เช่น:
- ค่าเฉลี่ยรายได้ต่อครัวเรือนในตำบล A = 9,800 บาท
- พื้นที่ป่าไม้ลดลงร้อยละ 12 เมื่อเทียบกับปีที่ผ่านมา
- อำเภอ X มีความเสี่ยงน้ำท่วมระดับสูงในช่วงมิถุนายน–กันยายน
ในบริบทของ GIS สารสนเทศอาจอยู่ในรูปแบบของ แผนที่ thematic, ตารางเปรียบเทียบ, หรือ ผลวิเคราะห์เชิงพื้นที่ ที่สามารถใช้ประกอบการตัดสินใจเชิงนโยบายหรือการวางแผนพัฒนา
🔄 ความสัมพันธ์เชิงลำดับ (Data → Information → Knowledge)
- Data เป็นวัตถุดิบ →
- นำมา ประมวลผล → ได้เป็น Information →
- เมื่อนำ Information มาสังเคราะห์อย่างเป็นระบบ → เกิด Knowledge (องค์ความรู้)
- ความรู้ที่นำไปใช้ซ้ำได้ → กลายเป็น Intelligence (ภูมิปัญญาเชิงปฏิบัติ)
๕.๒.๒ แหล่งที่มาของข้อมูล (Data Sources)
ข้อมูลที่นำมาใช้ในระบบสารสนเทศทางภูมิศาสตร์สามารถมาจากแหล่งต่าง ๆ ซึ่งแบ่งออกเป็น ๒ ประเภทหลัก ได้แก่:
แหล่งข้อมูลปฐมภูมิ (Primary Data Source)
แหล่งข้อมูลปฐมภูมิ หมายถึง ข้อมูลที่ได้จากการเก็บรวบรวมโดยตรงจากแหล่งต้นทาง โดยมิได้ผ่านการประมวลผล หรือสรุปผลจากแหล่งอื่นมาก่อน ผู้วิจัยหรือผู้ปฏิบัติงานเป็นผู้ดำเนินการเก็บข้อมูลด้วยตนเอง ผ่านการสำรวจภาคสนามหรือแบบสอบถาม ซึ่งข้อมูลที่ได้มานั้นถือเป็น ข้อเท็จจริงดิบ ที่มีความทันสมัยและสอดคล้องกับวัตถุประสงค์เฉพาะด้านของการวิจัยหรือการวิเคราะห์เชิงพื้นที่ในระบบ GIS
แหล่งข้อมูลปฐมภูมิ (Primary Data Source) หมายถึง ข้อมูลที่ได้จากการเก็บรวบรวมโดยตรงจากแหล่งต้นทาง หรือโดยการสำรวจภาคสนาม เช่น การออกไปเก็บข้อมูลจำนวนประชากรวัยทำงานในจังหวัดลพบุรีโดยตรงจากหน่วยสำรวจ หรือการลงพื้นที่เพื่อสอบถามระดับรายได้ของครัวเรือนในหมู่บ้าน
ตัวอย่างของแหล่งข้อมูลปฐมภูมิ ได้แก่
- การลงพื้นที่สำรวจจำนวนประชากรวัยทำงานในจังหวัดลพบุรีโดยตรง
- การสอบถามระดับรายได้ของครัวเรือนผ่านแบบสอบถามในแต่ละหมู่บ้าน
- การเก็บพิกัด GPS จุดตั้งของแหล่งน้ำขนาดเล็ก
- การสำรวจประเภทการใช้ที่ดินจริงด้วยการสำรวจภาพถ่ายทางอากาศร่วมกับการตรวจสอบภาคสนาม (ground-truthing)
การใช้แหล่งข้อมูลปฐมภูมิให้ผลลัพธ์ที่มีความน่าเชื่อถือสูง เนื่องจากสามารถควบคุมวิธีการเก็บข้อมูล ระยะเวลา และความถูกต้องของข้อมูลได้โดยตรง อย่างไรก็ตาม การจัดเก็บข้อมูลลักษณะนี้มักต้องใช้ เวลา, งบประมาณ, และ บุคลากร จำนวนมาก จึงเหมาะกับการศึกษาในเชิงลึกหรือพื้นที่เฉพาะที่ไม่มีข้อมูลรองรับจากแหล่งทุติยภูมิ
แหล่งข้อมูลทุติยภูมิ (Secondary Data Source)
แหล่งข้อมูลทุติยภูมิ หมายถึง ข้อมูลที่ได้จากแหล่งซึ่งมีผู้อื่นเป็นผู้รวบรวม วิเคราะห์ หรือประมวลผลไว้ล่วงหน้าแล้ว โดยผู้ใช้ข้อมูลไม่ได้เป็นผู้ดำเนินการจัดเก็บข้อมูลนั้นโดยตรง แต่สามารถนำข้อมูลดังกล่าวมาใช้ประโยชน์ต่อในการศึกษา วิเคราะห์ หรือจัดทำฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์ (GIS)
แหล่งข้อมูลทุติยภูมิ (Secondary Data Source) หมายถึง ข้อมูลที่ได้จากแหล่งที่มีผู้อื่นรวบรวมและประมวลผลไว้แล้ว เช่น การนำข้อมูลจำนวนครัวเรือนในเขตเทศบาลจากสถิติของที่ว่าการอำเภอ หรือการใช้ข้อมูลจากการสำรวจของกรมสถิติแห่งชาติ
แหล่งข้อมูลทุติยภูมิมีบทบาทสำคัญในด้านการวิจัยและการจัดการข้อมูลเชิงพื้นที่ เนื่องจากสามารถช่วยประหยัด เวลา, งบประมาณ, และ ทรัพยากรบุคคล ที่ต้องใช้ในการเก็บข้อมูลภาคสนาม
ตัวอย่างของแหล่งข้อมูลทุติยภูมิ ได้แก่
- การใช้ข้อมูลจำนวนครัวเรือนในเขตเทศบาลจากระบบสถิติของที่ว่าการอำเภอ
- การนำเข้าข้อมูลประชากรจากการสำรวจของ กรมการปกครอง หรือ สำนักงานสถิติแห่งชาติ
- ข้อมูลภาพถ่ายดาวเทียมที่จัดเตรียมโดยหน่วยงานเช่น GISTDA
- แผนที่จากกรมแผนที่ทหาร หรือข้อมูลแนวเขตจาก ระบบ One Map
แม้ว่าข้อมูลทุติยภูมิจะสามารถเข้าถึงได้ง่ายและครอบคลุมในระดับกว้าง แต่จำเป็นต้องพิจารณา ความน่าเชื่อถือของแหล่งที่มา, ช่วงเวลาที่เก็บข้อมูล, และ ความเหมาะสมของรูปแบบข้อมูล ก่อนนำมาใช้ เนื่องจากข้อมูลบางชุดอาจไม่สอดคล้องกับวัตถุประสงค์การวิเคราะห์ในเชิงพื้นที่เฉพาะเจาะจง หรืออาจล้าสมัยเมื่อเปรียบเทียบกับสภาพปัจจุบัน
รายการแหล่งข้อมูลทุติยภูมิจากหน่วยงานภาครัฐของประเทศไทย ซึ่งสามารถนำมาใช้ในการสร้างหรือเสริมฐานข้อมูลสำหรับระบบสารสนเทศภูมิศาสตร์ (GIS) ทั้งในด้านการวางแผน การวิจัย และการวิเคราะห์เชิงพื้นที่ในระดับต่าง ๆ ตั้งแต่ชุมชนจนถึงระดับประเทศ:
📚 แหล่งข้อมูลทุติยภูมิจากหน่วยงานรัฐในประเทศไทย
หน่วยงาน | ประเภทข้อมูล | รูปแบบข้อมูลที่ให้บริการ | ลิงก์ / ช่องทางเข้าถึง |
---|---|---|---|
กรมโยธาธิการและผังเมือง | ข้อมูลผังเมืองรวม, ผังการใช้ประโยชน์ที่ดิน | Shapefile, PDF | https://www.dpt.go.th |
สำนักงานสถิติแห่งชาติ (NSO) | ข้อมูลสำมะโนประชากร, ครัวเรือน, รายได้, การศึกษา | Excel, CSV, API | https://www.nso.go.th |
กรมที่ดิน (DOL) | แนวเขตที่ดิน, เอกสารสิทธิ์, การใช้ประโยชน์ที่ดิน | WebGIS, Shapefile (บางส่วน) | https://www.dol.go.th |
กรมป่าไม้ (RFD) | แนวเขตป่าสงวน, ป่าชุมชน, ประเภทป่า | Shapefile, WebGIS | http://forestinfo.forest.go.th |
GISTDA (สำนักงานพัฒนาเทคโนโลยีอวกาศและภูมิสารสนเทศ) | ภาพถ่ายดาวเทียม, NDVI, LULC, OneMap | GeoTIFF, Shapefile, WMS | https://data.gistda.or.th |
กรมอุตุนิยมวิทยา | ข้อมูลภูมิอากาศ, ปริมาณฝน, อุณหภูมิ | Excel, CSV, Web API | https://www.tmd.go.th |
กรมชลประทาน | แผนที่ลุ่มน้ำ, แหล่งน้ำ, โครงการชลประทาน | PDF, KML, Shapefile | https://www.rid.go.th |
กรมทรัพยากรน้ำ (DWR) | พื้นที่เสี่ยงน้ำท่วม, แผนที่แหล่งน้ำ, บ่อบาดาล | WebGIS, Shapefile | https://www.dwr.go.th |
กรมส่งเสริมคุณภาพสิ่งแวดล้อม (DEQP) | พื้นที่มลพิษ, ข้อมูลคุณภาพน้ำ/อากาศ | Excel, PDF, Web API | https://www.deqp.go.th |
กรมควบคุมโรค (DDC) | แผนที่โรคระบาด, ข้อมูลทางระบาดวิทยา | Excel, KML, JSON | https://www.ddc.moph.go.th |
กรมทางหลวง (DOH) | ข้อมูลเส้นทางถนน, ทางหลวง, ระยะทาง | Shapefile, Excel | https://www.doh.go.th |
สำนักงานพัฒนาเศรษฐกิจจากฐานชีวภาพ (BEDO) | ฐานทรัพยากรชีวภาพ, ความหลากหลายทางชีวภาพ | WebGIS, Excel | https://www.bedo.or.th |
📌 แนวทางการใช้ข้อมูลทุติยภูมิในระบบ GIS
- ดาวน์โหลดข้อมูลจากเว็บไซต์ทางการ พร้อมจัดเก็บ Metadata เช่น ปีที่จัดเก็บ, แหล่งที่มา, เงื่อนไขการใช้
- ตรวจสอบรูปแบบและโครงสร้างข้อมูล ให้สอดคล้องกับฐานข้อมูล GIS เช่น การมีรหัสพื้นที่, รูปแบบพิกัด
- นำเข้าข้อมูลในโปรแกรม GIS เช่น QGIS หรือ ArcGIS แล้วเชื่อมโยงกับข้อมูลเชิงพื้นที่ที่มีอยู่
- ประเมินความถูกต้องและความเหมาะสม ของข้อมูลก่อนนำไปวิเคราะห์เชิงพื้นที่ เช่น ระยะเวลา ความละเอียด และระดับเชิงพื้นที่ (หมู่บ้าน/อำเภอ/จังหวัด)
แนวทางการประเมินคุณภาพข้อมูลก่อนนำไปใช้ในระบบสารสนเทศภูมิศาสตร์ (GIS)
เป็นกระบวนการสำคัญที่ช่วยให้ผู้ใช้งานมั่นใจว่า ข้อมูลที่นำเข้าและวิเคราะห์ในระบบ GIS มีความถูกต้อง เหมาะสม และเชื่อถือได้ โดยเฉพาะเมื่อใช้ข้อมูลจากแหล่งทุติยภูมิหรือข้อมูลที่มีการรวบรวมจากหลายหน่วยงาน
ต่อไปนี้คือแนวทางการประเมินเชิงวิชาการที่ครอบคลุมทุกมิติของ “คุณภาพข้อมูล GIS”:
✅ 1. ความถูกต้องเชิงตำแหน่ง (Positional Accuracy)
หมายถึง ความใกล้เคียงของตำแหน่งพิกัดในแผนที่กับตำแหน่งจริงในโลกจริง
- ตรวจสอบระบบพิกัด (Coordinate System) เช่น WGS84, UTM Zone
- เปรียบเทียบตำแหน่งกับ GPS, ภาพถ่ายดาวเทียม, หรือฐานข้อมูลแผนที่มาตรฐาน
- ใช้ Root Mean Square Error (RMSE) ในการวัดความคลาดเคลื่อนจากกระบวนการ digitize หรือ georeferencing
เช่น: จุดที่ตั้งโรงเรียนใน shapefile ต้องตรงกับตำแหน่งจากแผนที่ภูมิประเทศหรือภาพถ่ายดาวเทียม
✅ 2. ความถูกต้องของคุณลักษณะ (Attribute Accuracy)
หมายถึง ความถูกต้องของข้อมูลเชิงคุณลักษณะในตารางข้อมูล
- ตรวจสอบความสอดคล้องระหว่างรหัสและคำอธิบาย เช่น
Landuse_Code = A1
ต้องหมายถึง “พื้นที่เกษตรกรรม” - ตรวจสอบค่าที่ผิดปกติ เช่น รายได้เฉลี่ยมากกว่าหนึ่งล้าน หรือจำนวนประชากรติดลบ
- ตรวจสอบความครบถ้วนของฟิลด์ข้อมูล (Missing Values)
ใช้คำสั่ง “Select by Attribute” ตรวจหา NULL หรือค่าที่อยู่นอกขอบเขตที่ยอมรับได้
✅ 3. ความสมบูรณ์ของข้อมูล (Completeness)
หมายถึง การมีข้อมูลครบถ้วนในเชิงพื้นที่และเชิงคุณลักษณะ
- ตรวจสอบว่ามีฟีเจอร์หายไปจากขอบเขต เช่น พื้นที่ขาว (gaps), เส้นถนนที่ขาดตอน (dangles)
- ตรวจสอบว่าทุกชิ้นข้อมูลมีตารางประกอบหรือไม่
- ตรวจสอบการมีอยู่ของรหัสประจำ (ID) ที่ใช้เชื่อมโยงกับข้อมูลอื่น
เช่น: ทุกตำบลควรมีรหัส
Tambon_ID
เพื่อเชื่อมกับตารางประชากร
✅ 4. ความสม่ำเสมอ (Consistency)
หมายถึง ความสอดคล้องของรูปแบบข้อมูลภายในชุดข้อมูลเดียวกัน
- ใช้ Domain หรือ Code List เพื่อจำกัดค่าที่อนุญาต เช่น
Flood_Risk = [ต่ำ, ปานกลาง, สูง]
เท่านั้น - ตรวจสอบว่าไม่มีการใช้คำสะกดผิด เช่น “หมู่บ้าน” กับ “หมุ่บ้าน”
- ตรวจสอบหน่วยวัด เช่น ตารางเมตร (m²) กับไร่ ควรใช้หน่วยเดียวกันในทุกฟีเจอร์
ควรมีการจัดทำ Data Dictionary เพื่อกำหนดรูปแบบข้อมูลแต่ละฟิลด์
✅ 5. ความเป็นปัจจุบัน (Temporal Accuracy)
หมายถึง ความทันสมัยของข้อมูลและความสอดคล้องกับเวลาที่ใช้
- ตรวจสอบวันที่เก็บข้อมูล (Metadata: Date of Acquisition)
- ตรวจสอบความถี่ในการปรับปรุงข้อมูล เช่น แผนที่ป่าไม้อัปเดตล่าสุดเมื่อใด
- พิจารณาความเหมาะสมของข้อมูลต่อการวิเคราะห์ตามเหตุการณ์ปัจจุบัน
เช่น: ข้อมูลน้ำท่วมควรใช้ข้อมูล 5 ปีล่าสุด ไม่ควรใช้ข้อมูลย้อนหลังเกิน 10 ปี
✅ 6. ความสามารถในการบูรณาการ (Interoperability)
หมายถึง ความสามารถของข้อมูลในการทำงานร่วมกับระบบ GIS หรือข้อมูลชุดอื่น
- ตรวจสอบว่าไฟล์ข้อมูลอยู่ในรูปแบบที่รองรับ เช่น
.shp
,.geojson
,.csv
- ตรวจสอบระบบพิกัดและ projection ให้สอดคล้องกันระหว่างชั้นข้อมูล
- ตรวจสอบโครงสร้างฟิลด์ และชนิดข้อมูล (Data Type) เช่น TEXT, DOUBLE, INTEGER
📌 แนวทางเชิงเครื่องมือ
เครื่องมือ | การประเมิน |
---|---|
QGIS Field Calculator / Field Statistics | วิเคราะห์ค่าสูงสุด ต่ำสุด ค่าเฉลี่ย ความถี่ |
Topology Checker | ตรวจสอบช่องว่าง (gap), จุดตัด (intersection), เส้นขาด (dangle) |
DB Manager / Attribute Table Editor | ตรวจสอบรูปแบบฟิลด์ ประเภทข้อมูล การ join หรือ relate |
ตารางประเมินคุณภาพข้อมูลก่อนนำเข้าในระบบสารสนเทศภูมิศาสตร์ (GIS Data Quality Assessment Checklist) ซึ่งสามารถนำไปประยุกต์ใช้ทั้งในงานวิจัย การจัดการข้อมูลภาคสนาม หรือการใช้งานข้อมูลจากแหล่งทุติยภูมิ เพื่อให้มั่นใจว่าข้อมูลมีความเหมาะสม พร้อมใช้งานในระบบ GIS:
🧾 ตารางประเมินคุณภาพข้อมูลก่อนนำเข้า GIS
หมวดหมู่การประเมิน | รายการตรวจสอบ | คำอธิบาย | ผลการตรวจสอบ<br>✅/❌/หมายเหตุ |
---|---|---|---|
1. ความถูกต้องเชิงตำแหน่ง (Positional Accuracy) | ระบบพิกัดถูกต้องหรือไม่ | เช่น WGS84, UTM | ✅ WGS84 |
ตำแหน่งพิกัดตรงกับสภาพจริงหรือไม่ | ตรวจสอบด้วย GPS/ภาพถ่ายดาวเทียม | ❌ คลาดเคลื่อน 10 ม. | |
มีค่า RMSE ต่ำกว่าเกณฑ์หรือไม่ | เกณฑ์ทั่วไป RMSE < 5 เมตร | ✅ 3.6 ม. | |
2. ความถูกต้องของคุณลักษณะ (Attribute Accuracy) | รหัส/ฟิลด์ตรงกับคำอธิบายหรือไม่ | เช่น LU_CODE = A1 → พื้นที่เกษตรกรรม | ✅ |
มีค่าผิดพลาดหรือไม่สมเหตุผลหรือไม่ | เช่น รายได้ติดลบ, เพศ = “ชายหญิง” | ❌ พบค่าผิด 5 รายการ | |
มีค่าที่หายไป (NULL) หรือไม่ | ตรวจสอบใน Field Calculator | ✅ ไม่มี | |
3. ความสมบูรณ์ของข้อมูล (Completeness) | ข้อมูลมีครบทุกพื้นที่ที่ควรจะมีหรือไม่ | เช่น ขอบเขตตำบลหายไปบางส่วน | ❌ ขาด 2 ตำบล |
ตารางมีข้อมูลทุกฟีเจอร์หรือไม่ | เปรียบเทียบจำนวน record กับ polygon | ✅ ตรงกัน | |
4. ความสม่ำเสมอ (Consistency) | ใช้หน่วยวัดเหมือนกันทุกฟิลด์หรือไม่ | เช่น ความยาว = กม. ตลอด | ✅ |
รูปแบบสะกดคำตรงกันหรือไม่ | เช่น “ป่าไม้” ไม่สะกดเป็น “ป่าไมั” | ✅ | |
5. ความเป็นปัจจุบัน (Temporal Accuracy) | ข้อมูลจัดเก็บเมื่อใด | ควรมี Metadata ชัดเจน | ✅ ปี 2023 |
ข้อมูลยังสอดคล้องกับสถานการณ์ปัจจุบันหรือไม่ | เช่น แนวเขตใหม่ล่าสุด | ❌ ล้าสมัย 2 ปี | |
6. ความสามารถในการบูรณาการ (Interoperability) | ไฟล์อยู่ในรูปแบบที่ใช้งานได้ | เช่น .shp, .geojson, .csv | ✅ |
ระบบพิกัดของข้อมูลชุดต่าง ๆ สอดคล้องกันหรือไม่ | ทุกชั้นใช้ EPSG:4326 | ✅ |
🧠 คำแนะนำในการใช้งาน
- ใช้ตารางนี้ก่อนการ นำเข้าข้อมูลเข้าสู่ระบบ GIS เช่น QGIS, ArcGIS, PostGIS
- สำหรับข้อมูลจากหน่วยงานรัฐ/เอกชน ให้เพิ่มช่อง “แหล่งที่มา” และ “สิทธิการใช้งาน”
- ควรบันทึกผลการตรวจสอบไว้เป็น ส่วนหนึ่งของ Metadata หรือรายงานคุณภาพข้อมูล (Data Quality Report)
📌 ประโยชน์ของการใช้ตารางนี้
- ช่วย ป้องกันปัญหาการวิเคราะห์ผิดพลาด จากข้อมูลไม่สมบูรณ์
- สนับสนุนการจัดการ ฐานข้อมูลเชิงระบบ และสามารถตรวจสอบย้อนกลับได้
- เหมาะสำหรับงาน วิจัย, งานราชการ, และ การพัฒนาแผนที่ออนไลน์
📄 แบบฟอร์ม Metadata สำหรับชุดข้อมูล GIS
(GIS Data Metadata Template)
1. ข้อมูลทั่วไปของชุดข้อมูล (Identification Information)
หัวข้อ | รายละเอียด |
---|---|
ชื่อชุดข้อมูล (Dataset Title) | เช่น: ข้อมูลการใช้ประโยชน์ที่ดินระดับหมู่บ้าน ปี 2567 |
คำอธิบาย (Description/Abstract) | สรุปเนื้อหาของชุดข้อมูลโดยย่อ เช่น ประเภทการใช้ที่ดินตามรหัส LUC |
ประเภทข้อมูล (Data Type) | Vector / Raster / Tabular / Imagery |
รูปแบบข้อมูล (Data Format) | .shp / .geojson / .kml / .tif / .csv |
คำสำคัญ (Keywords) | ที่ดิน, การวางแผน, ตำบล, ป่าไม้, พื้นที่เกษตรกรรม |
2. แหล่งที่มาของข้อมูล (Data Source and Origin)
หัวข้อ | รายละเอียด |
---|---|
หน่วยงานเจ้าของข้อมูล (Data Owner/Agency) | เช่น กรมที่ดิน, สำนักงานสถิติแห่งชาติ |
ผู้จัดทำหรือรวบรวมข้อมูล (Data Creator/Author) | ชื่อหน่วยงานหรือบุคคลที่รวบรวม |
แหล่งข้อมูลเดิม (Original Source) | แผนที่ 1:50000 กรมแผนที่ทหาร / Remote Sensing: LANDSAT |
วันที่จัดทำข้อมูล (Date of Creation) | วันที่เก็บหรือสร้างข้อมูลครั้งแรก |
วันที่ปรับปรุงล่าสุด (Date Updated) | วันที่มีการปรับปรุงล่าสุด |
สิทธิการใช้งาน (Usage Rights / License) | Open data / CC-BY / Internal Use Only / ห้ามเผยแพร่ |
3. ขอบเขตเชิงพื้นที่ (Spatial Extent and Projection)
หัวข้อ | รายละเอียด |
---|---|
ขอบเขตภูมิศาสตร์ (Geographic Coverage) | จังหวัดลำพูน / อำเภอเมือง / ตำบลศรีบัวบาน |
ระบบพิกัดภูมิศาสตร์ (Coordinate System) | WGS 84 / UTM Zone 47N / EPSG:4326 |
ขอบเขตละติจูด-ลองจิจูด (Bounding Coordinates) | N: 18.025°, S: 17.900°, E: 99.100°, W: 98.750° |
หน่วยของระยะทาง (Unit of Measurement) | เมตร / กิโลเมตร / องศา |
4. คุณลักษณะของข้อมูล (Attribute Information)
หัวข้อ | รายละเอียด |
---|---|
ชื่อฟิลด์ | รหัสพื้นที่ (TAMBON_ID ), ประเภทที่ดิน (LU_CODE ) |
ประเภทข้อมูล (Data Type) | Text / Integer / Float |
คำอธิบายฟิลด์ | LU_CODE = A1: เกษตรกรรม, A2: ป่าไม้ ฯลฯ |
ค่าที่เป็นไปได้ (Valid Values / Domains) | [A1, A2, U1, F1, I1] เป็นต้น |
5. คุณภาพของข้อมูล (Data Quality and Lineage)
หัวข้อ | รายละเอียด |
---|---|
วิธีการจัดเก็บ (Data Collection Method) | การสำรวจภาคสนาม, การแปลภาพถ่ายดาวเทียม |
ระดับความถูกต้องตำแหน่ง (Positional Accuracy) | RMSE = 3.25 เมตร / ค่าเฉลี่ย GPS ±5 ม. |
ความครบถ้วน (Completeness) | ครอบคลุมพื้นที่ทั้ง 4 อำเภอ / ข้อมูลปี 2565 ขาด 2 หมู่บ้าน |
การตรวจสอบคุณภาพ (Quality Control) | ตรวจสอบโดยเจ้าหน้าที่ GIS, สุ่มตรวจ 10% |
ปัญหา/ข้อจำกัด (Limitations) | ไม่มีข้อมูลจากพื้นที่ป่าในเขตอนุรักษ์ เนื่องจากไม่มีการเข้าถึง |
6. ข้อมูลติดต่อผู้ดูแล (Contact Information)
หัวข้อ | รายละเอียด |
---|---|
ชื่อผู้รับผิดชอบ | ผศ.ดร.สุเพชร ตรีเดช |
หน่วยงาน | คณะวิทยาศาสตร์ มหาวิทยาลัยธรรมศาสตร์ |
อีเมล / โทรศัพท์ | supetgis2me@gmail.com / 0-1234-5678 |
URL เว็บไซต์ (ถ้ามี) | https://www.thammasat.ac.th |
📌 คำแนะนำเพิ่มเติม
- ควรบันทึก Metadata ควบคู่กับทุกชุดข้อมูล โดยเฉพาะข้อมูลที่เผยแพร่หรือใช้งานในโครงการระยะยาว
- หากใช้ในระบบฐานข้อมูลกลาง ควรจัดเก็บเป็น ISO XML Metadata Format หรือ CSV Metadata Summary
- โปรแกรมที่สามารถสร้าง Metadata โดยอัตโนมัติ เช่น ArcCatalog (ใน ArcGIS), QGIS Metadata Editor
🧭 คู่มือการประเมินข้อมูลก่อนใช้งานใน QGIS / ArcGIS
ขั้นตอนที่ 1: ตรวจสอบโครงสร้างข้อมูลเบื้องต้น
✅ ใน QGIS:
- เปิดไฟล์ด้วย
Layer > Add Layer > Add Vector Layer
- คลิกขวาที่ชั้นข้อมูล →
Properties > Information
- ตรวจสอบ CRS (Coordinate Reference System) เช่น
EPSG:4326
- ดูจำนวนฟีเจอร์ / Geometry type (Point, Line, Polygon)
- ตรวจสอบ CRS (Coordinate Reference System) เช่น
- ไปที่แท็บ
Fields
→ ตรวจสอบประเภทข้อมูลของแต่ละฟิลด์
✅ ใน ArcGIS:
- เปิดไฟล์ผ่าน ArcMap หรือ ArcGIS Pro
- คลิกขวาที่ชั้นข้อมูล →
Properties > Source
- ตรวจสอบระบบพิกัด, ชนิดข้อมูล
- เปิด
Attribute Table
→ ตรวจสอบฟิลด์, NULL, ค่าผิดปกติ
ขั้นตอนที่ 2: ตรวจสอบความถูกต้องเชิงตำแหน่ง (Positional Accuracy)
วิธีตรวจสอบ:
- ใช้ พื้นหลังเป็นแผนที่ฐาน (Basemap) เช่น Google Satellite, OSM
- ซูมเข้าแต่ละจุดแล้วเปรียบเทียบตำแหน่งกับสภาพจริง
เครื่องมือ:
- QGIS:
XYZ Tiles > Google Satellite
- ArcGIS: Add Basemap → Imagery with Labels
หากเป็นข้อมูลแปลงจากแผนที่สแกน ให้ใช้
Georeferencing
เพื่อตรวจสอบค่าความคลาดเคลื่อน (RMSE)
ขั้นตอนที่ 3: ตรวจสอบความถูกต้องของข้อมูลเชิงคุณลักษณะ
เช็คค่าผิดปกติ (Outlier) หรือ Missing Value:
ใน QGIS:
- เปิด
Attribute Table
- ใช้ฟิลเตอร์ เช่น
"Population" IS NULL
หรือ"Income" < 0
ใน ArcGIS:
- ใช้ Select by Attribute → สร้างเงื่อนไข เช่น
"AGE" < 0
- ใช้ Field Calculator ดูค่า Mean, Min, Max
ตรวจสอบชื่อสะกดซ้ำ / ไม่สอดคล้อง:
- Export ค่าในฟิลด์ออกมา (Unique Values) แล้วตรวจสอบด้วยตา
- ใช้ Group Stats หรือ Data Reviewer ใน ArcGIS Pro
ขั้นตอนที่ 4: ตรวจสอบ Topology (เฉพาะข้อมูลเวกเตอร์)
ใน QGIS:
- เปิดเมนู
Vector > Topology Checker
- กำหนด Rule เช่น:
- Polygon: Must not overlap
- Polygon: Must not have gaps
- Run → ตรวจสอบจุดผิดพลาด (error markers)
ใน ArcGIS:
- สร้าง Topology ด้วย ArcCatalog (สำหรับ Geodatabase)
- กำหนด Rule เช่นเดียวกัน
- ใช้เครื่องมือ Validate Topology → Highlight Error
ขั้นตอนที่ 5: ตรวจสอบความสมบูรณ์ของฟีเจอร์
- ตรวจนับจำนวนชิ้นข้อมูล → ควรเท่ากับจำนวนในตารางต้นฉบับ
- ใช้ “Statistics” เพื่อตรวจสอบความเบี่ยงเบน
- ใช้ “Join” กับตารางอ้างอิง (เช่นตารางรหัสหมู่บ้าน) เพื่อหาข้อมูลตกหล่น
ขั้นตอนที่ 6: ตรวจสอบระบบพิกัดให้ตรงกัน (CRS Consistency)
- ตรวจสอบว่า ทุกชั้นข้อมูลอยู่ใน CRS เดียวกัน
- แนะนำใช้
EPSG:4326 (WGS 84)
หรือUTM Zone 47N/48N
สำหรับประเทศไทย - หากไม่ตรง → ใช้
Reproject Layer
ใน QGIS หรือProject Tool
ใน ArcToolbox
🧠 บทสรุป
การประเมินคุณภาพข้อมูลก่อนใช้งานใน QGIS/ArcGIS ไม่ใช่แค่การตรวจสอบความถูกต้อง แต่คือการ ประกันความน่าเชื่อถือของผลวิเคราะห์เชิงพื้นที่ โดยครอบคลุมทั้งมิติของตำแหน่ง คุณลักษณะ ความสอดคล้อง และความสมบูรณ์
📦 สิ่งที่ควรจัดเตรียมควบคู่
- ✔️ แบบฟอร์ม Metadata ของชุดข้อมูล
- ✔️ Data Quality Checklist สำหรับบันทึกผลการประเมิน
- ✔️ การจัดเก็บเวอร์ชัน (Versioning) เพื่อควบคุมการเปลี่ยนแปลงข้อมูล
๕.๒.๓ ลักษณะของข้อมูล
ข้อมูลทั้งจากแหล่งปฐมภูมิและทุติยภูมิอาจอยู่ในรูปของ:
- ข้อมูลเชิงปริมาณ (Quantitative Data) ซึ่งสามารถวัดและวิเคราะห์ได้โดยใช้ค่าตัวเลข เช่น ปริมาณน้ำฝน ค่า NDVI หรือจำนวนประชากรต่อไร่
ข้อมูลเชิงปริมาณ (Quantitative Data) คือข้อมูลที่แสดง ปริมาณหรือจำนวน และสามารถ วัดค่าหรือคำนวณทางสถิติ ได้อย่างเป็นระบบ โดยอยู่ในรูปของ ตัวเลขที่มีความหมายเชิงการวัด (measurable) ซึ่งทำให้สามารถนำไปวิเคราะห์เชิงเชิงเปรียบเทียบ เชิงสถิติ หรือวิเคราะห์แนวโน้มในระบบสารสนเทศภูมิศาสตร์ (GIS) ได้อย่างมีประสิทธิภาพ
🧮 ลักษณะสำคัญของข้อมูลเชิงปริมาณ
- อยู่ในรูป จำนวนที่ชัดเจน
- สามารถนำไปใช้ในการ คำนวณทางคณิตศาสตร์ (เช่น บวก ลบ คูณ หาร)
- สามารถ สร้างแผนภูมิหรือแผนที่เชิงปริมาณ (Thematic Map) ได้ เช่น Choropleth, Graduated Symbol
- ใช้ในการ วิเคราะห์ความสัมพันธ์ (correlation) และ แบบจำลองเชิงพื้นที่ (spatial modeling)
📊 ตัวอย่างของข้อมูลเชิงปริมาณในระบบ GIS
ประเภท | ตัวอย่างข้อมูล | รายละเอียด |
---|---|---|
ปริมาณทางธรรมชาติ | ปริมาณน้ำฝน (Rainfall) | มิลลิเมตรต่อปี เช่น 1,200 mm/year |
ดัชนีจากภาพถ่ายดาวเทียม | NDVI (Normalized Difference Vegetation Index) | ค่าแสดงความเขียวขจีของพืช อยู่ในช่วง -1 ถึง +1 |
ประชากร | จำนวนประชากรต่อไร่ | เช่น 75 คน/ไร่ ใช้ประเมินความหนาแน่น |
ความสูงภูมิประเทศ | Elevation (DEM) | เมตรจากระดับน้ำทะเล เช่น 435 m |
ปริมาณสารมลพิษ | PM2.5 concentration | หน่วยไมโครกรัมต่อลูกบาศก์เมตร เช่น 47.2 µg/m³ |
รายได้เฉลี่ย | Average income per household | เช่น 12,500 บาท/เดือน |
🗺️ การประยุกต์ใช้ข้อมูลเชิงปริมาณใน GIS
- การสร้าง แผนที่แสดงระดับรายได้, แผนที่ความเสี่ยงน้ำท่วม, หรือ แผนที่ดัชนีพืช (NDVI Map)
- การวิเคราะห์ด้วย Raster Calculator เช่น คำนวณโซนที่ NDVI สูงและอยู่ต่ำกว่าระดับน้ำท่วม
- การใช้ข้อมูลใน การตัดสินใจเชิงพื้นที่ เช่น พื้นที่ใดควรได้รับงบประมาณสนับสนุนตามรายได้เฉลี่ย
✅ บทสรุป
ข้อมูลเชิงปริมาณเป็นรากฐานสำคัญของการวิเคราะห์ในระบบ GIS เนื่องจากสามารถ แสดงแนวโน้มทางพื้นที่, วิเคราะห์ทางสถิติ, และ สร้างแบบจำลองทางภูมิสารสนเทศ ได้อย่างมีประสิทธิภาพ จึงจำเป็นต้องมีความแม่นยำ และสามารถตรวจสอบแหล่งที่มาได้เสมอ
- ข้อมูลเชิงคุณภาพ (Qualitative Data) ซึ่งเน้นการบรรยายคุณลักษณะหรือเงื่อนไข เช่น ประเภทของการใช้ที่ดิน ชนิดของป่าไม้ หรือระดับความเสี่ยงของพื้นที่
ข้อมูลเชิงคุณภาพ (Qualitative Data) ในบริบทของระบบสารสนเทศภูมิศาสตร์ (Geographic Information Systems: GIS) คือข้อมูลที่ ใช้เพื่ออธิบายลักษณะหรือคุณสมบัติ ของสิ่งที่ปรากฏในพื้นที่ ไม่อยู่ในรูปของตัวเลขที่สามารถวัดหรือคำนวณได้โดยตรง แต่มีความสำคัญในการ จำแนกประเภท (categorical classification) และ ตีความบริบทเชิงพื้นที่ ได้อย่างลึกซึ้ง
🧾 ลักษณะสำคัญของข้อมูลเชิงคุณภาพ
- เป็น ข้อมูลที่ไม่ใช่ตัวเลขเชิงปริมาณ แต่เป็นการบรรยาย ลักษณะ สถานะ หรือจำแนกประเภทของวัตถุหรือพื้นที่
- มักถูกบันทึกในรูปของ ข้อความ (Text/String) หรือ รหัสเชิงคำจำกัดความ (Code) เช่น “F1”, “เกษตรกรรม”
- ใช้ในการ แบ่งชั้นข้อมูล (Classification) เช่น จำแนกการใช้ที่ดิน, ประเภทป่า, ระดับความเสี่ยง
- ไม่สามารถนำไปคำนวณโดยตรง แต่สามารถนำไปวิเคราะห์เชิงตรรกะหรือเชิงสถิติในระดับนามธรรม (เช่น cross-tabulation, overlay by category)
🌳 ตัวอย่างของข้อมูลเชิงคุณภาพในระบบ GIS
ชื่อฟิลด์ | ตัวอย่างข้อมูล | คำอธิบาย |
---|---|---|
LU_CODE | A1, U1, F1 | รหัสประเภทการใช้ที่ดิน เช่น A1 = เกษตรกรรม, U1 = เมือง, F1 = ป่าไม้ |
FOREST_TYPE | ป่าดิบชื้น, ป่าสน, ป่าผลัดใบ | ชนิดของป่าไม้ |
RISK_LEVEL | ต่ำ, ปานกลาง, สูง | ระดับความเสี่ยงต่ออุทกภัย |
ZONE_TYPE | เขตเมือง, เขตอุตสาหกรรม, เขตเกษตรกรรม | การแบ่งเขตการใช้ประโยชน์ |
LAND_OWNERSHIP | เอกชน, รัฐ, ส.ป.ก. | ลักษณะสิทธิครอบครองที่ดิน |
🗺️ การประยุกต์ข้อมูลเชิงคุณภาพใน GIS
- ใช้ในการสร้าง แผนที่ประเภท (Category Map) เช่น แผนที่ประเภทการใช้ที่ดิน, แผนที่ชนิดของป่า
- ใช้ในการ วิเคราะห์จำแนกพื้นที่ (Zonal Analysis) เช่น หาพื้นที่ป่าไม้ในเขตที่มีความเสี่ยงไฟป่าสูง
- ใช้ร่วมกับข้อมูลเชิงปริมาณเพื่อ ตีความพื้นที่เชิงนโยบาย เช่น วิเคราะห์รายได้เฉลี่ยของแต่ละประเภทพื้นที่ใช้ที่ดิน
- สนับสนุนการวิเคราะห์ Decision Support เช่น พื้นที่เกษตรที่ตั้งอยู่ในเขต “ความเสี่ยงน้ำท่วมสูง” ควรปรับการใช้พื้นที่หรือไม่
📌 ข้อสังเกตเชิงวิชาการ
ด้าน | ข้อมูลเชิงคุณภาพ |
---|---|
การคำนวณ | ไม่สามารถนำไปใช้คำนวณได้โดยตรง (แต่แปลงเป็นดัชนีได้ เช่น risk level → 1, 2, 3) |
การจัดหมวดหมู่ | เหมาะกับการใช้ในแผนที่เชิงประเภท (Categorical Thematic Map) |
การวิเคราะห์ | ใช้ร่วมกับเงื่อนไขเชิงตรรกะ เช่น "FOREST_TYPE" = 'ป่าดิบชื้น' |
✅ บทสรุป
ข้อมูลเชิงคุณภาพมีบทบาทสำคัญในการ บ่งชี้คุณลักษณะเฉพาะของพื้นที่ ซึ่งไม่สามารถวัดเชิงปริมาณได้ แต่มี นัยเชิงนโยบายและการจัดการพื้นที่ โดยเฉพาะอย่างยิ่งในการ จำแนกประเภทพื้นที่, ระบุเงื่อนไขความเสี่ยง, หรือ กำหนดแนวทางการพัฒนาอย่างเหมาะสม ในเชิงพื้นที่