หนังสืออ้างอิง

หนังสืออ้างอิง ครรชิต มาลัยวงศ์ และคณะ. 2527. คอมพิวเตอร์เบื้องต้น เล่ม 1. กรุงเทพฯ : เค.เอส. คอมพิวเตอร์.

ครรชิต มาลัยวงศ์. 2544. ความรู้เรื่องสารสนเทศสำหรับนักวิจัย. [ออนไลน์]. เข้าถึงได้จาก: http://stang.li.mahidol.ac.th/text/research.htm

โครงการจัดการทรัพยากรธรรมชาติและสิ่งแวดล้อม-NREM. 2541. คู่มือฝึกอบรมระบบสารสนเทศภูมิศาสตร์ (ArcView 3.0) สำหรับการวางแผนการจัดการทรัพยากรธรรมชาติและสิ่งแวดล้อม. กทม. : โครงการจัดการทรัพยากรธรรมชาติและสิ่งแวดล้อม.

ฝ่ายทรัพยากรธรรมชาติและสิ่งแวดล้อม สถาบันวิจัยเพื่อการพัฒนาประเทศไทย. 2536. โครงการจัดทำแผนหลักการจัดตั้งระบบสารสนเทศภูมิศาสตร์. กรุงเทพฯ : สถาบันวิจัยเพื่อการพัฒนาประเทศไทย.

ศรีสอาด ตั้งประเสริฐ, ผู้แปล. 2537. ระบบสารสนเทศภูมิศาสตร์เพื่อการประเมินค่าทรัพยากรที่ดิน. กรุงเทพฯ : ศูนย์พัฒนาหนังสือ กรมวิชาการ กระทรวงศึกษาธิการ.

ศูนย์รีโมทเซนซิ่งและระบบสารสนเทศภูมิศาสตร์ ภาคใต้ มหาวิทยาลัยสงขลานครินทร์. 2544. เทคโนโลยีรีโมทเซนซิ่งและระบบสารสนเทศภูมิศาสตร์. [ออนไลน์]. เข้าถึงได้จาก: http://www.rs.psu.ac.th/

สมจิตร อาจอินทร์ และงามนิจ อาจอินทร์. 2541. ระบบฐานข้อมูล. พิมพ์ครั้งที่ 3. ขอนแก่น : ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยขอนแก่นขอน.

สุพรรณ กาญจนสุธรรม และคณะ. 2534. ระบบสารสนเทศภูมิศาสตร์เพื่อการวางแผนพัฒนาการเกษตร. กรุงเทพฯ : กระทรวงเกษตรและสหกรณ์.

สุรีย์ บุญญานุพงศ์ และคณะ. 2541. แนวทางการใช้ระบบสารสนเทศภูมิศาสตร์เพื่อการวางแผน. เชียงใหม่ : สถาบันวิจัยสังคม มหาวิทยาลัยเชียงใหม่.

Amir H. Razavi and Valerie Warwick. 2000. ArcView GIS/Avenue programmer’s reference : Class hierarchy quick reference and 100+scripts. Albany, New York : OnWord Press.

Clark Labs. 2000. Idrisi and CartaLinx GIS and Image Processing software. [online]. Available: http://www.clarklabs.org/

Environmental Systems Research Institute. 1994. ArcView : The geographic information system for everyone. Redlands, C.A. : Environmental Systems Research Institute Inc.

Environmental Systems Research Institute. 1995. Understanding GIS. Redlands, C.A. : Environmental Systems Research Institute Inc.

Environmental Systems Research Institute. 2000. ESRI – The GIS Software Leader. [online]. Available: http://www.esri.com/

Environmental Systems Research Institute. 2000. GIS.com–Your Internet Guide to GIS (Geographic Information Systems). [online]. Available: http://www.gis.com/

Intergraph. 2000. World Premier Provider of Mapping and GIS (Geographic Information Systems). [online]. Available: http://www.intergraph.com/gis/

ITC ILWIS. 2000. ILWIS 3.0 – the Remote Sensing and GIS software. [online]. Available: http://www.itc.nl/ilwis/ilwis.html

Michael N. Demers. 1997. Fundamentals of Geographic Information Systems. USA : John Wiley & Sons, inc.

P. C. Muehrcke, and J.O. Muehrcke. 1992. Map Use : Reading, Analysis and Interpretation. 3rd ed., JP Publication, Madison, WI.

PCI Geomatics. 2000. Geomatica Advanced GIS Module ~Using PAMAP GIS Technology. [online]. Available: http://www.pcigeomatics.com/product_ind/prpamap.html

William E. Huxhold. 1995. Managing geographic information system projects. New York : Oxford University Press.

บทที่ 6 : 6.3การซ้อนทับข้อมูล (Overlay Function)

6.3การซ้อนทับข้อมูล (Overlay Function) บทที่ ๖

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS DATA ANALYSIS)

๖.๓ การซ้อนทับข้อมูล (Overlay Function)

� การซ้อนทับข้อมูล เป็นขั้นตอนหนึ่งที่สำคัญและเป็นพื้นฐานทั่วไปในระบบสารสนเทศภูมิศาสตร์ หลักการคือการนำข้อมูลที่มีอยู่เข้ามารวมกันจากแหล่งข้อมูลที่มีอยู่หลากหลาย เพื่อใช้ในการตัดสินใจแก้ปัญหา (Decision Making)

� หลักการ ในการซ้อนทับข้อมูล

– โดยทั่วไปในการซ้อนทับข้อมูลแผนที่จะอาศัยจุดคู่ควบ (x,y) และข้อมูลเชิงบรรยายจะถูกสร้างขึ้นใหม่ หลังจากที่เราทำการ overlay ในระบบสารสนเทศภูมิศาสตร์

– การซ้อนทับข้อมูลอาจจะใช้กระบวนการทางเลขคณิต (arithmetic) (เช่น การบวก, ลบ, คูณ, หาร) หรือตรรกศาสตร์ logical (เช่น AND, OR, XOR, etc.)

� รูปแบบของการซ้อนทับข้อมูลได้แก่ การทำ Buffer, การตัดข้อมูล-Clip, การเชื่อมต่อแผนที่-Merge, การรวมข้อมูล-Dissolve, การขจัดข้อมูล-Eliminate, การลบข้อมูล-Erase, การซ้อนทับข้อมูลแบบ Identity, การซ้อนทับข้อมูลแบบ Intersect, การซ้อนทับข้อมูลแบบ Union, การหาระยะทางระหว่างข้อมูล 2 Theme-Near, การปรับปรุงข้อมูล-Update

๑) แนวระยะห่างด้วย Buffer – Buffers selected features
เป็นการหาระยะทางให้ห่างจากรูปแบบภูมิศาสตร์ (Featues) ที่กำหนด
โดยที่การจัดทำ Buffer เป็นการวิเคราะห์พื้นที่เพียง 1 Theme และเป็นการสร้างพื้นที่ล้อมรอบ Graphic Features (point, line and polygon) ของ 1 theme ที่ได้คัดเลือกไว้บางส่วน หากไม่ได้เลือกจะทำ buffer ทั้ง theme ผลที่ได้รับคือ theme ใหม่ ที่มีขนาดความกว้างของพื้นที่จากตำแหน่งที่เลือก เท่ากับขนาดของ Buffer ที่ได้กำหนดมีหน่วยเป็นเมตร

รูปที่ 6.7 การหาแนวระยะห่างด้วย Buffer

๒) การตัดขอบเขตข้อมูลด้วย Clip – Clips one theme using another
เป็นการตัดข้อมูลแผนที่ออกจาก Theme เป้าหมาย (Theme to be clipped) กับ แผนที่หรือพื้นที่ที่ใช้ตัด เช่น พื้นที่อำเภอเดียว ที่ต้องการใช้เป็นขอบเขตในการตัด (Theme to clip)

รูปที่ 6.8 การตัดขอบเขตข้อมูลด้วย Clip

๓) การหาพื้นที่ซ้อนทับด้วย Union – Overlays two polygon themes
เป็นฟังก์ชั่นทางคณิตศาสตร์ที่เกิดจากการสนใจในพื้นที่ของวัตถุที่ซ้อนกัน มากกว่า 2 พื้นที่ โดยที่เป็นการรวมแผนที่จำนวน 2 พื้นที่ขึ้นไปเข้าด้วยกัน โดยสร้างขึ้นมาเป็นแผนที่ชุดใหม่

รูปที่ 6.9 การหาพื้นที่ซ้อนทับด้วย Union

๔) การหาพื้นที่ซ้อนทับแบบ Intersect – Overlays two themes and preserves only features that intersect
เป็นการซ้อนทับ (Overlay) ข้อมูลระหว่าง theme 2 themes โดย Theme ผลลัพธ์ (Out-Theme) จะอยู่ในทั้งขอบเขตพื้นที่ (map extent) ของทั้ง 2 theme ไม่เกินจากข้อมูลทั้ง 2 Theme ทั้งนี้ in-theme เป็นได้ทั้ง point, line และ polygon ส่วน Intersect-Theme จะต้องเป็น polygon เท่านั้น

รูปที่ 6.10 การหาพื้นที่ซ้อนทับแบบ Intersect

๕) การหาพื้นที่ซ้อนทับข้อมูลแบบ Identity – Overlays two themes and preserves only features that falls within the first themes extent
การซ้อนทับ (Overlay) ข้อมูลเชิงพื้นที่ 2 themes โดยยึดขอบเขตของแผนที่ต้นฉบับ (In-Theme) เป็นหลัก และจะรักษาข้อมูลเชิงคุณลักษณะของทั้ง 2 themes เข้าไว้ด้วยกัน ข้อมูลจากแผนที่ต้นฉบับ (In-Theme) เป็นได้ทั้ง point, line, polygon และ multi-point แต่ identity-theme จะต้องเป็นเฉพาะ polygon theme เท่านั้น
ตัวอย่างเช่น มีข้อมูลสถานีวัดปริมาณน้ำฝน (in-theme) ที่ไม่ทราบว่าตั้งอยู่ในตำบลใด ก็นำข้อมูลตำบล (identity-theme) มาซ้อนทับแบบ identity จะทำให้ข้อมูลใหม่ของสถานีวัดปริมาณน้ำฝนมีข้อมูลว่าอยู่ในตำบลใด

รูปที่ 6.11 การหาพื้นที่ซ้อนทับแบบ Identity

๖) การเชื่อมต่อข้อมูลแผนที่ MapJoin และ Merge
เป็นการรวม Graphic Features จากหลาย theme เข้าเป็น Theme เดียว Mapjoin สามารถดำเนินการทั้งข้อมูลที่เป็น point, line และ polygon เพื่อเป็นการเชื่อมต่อแผนที่ที่มีพิกัดภูมิศาสตร์อยู่ในพื้นที่ใกล้เคียงกัน หรือต่อกัน

รูปที่ 6.12 การเชื่อมต่อข้อมูลแผนที่ MapJoin และ Merge

๗) การรวมขอบเขตข้อมูลด้วย Dissolve – Removes borders between polygon witch share the same values
Dissolve ใช้ฟังก์ชันนี้เพื่อรวมข้อมูลพื้นที่ (polygon) ที่มีคุณสมบัติหรือ attribute เหมือนกันที่อยู่ติดกันเข้าด้วยกัน เพื่อลดความซ้ำซ้อนของ Theme ให้น้อยลง ซึ่งเป็นการเอาเส้นขอบเขตของพื้นที่ที่มีค่าเหมือนกันในหนึ่งหรือหลาย Fields ออกไป

รูปที่ 6.13 การรวมขอบเขตข้อมูลด้วย Dissolve

๘) การลบแล้วรวมข้อมูลด้วยEliminate- Removes the longest border on selected polygons
Eliminate เป็นคำสั่งที่ใช้รวม Polygon ที่ได้ถูกเลือกไว้แล้ว (เช่น Polygon ที่มีขนาดเล็ก) โดยการเรียกค้น (Query) หรือเลือกโดยตรง เข้ากับ Polygon ข้างเคียง ในระยะ snap tolerance ที่กำหนดไว้ โดยการลบเส้นที่ยาวที่สุดของ Polygon ที่ถูกเลือก โดยส่วนใหญ่ใช้ในการลบข้อมูลที่ได้จากการจำแนกประเภทการใช้ที่ดิน ในส่วนของ noise หรือ ส่วนที่มีเนื้อที่น้อย ออกไปแล้วทำการรวมให้เป็นเนื้อที่ส่วนใหญ่ (Dominant)

รูปที่ 6.14 การลบแล้วรวมข้อมูลด้วยEliminate

๙) การลบข้อมูลด้วย Erase Cover – Erases from one theme using another
การลบข้อมูลจากแผนที่ (Graphic feature) จากแผนที่หนึ่ง (in-theme) โดยการใช้อีกแผนที่หนึ่งเป็นกรอบ (The erase-theme) ที่มีพื้นที่ซ้อนทับกัน ซึ่งอาจเป็น Polygon, line, point หรือ multi-point คล้ายกับการ Clip แต่การ Erase cover เป็นการเหลือข้อมูลที่อยู่นอก erase-theme

รูปที่ 6.15 การลบข้อมูลด้วย Erase Cover

๑๐) ระยะทางระหว่างข้อมูลของ 2 Themes ด้วย Near – Calculates distance from features in one theme to the nearest feature in another theme
Near เป็นคำสั่งที่ใช้ในการคำนวณระยะทางจากแต่ละ Feature ใน 1 theme ไปยัง feature ที่ใกล้ที่สุดใน Theme อื่น (ไม่สามารถเลือก Feature เป้าหมายได้) ระยะทางจะถูกบันทึกไว้ใน field ชื่อ called_distance

รูปที่ 6.16 การหาระยะทางระหว่างข้อมูลของ 2 Themes ด้วย Near

๑๑) การปรับแก้ข้อมูลพื้นที่บางส่วน Update
เป็นการแทนที่พื้นที่ใน Theme หนึ่งโดย Theme อื่นๆ โดยการซ้อนทับระหว่าง in-Theme กับ Update-theme (เฉพาะข้อมูลที่เป็นพื้นที่ polygon) out-theme จะประกอบด้วย Field ทั้งหมดของ 2 Theme

รูปที่ 6.17 การปรับแก้ข้อมูลพื้นที่บางส่วน Update

ส่วนในการปฏิบัติใช้งานจริงนั้นเกิดจากการผสมผสานของขั้นตอนต่างๆ ข้างต้น ซึ่งต้องอาศัยประสบการณ์ของผู้ปฏิบัติงานในการทำงานทางด้าน GIS โดยการใช้โปรแกรมต่างๆ ให้เหมาะสมต่อวัตถุประสงค์ของการใช้รูปแบบคำสั่งนั้นๆ ด้วย

บทที่ 6 : 6.2รูปแบบการวิเคราะห์ด้านระบบสารสนเทศภูมิศาสตร์

6.2รูปแบบการวิเคราะห์ด้านระบบสารสนเทศภูมิศาสตร์ บทที่ ๖

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS DATA ANALYSIS)

๖.๓ รูปแบบการวิเคราะห์ด้านระบบสารสนเทศภูมิศาสตร์

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์ที่มีความสามารถในการวิเคราะห์ข้อมูลเชิงพื้นที่ ร่วมกับข้อมูลเชิงคุณลักษณะได้ ทำให้การวิเคราะห์ที่ต้องการจึงมีความซับซ้อน และสามารถนำไปประยุกต์ใช้ได้อย่างเหมาะสม เพื่อตอบสนองความต้องการของผู้ใช้งานได้หลายๆ อย่าง เช่น

�การสอบถามข้อมูลการหาที่ตั้ง (Location) โดยผู้ใช้ฐานข้อมูลสามารถสอบถามได้ว่า “มีอะไรอยู่ที่ไหน? (What is at…?)” เป็นคำถามที่สามารถตอบได้ด้วย GIS ซึ่งหากมีการเตรียมแผนที่ GIS ได้อย่างถูกต้อง ทำให้ผู้สอบถามข้อมูลจากฐานข้อมูลสามารถตอบคำถามได้ว่า จุดที่ตั้งสถานีวัดปริมาณน้ำฝน ตั้งอยู่ที่ตำบล หรืออำเภอ หรือจังหวัดใด หรืออาจจะอยู่ใกล้กับถนนใด เพื่อให้ง่ายต่อการไปถึงจุดที่ต้องการ และสามารถสอบถามรายละเอียดอื่นๆ เพิ่มเติมได้ และทำให้เราทราบถึงพิกัดทางภูมิศาสตร์ได้

�การสอบถามข้อมูลโดยการตั้งเงื่อนไข (Condition) โดยตั้งเงื่อนไขในการสอบถามหรือวิเคราะห์ข้อมูลว่า “สิ่งที่สอบถามนั้นอยู่ที่ไหน? (Where is it?)” พื้นที่ที่ตั้งเงื่อนไขที่ผู้ใช้ต้องการสร้างสถานีวัดปริมาณน้ำฝนเพิ่มเติมในพื้นที่นั้นอยู่บริเวณใดในพื้นที่ศึกษา เช่น ห่างจากแม่น้ำ 500 เมตร ห่างจากถนนไม่เกิน 1000 เมตร และไม่ตั้งอยู่ในพื้นที่การเกษตร เพื่อไม่ให้สูญเสียการใช้ประโยชน์ที่ดินทางด้านการเกษตร เป็นต้น GIS สามารถช่วยค้นหาพื้นที่ที่ตั้งเงื่อนไขไว้และสามารถแสดงผลในรูปแบบแผนที่และข้อมูลเชิงคุณลักษณะได้

�การสอบถามข้อมูลถึงแนวโน้มการเปลี่ยนแปลง (Trends) โดยที่ผู้ใช้ฐานข้อมูล GIS สามารถสอบถามข้อมูลการเปลี่ยนแปลงในฐานข้อมูลที่รวบรวมไว้ว่า “ในช่วงระยะเวลาที่ผ่านมามีอะไรในพื้นที่ศึกษาเปลี่ยนแปลงไปบ้าง? (What has changed since…?) เช่น สภาพการใช้ที่ดินที่เปลี่ยนแปลงไปในระยะ 10 ปี จากพื้นที่เกษตรไปเป็นพื้นที่อุตสาหรรมในปัจจุบันนี้ มีเนื้อที่เท่าไร หรืออยู่บริเวณใดบ้าง ซึ่งสามารถทำให้เห็นแนวโน้มหรือพัฒนาการของพื้นที่ศึกษาหรือชุมชนในพื้นที่ศึกษาได้

�การสอบถามข้อมูลรูปแบบการเปลี่ยนแปลง (Patterns) ในการสอบถามข้อมูลถึงรูปแบบของสิ่งที่ก่อให้เกิดการเปลี่ยนแปลงนี้จะต้องใช้การแสดงแผนที่หรือข้อมูลในรูปแบบความสัมพันธ์ของสิ่งที่ปรากฎบนแผนที่เพื่อตรวจสอบดูว่า “ข้อมูลมีความสัมพันธ์กันในด้านพื้นที่เป็นอย่างไร? (What spatial patterns exist?)” อยากจะหาสาเหตุของการกระจายตัวของอุตสาหกรรมขนาดกลางและขนาดย่อม (SMEs) ในชุมชนชนบท หรือพื้นที่ศึกษา บางแห่งมีการกระจุกตัวของโรงงานอุตสาหกรรม SMEs เป็นจำนวนมาก เมื่อแสดงด้วยแผนที่แล้วพบว่าการกระจายตัวของโรงงานอุตสาหกรรมที่เกิดขึ้นนี้ส่วนใหญ่จะตั้งไปตามเส้นทางคมนาคมทางบกเป็นปัจจัยสำคัญ เพราะวางตัวไปตามแนวถนนหลัก และปัจจัยรองคือแหล่งน้ำเนื่องจากมีน้ำประปา และน้ำบาดาลที่ใช้ในกระบวนการผลิตอย่างพอเพียง และสามารถคาดการณ์ไปได้อีกว่าการกระจายตัวจะไปทิศทางใด

�การสอบถามข้อมูลด้วยการสร้างแบบจำลอง (Modeling) ซึ่งในการจัดทำแบบจำลองสถานการณ์นี้สามารถทำให้ผู้ใช้ฐานข้อมูลซึ่งจะต้องมีความรู้ด้าน GIS มาบ้างสามารถใช้งานได้ในการกำหนดรูปแบบจำลองโดยใช้ฐานข้อมูล และทำให้คาดการณ์ถึงสิ่งที่จะเกิดขึ้นต่อไปหากมีการเปลี่ยนแปลงปัจจัยหรือตัวแปรใดๆ ในฐานข้อมูล (What if…?) เช่น การเตรียมข้อมูลสภาพพื้นที่บริเวณที่ราบลุ่มเชิงเขา ในหมู่บ้านน้ำก้อ จังหวัดเพชรบูรณ์ ผู้จัดเตรียมฐานข้อมูลจะต้องสร้างฐานข้อมูลเส้นชั้นความสูง ข้อมูลชุดดิน และความสามารถในการซึมน้ำ และการระเหยของน้ำในบริเวณพื้นที่ศึกษา สภาพป่าไม้ และปริมาณน้ำฝนโดยเฉลี่ย และคาบของปริมาณน้ำฝนอย่างน้อย 30 ปี เพื่อให้สามารถคาดการณ์ได้อย่างแม่นยำมากขึ้นในเรื่องของปริมาณฝนที่ตก รวมถึงการไหลเข้าของน้ำ และการไหลออกของน้ำจากพื้นที่ศึกษา เพื่อตรวจดูความสมดุลย์ของน้ำที่ชะล้างลงมาสู่พื้นที่ว่าสามารถระบายออกจากพื้นที่ได้ทันเวลาหรือไม่หรือจะต้องท่วมเป็นเวลากี่ชั่วโมงหรือกี่วัน ผู้ใช้จึงสามารถจำลองสถานการณ์ได้ว่าหากฝนตกมาในปริมาณ 1000 มิลลิเมตร จะท่วมหรือไม่บริเวณใดบ้างได้รับผลกระทบ

ในระบบสารสนเทศภูมิศาสตร์อาจจะแบ่งรูปแบบหลักในการวิเคราะห์ข้อมูลได้ 3 รูปแบบคือ

ก) การวิเคราะห์ข้อมูลเชิงพื้นที่ (Analysis of Spatial Data )

ข) การวิเคราะห์ข้อมูลเชิงบรรยาย (Analysis of Attribute Data)

ค) การวิเคราะห์ข้อมูลเชิงพื้นที่ร่วมกับข้อมูลเชิงบรรยาย (Integrated analyses of spatial and attribute data)

๖.๓.๑ การวิเคราะห์ข้อมูลเชิงพื้นที่ (Analysis of the Spatial Data)

ก) การแปลงระบบพิกัดทางภูมิศาสตร์ (Transformation or Projection)

การแปลงระบบพิกัดทางภูมิศาสตร์, มาตราส่วน (เช่น Geographic–lat./log. UTM) เป็นการเปลี่ยนจากระบบพิกัดทางภูมิศาสตร์อย่างระบบหนึ่งไปเป็นอีกระบบหนึ่ง เช่น ระบบพิกัดทางภูมิศาสตร์แบบ Geographic–Lat./Lon. ไปเป็นระบบ UTM

เส้นโครงแผนที่จะมีอยู่หลายประเภท มีคุณสมบัติที่แตกต่างกันออกไป การจะเลือกใช้เส้นโครงแผนที่ประเภทใดนั้น ขึ้นอยู่กับวัตถุประสงค์ของการใช้งาน

แผนที่ส่วนใหญ่ในประเทศไทยจะใช้เส้นโครงแผนที่แบบยูนิเวอร์ซัล ทรานสเวอร์ส เมอร์เคเตอร์ (Universal Transverse Mercator Projection – UTM) ซึ่งสามารถใช้โปรแกรมระบบสารสนเทศภูมิศาสตร์ช่วยในการแปลงระบบพิกัดได้

รูปที่ 6.1 ผลลัพธ์ที่ได้จากการแปลงพิกัดจากระบบ Geographic มาเป็น UTM

ข) การต่อแผนที่ (Mosaic) หรือการเทียบขอบ (Edge-matching)

รูปที่ 6.2 รูปแบบการต่อแผนที่โดยใช้โปรแกรมช่วย

การเชื่อมต่อแผนที่หลายๆ ระวางเข้าด้วยกัน หรือการเชื่อมต่อแผนที่เรื่องเดียวกันแต่มีหลายๆ ระวางหรือหลายแผ่นเข้าด้วยกัน เรียกกระบวนการนี้ว่า Mosaic ส่วน Edge-matching (การเทียบขอบ) เป็นวิธีการปรับตำแหน่งรายละเอียดของแผนที่ 2 ระวางขึ้นไปที่อยู่ต่อเนื่องกัน แต่เชื่อมต่อกันไม่สนิท จึงจำต้องทำการปรับแผนที่เพื่อให้เป็นแผนที่ที่ต่อเนื่องกัน

ค) คำนวณพื้นที่, เส้นรอบวง และระยะทาง

การคำนวณพื้นที่ที่อยู่ในฐานข้อมูล และสามารถวัดพื้นที่เส้นรอบวง ความยาวเส้น และระยะทางของเส้นได้ โดยโปรแกรมระบบสารสนเทศภูมิศาสตร์จะคำนวณได้อัตโนมัติหลังการทำ Topology แล้ว หรือ อาจจะสอบถามผ่านโปรแกรมได้ โดยใช้เครื่องมือหรือคำสั่งในโปรแกรมเพื่อบอกระยะทางและพื้นที่ได้

๖.๓.๒ การวิเคราะห์ข้อมูลเชิงบรรยาย (Analysis of Non-Spatial Data)

ในการประมวลผลข้อมูลในระบบสารสนเทศภูมิศาสตร์ เราจะใช้การแก้ไขข้อมูล ตรวจสอบความถูกต้อง และวิเคราะห์ผล ข้อมูลเชิงบรรยาย ซึ่งกระบวนการนี้ดูคล้ายกับกระบวนการวิเคราะห์ผลในรูปแบบดั้งเดิม ซึ่งอาศัยกระบวนการฐานข้อมูลและสถิติ

ก) การแก้ไขข้อมูลเชิงบรรยาย (Attribute Editing Function) จะสามารถเรียกค้น ตรวจสอบและเปลี่ยนแปลงข้อมูลสามารถเพิ่มหรือลบข้อมูลได้ รวมถึงการเชื่อมต่อตารางและรวมให้เป็นตารางเดียวกันได้

รูปที่ 6.3 การแก้ไขและการเชื่อมความสัมพันธ์ตาราง

ข) การสอบถามข้อมูลเชิงบรรยาย (Attribute Query Function) เป็นการเรียกค้นข้อมูลในฐานข้อมูลที่เกี่ยวข้องกับเงื่อนไขที่ผู้ใช้ตั้งคำถามแล้วสอบถามโดยใช้วิธีการต่างๆ เช่น

*** การเรียกค้นข้อมูลอย่างง่าย เช่น การค้นหาข้อมูลตามลำดับชั้น หรือ polygon ที่เลือก

*** การสอบถามข้อมูลเชิงซ้อน เช่น การค้นหาทางเลือกจากข้อมูลเชิงบรรยายที่มีอยู่จำนวนชุดข้อมูลหนึ่งหรือมากกว่า

*** กระบวนการที่ใช้ในการเรียกค้นข้อมูลที่เชื่อมโยงกัน เช่น กระบวนการ relation-join

รูปที่ 6.4 การสอบถามข้อมูลโดยตั้งเงื่อนไข

ค) กระบวนการทางสถิติ (Attribute Statistic Function) คำนวณค่าทางสถิติจากตารางข้อมูล เช่น mean, standard deviation, minimum, maximum, correlation etc.

-คำนวณค่าทางสถิติสามารถได้ตารางข้อมูลใหม่ และสามารถใช้ร่วมกับการสอบถามข้อมูล (query) และจัดเตรียมรายงานที่สมบูรณ์

รูปที่ 6.5 คำนวณค่าสถิติของข้อมูลเชิงคุณลักษณะ

๖.๓.๓ การวิเคราะห์ข้อมูลเชิงพื้นที่ร่วมกับข้อมูลเชิงบรรยาย (Integrated Analysis of the Spatial and Non-Spatial Data)

การวิเคราะห์ข้อมูลเชิงบรรยายร่วมกับข้อมูลเชิงพื้นที่จะทำให้ ระบบสารสนเทศมีประสิทธิภาพสูงมากขึ้น และระบบสารสนเทศภูมิศาสตร์อาจใช้งานร่วมกับโปรแกรมประยุกต์อื่นๆ ซึ่งจะทำให้การทำงานบนระบบสารสนเทศภูมิศาสตร์มีความสมบูรณ์มากยิ่งขึ้น

ก) การเรียกค้นข้อมูล, การแบ่งกลุ่มข้อมูล และการวัด (Data retrieval, Classification and Measurement)

ในกระบวนการนี้เป็นการทำงานร่วมกันกับข้อมูลเชิงพื้นที่และข้อมูลเชิงบรรยาย คือเมื่อเราทำการเปลี่ยนแปลงหรือดัดแปลงข้อมูลเชิงบรรยายแล้ว ทำให้ตำแหน่งที่ตั้งหรือข้อมูลเชิงพื้นที่จะถูกสร้างขึ้นมาใหม่ด้วย

1) การเรียกค้นข้อมูล (Retrieval)

� การเรียกค้นข้อมูลเกี่ยวข้องกับการค้นหาทางเลือก การดัดแปลงแก้ไข และผลลัพธ์ข้อมูลจะไม่มีการดัดแปลงรูปแบบใดๆ เลย

� การค้นหาข้อมูลมาตรฐาน (Standard Query Language-SQL)

� SQL เป็นมาตรฐานที่ใช้กันในฐานข้อมูลที่เชื่อมโยงกัน และใช้ในด้าน GIS

� การค้นหาทางเลือกจากฐานข้อมูลที่มีอยู่หลายชั้น การใช้ Boolean Logic มักจะใช้เป็นหลักในการทำงานข้อมูลเชิงบรรยาย และข้อมูลเชิงพื้นที่

� การเรียกค้นข้อมูลสามารถเลือกพื้นที่ที่ต้องการ และแสดงผลลัพธ์จากที่สืบค้นข้อมูลจากตารางข้อมูลเชิงบรรยาย ในแต่ละ record หรือผลลัพธ์จากการสอบถามจากแผนที่ที่ถูกเลือกในฐานข้อมูล

� การเรียกค้นข้อมูลแบบซับซ้อน (เช่น ค้นหาตำแหน่งที่ตั้งของบ้านภายในระยะทาง 2 กิโลเมตรจากร้านค้า) เป็นการใช้วิธี Boolean Logic ร่วมกับการซ้อนทับข้อมูล (Overlay)

2) การแบ่งกลุ่มข้อมูล (Classification)

� เป็นกระบวนในการจัดกลุ่มของสิ่งที่มีลักษณะเดียวกัน หรือที่เรียกว่า Classification

� หลังจากที่มีการแบ่งกลุ่มใหม่แล้ว เราจะต้องการรวมแผนที่ที่มีรายละเอียดในส่วนที่แบ่งเหมือนกันให้เป็นชิ้นเดียวกัน เราเรียกกระบวนการนั้นว่า Generalization หรือ Map Dissolve

� กระบวนการแบ่งกลุ่มข้อมูลนี้มักจะใช้ข้อมูลเชิงบรรยายในการทำงานเป็นส่วนใหญ่ เช่นเลือกกลุ่มที่มีการใช้ที่ดินประเภท “ที่รกร้างว่างเปล่า” และต้องห่างจากถนน “มากกว่า 500เมตร” ให้จัดกลุ่มเป็น “เหมาะสมต่อการตั้งโรงงานมากที่สุด” เป็นต้น

� การพิจารณาแผนที่ชุดดิน : เราจะสร้างแผนที่ชุดดินหลักจากชั้นข้อมูล (layer) ซึ่งมีพื้นที่อยู่มากมาย ที่ถูกแบ่งตามลักษณะโดยรวม เราอาจทำการจัดกลุ่มใหม่ (reclassify) และลบขอบเขต (Dissolve) และการรวมข้อมูล (Merge)

1. Reclassify การจัดกลุ่มข้อมูลใหม่ โดยการใช้ข้อมูลเชิงบรรยายอันใดอันหนึ่งหรือหลายอันรวมกัน เช่น การจัดกลุ่มพื้นที่ชุดดินโดยอาศัยชนิดของดินเท่านั้น

2. Dissolve การลบขอบเขตระหว่างพื้นที่ที่เป็นชนิดเดียวกันโดยการลบเส้น (arc) ระหว่างสอง polygon ที่เป็นข้อมูลกลุ่มเดียวกัน หรือข้อมูลเชิงบรรยายที่ถูกจัดกลุ่มให้เป็นกลุ่มเดียวกัน

3. Merge การรวมข้อมูลพื้นที่เข้าด้วยกันให้เป็นพื้นที่ขนาดใหญ่ขึ้นโดยการให้รหัสหรือค่าใหม่ตามลำดับของเส้นซึ่งมีขอบเขตเชื่อมต่อกัน (เช่น การสร้าง topology ใหม่) และให้ค่า ID ใหม่ทุกๆ polygon

รูปที่ 6.6 การรวมข้อมูลเชิงพื้นทีเข้าด้วยกัน

3) การวัด (Measurement)

โดยปกติการวัดมักจะเกี่ยวข้องกับข้อมูลเชิงพื้นที่ แต่การแสดงผลของการวัดสามารถเก็บไว้ในฐานข้อมูลใหม่หรือกลุ่มใหม่ได้

บทที่ 6 : 6.1การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

บทที่ 6 การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

6.1การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์ บทที่ ๖

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS DATA ANALYSIS)

๖.๑ บทนำ

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์ เป็นหลักที่สำคัญอันหนึ่งที่ทำให้ระบบสารสนเทศภูมิศาสตร์แตกต่างจากโปรแกรมอื่นๆ ที่ใช้ในการจัดทำแผนที่เพียงอย่างเดียว หรือจัดทำฐานข้อมูลเพียงอย่างเดียว ซึ่งในระบบสารสนเทศภูมิศาสตร์นั้นจะใช้รายละเอียดข้อมูลทั้งที่เป็นข้อมูลเชิงพื้นที่ (Spatial data) และข้อมูลเชิงบรรยาย (Non-spatial data) มาใช้ในการวิเคราะห์

การวิเคราะห์เชิงพื้นที่ ในระบบสารสนเทศทางภูมิศาสตร์ เป็นวิธีหนึ่งที่เปิดโอกาสให้นักวิเคราะห์ GIS (GIS Analyst) สามารถศึกษาหาความสัมพันธ์ทางพื้นที่ (Spatial Relationship) ของข้อมูลเดิม เพื่อสร้างข้อมูลใหม่ ตามเงื่อนไขต่างๆ เช่น ต้องการทราบว่าพื้นที่ใดที่เหมาะสมต่อการปลูกป่า โดยมีเงื่อนไขว่าต้องเป็นพื้นที่ที่ตั้งอยู่ในเขตป่าอนุรักษ์ หรือพื้นที่ที่มีความสูงชัน และถูกบุกรุกแผ้วถาง เป็นต้น ซึ่งจากตัวอย่างนี้ สังเกตได้ว่านักวิเคราะห์ GIS ต้องศึกษาความสัมพันธ์ของข้อมูลเชิงพื้นที่ 3 ข้อมูล คือ ป่าอนุรักษ์ การใช้ที่ดิน และความลาดชัน ซึ่งจะแตกต่างจากการเรียกค้นข้อมูล (Query) ที่เป็นการเรียกค้นข้อมูลจาก Theme เดียว

ในการวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์นั้น เป็นการนำหลักการหรือวิธีการต่างๆ มาประยุกต์ใช้ในการเปลี่ยนแปลงรูปแบบของข้อมูล หรือค่าของกริดที่มีอยู่ให้สามารถนำไปผสมผสานกับข้อมูลอื่นๆ ในขบวนการของการวิเคราะห์ข้อมูล เพื่อความสะดวกรวดเร็วและความถูกต้องของผลลัพธ์ที่ต้องการได้ดียิ่งขึ้น

รายละเอียดข้อมูลในระบบสารสนเทศภูมิศาสตร์สามารถตอบคำถามที่เกี่ยวข้องกับสถานที่ตั้ง เช่น ที่ไหน? (Where) ในส่วนการวิเคราะห์ข้อมูลระบบสารสนเทศภูมิศาสตร์ (GIS Data Analysis) จะตอบได้ว่า “ทำไมถึงอยู่ที่นั้น” (Why is it there?) ระบบสารสนเทศภูมิศาสตร์ยังสามารถอธิบายในรูปแบบตัวเลข และรวมถึงภาพ จะทำให้สะดวกในการวิเคราะห์แบบจำลอง (model) วิเคราะห์ผลคาดการณ์ทั้งรูปแบบแผนที่และข้อมูลสารสนเทศ

แต่ปัจจัยความสำเร็จของ GIS ไม่ได้อยู่ที่ตัวระบบเอง GIS ไม่ได้ทำงานทุกอย่างได้อย่างถูกต้อง แต่ GIS ต้องอาศัยบุคลากรทางด้าน GIS เป็นสิ่งสำคัญที่ช่วยลดความผิดพลาดในการนำเข้าข้อมูลสู่ฐานข้อมูล และความละเอียดของข้อมูลที่นำเข้าเช่นมาตราส่วนแผนที่ GIS ไม่สามารถตอบคำถามได้เองว่าพื้นที่ที่เลือกนั้นเหมาะสมหรือไม่ แต่ต้องอาศัยบุคลากรหรือผู้เชี่ยวชาญในแต่ละด้านที่จะตอบได้ว่าการวิเคราะห์ข้อมูลในรูปแบบต่างๆ นั้นได้คำตอบถูกต้องตามหลักวิชาการมากน้อยเพียงใด เพราะ GIS ไม่สามารถคิดและมีชีวิตจิตใจเหมือนมนุษย์

๖.๒ รูปแบบของการวิเคราะห์ระบบสารสนเทศภูมิศาสตร์

๖.๒.๑ ระบบสารสนเทศภูมิศาสตร์และระบบสารสนเทศอื่นๆ

ระบบสารสนเทศภูมิศาสตร์มีความแตกต่างจากระบบสารสนเทศอื่นๆ คือ ระบบสารสนเทศภูมิศาสตร์สามารถทำงานและวิเคราะห์ข้อมูลเชิงแผนที่ได้ ในการวิเคราะห์ข้อมูลอาจใช้ข้อมูลเชิงแผนที่ และข้อมูลเชิงบรรยายในระบบฐานข้อมูลของ GIS เพื่อให้ได้คำตอบที่อ้างอิงบนพิกัดภูมิศาสตร์ได้ แต่ในขณะที่ระบบสารสนเทศจะสามารถวิเคราะห์ข้อมูลในฐานข้อมูล ในเชิงสถิติหรืออื่นๆ แต่ไม่สามารถบ่งบอกตำแหน่งพิกัดภูมิศาสตร์ได้

ผลลัพธ์ของการวิเคราะห์ด้วยระบบ GIS สามารถแสดงผลในรูปแบบข้อมูลเชิงพื้นที่ หรือข้อมูลคำอธิบาย และเห็นภาพรวมที่สามารถเชื่อมโยงความสัมพันธ์ของข้อมูล และสามารถอธิบายได้อย่างชัดเจนถึงปรากฎการณ์ที่เกิดขึ้น หรือคำตอบที่ต้องนำไปใช้ในการตัดสินใจ

๖.๒.๒ การวิเคราะห์ด้วย GIS และการวิเคราะห์ข้อมูลแบบดั้งเดิม

การวิเคราะห์ข้อมูล GIS แตกต่างจากทางสถิติ เพราะ GIS สามารถทำงานโดยอาศัยคุณสมบัติทางแผนที่ของข้อมูล และผลลัพธ์ที่สามารถแทนด้วยแผนที่เพื่อการวิเคราะห์ด้วยสายตา (Visual Analysis)

ระบบสารสนเทศภูมิศาสตร์สามารถให้ผลลัพธ์ในรูปแแผนที่โดยใช้ระบบพิกัด โดยใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ให้มีความสัมพันธ์กับข้อมูลเชิงพื้นที่ ระบบสารสนเทศภูมิศาสตร์สามารถนำค่าจากสถิติมาใช้ร่วมกับระบบ GIS ได้และแสดงผลออกมาในรูปแบบแผนที่

การวิเคราะห์เชิงพื้นที่ (spatial analysis) เมื่อเปรียบเทียบกับ “การทำแผนที่” (map) การวิเคราะห์เชิงพื้นที่จะสามารถใช้ข้อมูลที่หลากหลายกว่า เพื่อใช้ในการวิเคราะห์และคาดการณ์อนาคต หรือสร้างผลลัพธ์ในรูปแผนที่ที่เรายังคาดการณ์ไม่ถึง เช่น การใช้แบบจำลอง (model) สามารถช่วยอธิบายและคาดการณ์หลังจากการวิเคราะห์ GIS

การประมวลผลทางสถิติของ GIS โดยส่วนใหญ่จะใช้การเรียกค้นข้อมูลและดัดแปลงข้อมูล เช่น การทำ Buffer และการกระจายตัว หรือ การจัดกระทำกับข้อมูลเชิงบรรยายด้วยคำสั่งตรรกศาาตร์

ระบบสารสนเทศภูมิศาสตร์ จะมีงานหลักคือจะสร้างกลุ่มข้อมูลทางสถิติเชิงพื้นที่ และมีเครื่องมือในการสืบค้นหาความสัมพันธ์เชิงพื้นที่ และสำหรับการทำแบบจำลองเพื่อใช้ทำงานร่วมกันใน GIS

บทที่ 5 : 5.6 การพัฒนาฐานข้อมูลของระบบสารสนเทศทางภูมิศาสตร์

5.6การพัฒนาฐานข้อมูลของระบบสารสนเทศทางภูมิศาสตร์ บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๖ การพัฒนาฐานข้อมูลของระบบสารสนเทศทางภูมิศาสตร์

ในองค์กรที่มีการใช้งานฐานข้อมูลโดยทั่วไป การจะใช้งานฐานข้อมูลได้อย่างมีประสิทธิภาพและตรงกับความต้องการของผู้ใช้นั้น ย่อมจะต้องมาจากการออกแบบฐานข้อมูลที่มีการวางแผนมาเป็นอย่างดี โดยจะต้องมีการพัฒนาระบบฐานข้อมูลตามขั้นตอนที่ถูกต้อง ซึ่งการพัฒนาระบบสารสนเทศ เป็นกระบวนการจัดการข้อมูลดิบให้เป็นสารสนเทศซึ่งอยู่ในรูปแบบที่นำมาใช้ประโยชน์ได้สะดวก โดยมีกระบวนการดังต่อไปนี้

๕.๖.๑ ขั้นตอนการพัฒนาระบบฐานข้อมูล

ในการพัฒนาฐานข้อมูลเพื่อสร้างระบบสารสนเทศ โดยทั่วไปนั้นจะมีวงจรในการพัฒนา ซึ่งเป็นขั้นตอนที่มีการทำงานเป็นลำดับตั้งแต่ต้นจนกระทั่งสามารถสร้างระบบสารสนเทศออกมาได้ และเป็นขั้นตอนที่ผู้พัฒนาระบบซึ่งอาจประกอบด้วยผู้จัดการโครงการ นักวิเคราะห์ระบบ (System Analyst) และผู้ออกแบบฐานข้อมูล (DBA) จะต้องร่วมกันศึกษาและทำความเข้าใจในแต่ละขั้นตอน ซึ่งโดยทั่วไปแล้วขั้นตอนในการพัฒนาระบบจะมีอยู่ด้วยกัน 3 ขั้นตอนดังต่อไปนี้

1) การวิเคราะห์ปัญหา (Problem Analysis)

เป็นขั้นตอนการวิเคราะห์ปัญหาของระบบงานเดิม เมื่อผู้บริหารขององค์กรมีความต้องการที่จะสร้างระบบสารสนเทศขึ้น เนื่องจากความล้าหลังของระบบงานเดิม หรือการไม่มีประสิทธิภาพเพียงพอของระบบงานเดิมที่จะตอบสนองความต้องการในปัจจุบันได้ ตัวอย่างเช่น ระบบงานเดิมไม่สามารถให้ข้อมูลข่าวสารว่าสินค้าใดของบริษัทใดที่มียอดขายสูงที่สุด หรือการจัดกลุ่มลูกค้า เพื่อดูสถิติว่าสินค้าชนิดหนึ่งเป็นที่สนใจในลูกค้ากลุ่มใด เพื่อนำสารสนเทศที่ได้มาใช้ในการวางแผนและการตัดสินใจ

2) การศึกษาความเป็นไปได้ (Feasibility Study)

หลังจากที่ทราบปัญหาของระบบงานเดิมแล้ว ขั้นตอนต่อไปคือการศึกษาความเป็นไปได้ ว่าการสร้างระบบสารสนเทศ หรือการแก้ไขระบบสารสนเทศเดิมมีความเป็นไปได้หรือไม่ ซึ่งจะมีการศึกษาความเป็นไปได้ ในด้านต่างๆ ดังนี้

� ความเป็นไปได้ของเทคโนโลยี (Technological Feasibility)

การศึกษาระบบงานเดิมมีอุปกรณ์ทางด้านฮาร์ดแวร์และซอฟท์แวร์เพียงพอที่จะรองรับสารสนเทศที่จะเกิดขึ้นได้หรือไม่ ถ้าไม่เพียงพอหรือยังไม่มีก็ต้องวิเคราะห์ได้ว่าควรจะมีการจัดซื้อฮาร์ดแวร์และซอฟท์แวร์ประเภทใดเพิ่มเติม หรือถ้ามีอยู่แล้วก็จะต้องวิเคราะห์ถึงความสามารถของฮาร์ดแวร์และซอฟท์แวร์ดังกล่าว ว่ามีความสามารถอยู่ในระดับใด เพียงพอที่จะใช้สร้างระบบสารสนเทศได้หรือไม่ เป็นต้น

� ความเป็นไปได้ทางด้านการปฎิบัติการ (Operation Feasibility)

เป็นการวิเคราะห์ว่าระบบงานเดิมมีบุคลากรที่มีความสามารถหรือมีประสพการณ์ในการพัฒนาและติดตั้งระบบหรือไม่ ถ้าไม่มีจะหาได้หรือไม่ นอกจากนี้ยังต้องพิจารณาด้วยว่าผู้ใช้ระบบมีความคิดเห็นอย่างไรกับการเปลี่ยนแปลงของระบบที่จะเกิดขึ้น

� ความเป็นไปได้ทางเศรษฐศาสตร์ (Economic Feasibility)

เป็นการศึกษาค่าใช้จ่ายต่างๆ ที่จะเกิดขึ้นตั้งแต่เริ่มต้นพัฒนาระบบจะกระทั่งมีการติดตั้งและใช้งานระบบจริง รวมไปถึงค่าใช้จ่ายประจำวันที่จะเกิดขึ้นด้วย นอกจากนี้ยังต้องทำการคาดการณ์ถึงผลประโยชน์ที่จะได้รับ รวมทั้งเวลาที่จะต้องใช้ในการพัฒนาระบบ เพื่อจะนำข้อมูลที่ได้มาสรุปว่าคุ้มค่าหรือไม่ ที่จะมีการเปลี่ยนแปลงระบบเกิดขึ้น ซึ่งในการนี้ผู้บริหารจะเป็นผู้ตัดสินใจเองว่าสมควรจะให้ดำเนินการพัฒนาต่อไปหรือจะยกเลิกโครงการพัฒนาดังกล่าว

3) การพัฒนาระบบสารสนเทศทางภูมิศาสตร์

หลังจากศึกษาความเป็นไปได้ของระบบ และผู้บริหารเห็นสมควรที่จะให้ดำเนินการพัฒนาต่อ ขั้นตอนต่อไปคือการวิเคราะห์ความต้องการของผู้ใช้ (User Requirement) และการศึกษาสถานภาพของระบบสารสนเทศทางภูมิศาสตร์ที่มีใช้อยู่ในปัจจุบัน (Existing System) เพื่อให้เกิดแนวทางในการพัฒนาระบบสารสนเทศทางภูมิศาสตร์ของหน่วยงาน โดยมีกระบวนการดังกล่าวมีขั้นตอนสำคัญดังนี้

� ขอบเขตของฐานข้อมูลที่จะสร้าง

จาการวิเคราะห์ความต้องการของข้อมูลสารสนเทศขององค์กร ผู้ออกแบบต้องทราบว่าระบบฐานข้อมูลที่สร้างขึ้นนั้น จะนำมาใช้ช่วยงานทางด้านใดขององค์กร และมีความสามารถที่จะทำงานเกี่ยวกับอะไรบ้าง ฐานข้อมูลนั้นจะเป็นแบบฐานข้อมูลรวม (Centralized Database) หรือเป็นฐานข้อมูลแบบกระจาย (Distributed Database)

� ความสามารถของโปรแกรมประยุกต์ที่จะสร้างขึ้น

ความสามารถในการทำงานของโปรแกรมประยุกต์ทำงานด้านใดบ้าง เช่น

– การนำเสนอรูปแบบของผลลัพธ์

– รูปแบบการคำนวณ หรือประมวลผลข้อมูลมีขั้นตอนวิธีการอย่างไร

– กฎเกณฑ์ข้อบังคับต่างๆ

– การควบคุมความคงสภาพของข้อมูล

� อุปกรณ์ทางด้านฮาร์ดแวร์และซอฟท์แวร์ที่จะมีการใช้

ความสามารถของฮาร์ดแวร์และซอฟท์แวร์นั้นๆ จะมีราคาสูงขึ้นไปตามลำดับ

� การวางแผนระยะเวลาในการทำงาน

เพื่อให้การดำเนินงานสามารถบรรลุตามระยะเวลาที่ได้ตั้งไว้

๕.๖.๒ แนวทางการพัฒนาระบบสารสนเทศ

หลังจากนั้นก็นำมาพัฒนาระบบสารสนเทศโดยอาศัยแนวทางดังนี้

1. กำหนดวัตถุประสงค์ และกลุ่มผู้ใช้ (Objective Formulation and Users Identification)

2. การศึกษาเบื้องต้น (Preliminary Study) ซึ่งประกอบด้วย การศึกษาความต้องการใช้ระบบสารสนเทศของผู้ใช้ (User Requirement) และการศึกษาสถานภาพของระบบสารสนเทศที่มีใช้อยู่ในปัจจุบัน (Existing System)

3. การวิเคราะห์ระบบ (System Analysis) เป็นการวิเคราะห์เพื่อที่จะหาข้อสรุปเกี่ยวกับโครงสร้างของระบบสารสนเทศที่จะต้องพัฒนาขึ้น

4. การออกแบบระบบ (System Design) เป็นขั้นตอนดำเนินงานเพื่อให้ได้ระบบสารสนเทศตามโครงสร้างที่กำหนด

5. การพัฒนาระบบ (Construction) เป็นการดำเนินการตามขั้นตอนและกระบวนการที่ได้ออกแบบระบบไว้ ซึ่งประกอบด้วย การจัดหาโปรแกรม การทดสอบ และการปรับปรุงโปรแกรม และจัดทำคู่มือใช้งาน

การดำเนินงานเพื่อพัฒนาระบบสารสนเทศทางภูมิศาสตร์ของหน่วยงาน จะต้องทำการศึกษาและเข้าใจถึงภารกิจหลักขององค์กร เพื่อให้ออกแบบระบบให้สอดคล้องกับการดำเนินงาน เพื่อให้เกิดการนำระบบสารสนเทศทางภูมิศาสตร์ไปใช้ได้เกิดประสิทธิผลสูงสุด และสามารถตัดสินใจในการดำเนินงานต่างๆ ได้อย่างมีประสิทธิภาพยิ่งขึ้น

ดังนั้นระบบสารสนเทศทางภูมิศาสตร์ที่ได้พัฒนาขึ้นมาจะสามารถเชื่อมโยงระบบฐานข้อมูลที่แสดงคุณลักษณะต่างๆ ในรูปแบบแผนที่และคำอธิบาย

ในลักษณะการประยุกต์ใช้งานกับการจัดการฐานข้อมูลจริงในปัจจุบัน สำหรับหน่วยงานที่ไม่ใหญ่มากนักเราสามารถจัดเตรียมฐานข้อมูลอย่างง่ายๆ ด้วยโปรแกรมที่เรามีอยู่แล้วจึงจะเรียนรู้ในกระบวนการที่จะนำเข้าไปสัมพันธ์กับ GIS เช่น เราสามารถใช้โปรแกรม Microsoft Excel หรือ Microsoft Access เพื่อใช้ในการเก็บข้อมูลของหน่วยงานของเรา ซึ่งเราสามารถที่จะนำมาใช้ประโยชน์ได้ต่อไปในอนาคต ความยากของการจัดการฐานข้อมูลคือ การออกแบบโครงสร้างฐานข้อมูลว่าจะจัดเก็บอยู่ในลักษณะใด เช่น รูปแบบตาราง เป็นต้น และนอกจากนี้จะต้องมีคู่มือประกอบแฟ้มข้อมูลนั้นๆ ด้วยเพื่อประโยชน์ในการค้นหาข้อมูลในอดีตได้ง่ายขึ้น หากเราจัดทำได้สมบูรณ์ต่อไปเราก็สามารถที่จะเรียกใช้ประโยชน์จากข้อมูลเหล่านั้นได้

บทที่ 5 : 5.5 ส่วนประกอบของ DBMS

5.5ส่วนประกอบของ DBMS บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๕ ส่วนประกอบของ DBMS

ในการใช้ข้อมูลในฐานข้อมูลจะต้องมีการสอบถามหรือค้นหาคำตอบ รวมถึงการเพิ่มและการลบข้อมูล ซึ่งโดยทั่วไปผู้ใช้ไม่จำเป็นต้องทราบวิธีการในการจัดเก็บข้อมูล แต่ผู้ใช้จะต้องศึกษาภาษาที่ใช้ในการค้นหาข้อมูลจากฐานข้อมูล โดยผ่านทางระบบการจัดการฐานข้อมูล (DBMS)

1) ภาษา SQL (Structured Query Language)

เป็นภาษาที่รูปแบบเป็นภาษาอังกฤษ ง่ายต่อการเรียนรู้และการเขียนโปรแกรม ซึ่งเป็นภาษาที่มีอยู่ใน DBMS หลายตัว มีความสามารถใช้นิยามโครงสร้างตารางภายในฐานข้อมูล การจัดการข้อมูล รวมไปถึงการควบคุมสิทธิการใช้งานฐานข้อมูล SQL จะประกอบด้วยภาษา 3 รูปแบบด้วยกัน แต่ละแบบก็จะมีหน้าที่เฉพาะแตกต่างกันไปดังต่อไปนี้

รูปที่ 5.14 โครงสร้างภาษา SQL

2) ภาษาสำหรับนิยามข้อมูล (Data Definition Language – DDL)

เป็นภาษาที่ใช้นิยามโครงสร้างของฐานข้อมูล เพื่อทำการสร้าง เปลี่ยนแปลงหรือยกเลิกโครงสร้างของฐานข้อมูลตามที่ได้ออกแบบไว้ ซึ่งโครงสร้างของฐานข้อมูลนี้จะสามารถเรียกได้อีกอย่างว่า สคีมา (Schema) ดังนั้น DLL จึงเป็นภาษาที่ใช้ในการสร้างสคีมานั่นเอง ตัวอย่างเช่นจะเป็นการกำหนดว่าฐานข้อมูลที่สร้างมีชื่อว่าอะไร มีโครงสร้างที่ประกอบด้วยตารางที่ชื่ออะไรบ้าง แต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง เขตข้อมูลแต่ละตัวมีประเภทของข้อมูลเป็นอะไร มีความกว้างของข้อมูลเท่าใด แต่ละตารางมีการอินเด็กซ์ (INDEX) ช่วยในการค้นหาข้อมูลหรือไม่ ถ้ามีจะใช้เขตข้อมูลใดบ้างที่เป็นคีย์ เป็นต้น

ตัวอย่างของภาษา DDL เช่น

� คำสั่งการสร้าง(CREATE) ได้แก่การสร้างตาราง และการสร้างดัชนี

� คำสั่งเปลี่ยนโครงสร้างตาราง(ALTER)

� คำสั่งยกเลิก(DROP) ได้แก่การยกเลิกโครงสร้างตาราง และการยกเลิกโครงสร้างดัชนี

3) ภาษาสำหรับการจัดการข้อมูล (Data Manipulation Language-DML)

องค์ประกอบของภาษาในรูปแบบที่ 2 ของภาษา SQL ซึ่ง DML เป็นภาษาที่ใช้จัดการข้อมูลภายในตารางของฐานข้อมูล ตัวอย่างของภาษา DML เช่น

� คำสั่งการเรียกค้นระเบียนข้อมูล(SELECT)

� คำสั่งการเพิ่มระเบียนข้อมูล(INSERT)

� คำสั่งการเปลี่ยนแปลงระเบียนข้อมูล(UPDATE)

� คำสั่งลบระเบียนข้อมูล(DELETE)

รูปแบบของภาษาที่เป็น DML นี้จะถูกจัดอยู่ในกลุ่มของภาษาในยุคที่ 4 ที่มีความง่ายต่อการเขียนและการทำความเข้าใจมากกว่าภาษาในยุคที่ 3 เช่น COBOL หรือ C

ดังนั้นจะเห็นว่า DDL จะเป็นภาษาที่ใช้กำหนดโครงสร้างของฐานข้อมูล แต่ DML จะเป็นภาษาที่ใช้จัดการกับข้อมูลที่อยู่ภายในโครงสร้างนั้น

DBMS บางตัวจะมีภาษาการจัดการข้อมูลเป็นของตนเองเช่น dBASE IV, FoxPro, R:BASE ฯลฯ แต่มีการปรับปรุงเพิ่มเติม SQL เข้าไปด้วยในเวอร์ชั่นปัจจุบัน และมีDBMS หลายตัวจะมีภาษาที่เรียกว่า QBE (Query By Example) และ QUEL (Query Language) รวมอยู่ด้วยซึ่งเป็นรูปแบบของภาษาการเรียกค้นข้อมูลได้อย่างง่ายอีกแบบหนึ่ง นอกจากนี้ DBMS หลายตัวอนุญาตให้ซอฟต์แวร์ประยุกต์บางตัวที่เขียนด้วยภาษาในยุคที่ 3 เช่น COBOL สามารถใช้คำสั่งการจัดการข้อมูลที่มีอยู่ใน SQL เขียนร่วมอยู่ในภาษายุคที่ 3 นั้นได้(Embeded SQL) เพื่อให้การเขียนโปรแกรมที่เกี่ยวกับการจัดการข้อมูลทำได้ง่ายขึ้น

4) ภาษาสำหรับการควบคุมข้อมูล (Data Control Language-DCL)

เป็นส่วนของภาษาที่ใช้ควบคุมความถูกต้องของข้อมูล และ ควบคุมความปลอดภัยของข้อมูล ทำการป้องกันการเกิดเหตุการณ์ที่ User หลายคนเรียกใช้ข้อมูลพร้อมกัน โดยจะทำหน้าที่ควบคุมความถูกต้องของการใช้ข้อมูลและทำการลำดับการใช้ข้อมูลของ User แต่ละคน และตรวจสอบสิทธิ์ในการใช้ข้อมูลนั้นๆ
GRANT คือการให้สิทธิในการเข้าถึงข้อมูล
REVOKE คือการยกเลิกสิทธิในการเข้าถึงข้อมูล

บทที่ 5 : 5.4ประเภทโครงสร้างของฐานข้อมูล

5.4ประเภทโครงสร้างของฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๔ ประเภทโครงสร้างของฐานข้อมูล

ข้อมูลในฐานข้อมูลโดยทั่วไปจะถูกสร้างให้มีโครงสร้างที่ง่ายต่อความเข้าใจและการใช้งานของผู้ใช้ โดยทั่วไปแล้วฐานข้อมูลที่มีใช้อยู่ในปัจจุบันจะมีโครงสร้าง 3 แบบด้วยกัน คือ ฐานข้อมูลแบบลำดับขั้น (Hierarchical Database) ฐานข้อมูลแบบเครือข่าย (Network Database) และฐานข้อมูลแบบเชิงสัมพันธ์ (Relational Database)

๕.๕.๑ ฐานข้อมูลแบบลำดับขั้น (Hierarchical Database)

เป็นลักษณะของฐานข้อมูลที่มีความสัมพันธ์ของข้อมูลเป็นแบบหนึ่งต่อหนึ่ง หรือ แบบหนึ่งต่อกลุ่ม แต่จะไม่มีความสัมพันธ์แบบกลุ่มต่อกลุ่มในฐานข้อมูลแบบนี้

ลักษณะโครงสร้างของฐานข้อมูลแบบลำดับขั้นนี้ จะมีลักษณะคล้ายต้นไม้ที่คว่ำหัวลง จึงอาจเรียกโครงสร้างฐานข้อมูลแบบนี้ได้อีกแบบว่าเป็น โครงสร้างแบบต้นไม้ (Tree Structure) โดยจะมีระเบียนที่อยู่แถวบนซึ่งจะเรียกว่าเป็น ระเบียนพ่อแม่ (Parent record) ระเบียนในแถวถัดลงมาจะเรียกว่า ระเบียนลูก (Child record) ซึ่งระเบียนพ่อแม่จะสามารถมีระเบียนลูกได้มากกว่าหนึ่งระเบียน แต่ระเบียนลูกแต่ละระเบียนสามารถมีระเบียนพ่อแม่ได้เพียงหนึ่งระเบียนเท่านั้น

รูปที่ 5.10 ฐานข้อมูลแบบลำดับขั้นในระบบ GIS

รูปที่ 5.11 โครงสร้างฐานข้อมูลแบบลำดับขั้น

การค้นคืนข้อมูลในฐานข้อมูลแบบลำดับขั้น จะต้องทำเป็นลำดับชั้นตามโครงสร้าง คือ

ถ้าต้องการสอบถามข้อมูลโรงงานในแต่ละอำเภอว่ามีตำบลอะไรบ้าง จะต้องสอบถามเป็นลำดับขั้น ซึ่งสามารถสอบถามในครั้งเดียว เนื่องจากเอนติตี้ของตำบล เชื่อมโยงโดยตรงกับเอนติตี้อำเภอนั่นเอง แต่ เมื่อต้องการสอบถามข้อมูลโรงงานในแต่ละอำเภอว่ามีโรงงานอะไรบ้าง จำนวนเท่าไร จะต้องสอบถามเป็นลำดับขั้น ไม่สามารถสอบถามในครั้งเดียว เนื่องจากเอนติตี้ของโรงงานอุตสาหกรรม ไม่ได้เชื่อมโยงโดยตรงกับเอนติตี้อำเภอนั่นเอง ซึ่งทำให้ประสิทธิภาพในการสอบถามข้อมูลลดลง คือ

ขั้นแรก จะต้องสอบถามว่าในอำเภอหนองเสือ (2807) มีตำบลใดบ้าง จากตารางขอบเขตอำเภอ

ขั้นที่สอง สอบถามว่าในตำบลที่เลือกไว้แล้วนั้นมีโรงงานใดอยู่ในตำบลดังกล่าวบ้าง จากตารางตำบลซึ่งเชื่อมโยงกับโรงงานอุตสาหกรรมนั่นเอง

การสอบถามหรือค้นคืนข้อมูลจากฐานข้อมูลแบบลำดับขั้นจึงขาดประสิทธิภาพ หรือลดความรวดเร็วในการสอบถาม เนื่องจากมีเอนติตี้ระหว่างกลาง (Intermediate entity)

๕.๕.๒ ฐานข้อมูลแบบเครือข่าย (Network Database)

ข้อมูลภายในฐานข้อมูลแบบนี้สามารถมีความสัมพันธ์กันแบบใดก็ได้ เช่นอาจเป็นแบบหนึ่งต่อหนึ่ง หนึ่งต่อกลุ่ม หรือกลุ่มต่อกลุ่ม และไม่จำเป็นต้องมีลำดับชั้นที่สูงกว่า ซึ่งจะทำให้การค้นคืนข้อมูลเป็นไปได้โดยง่ายขึ้นกว่าแบบลำดับขั้น

รูปที่ 5.12 แสดงฐานข้อมูลแบบเครือข่าย

๕.๕.๓ ฐานข้อมูลแบบเชิงสัมพันธ์ (Relational Database)

ฐานข้อมูลเชิงสัมพันธ์เป็นฐานข้อมูลที่มีความนิยมใช้กันมากในปัจจุบัน ซึ่งสามารถใช้งานได้กับเครื่องคอมพิวเตอร์ทุกระดับตั้งแต่ไมโครคอมพิวเตอร์ จนกระทั่งถึงเมนเฟรมคอมพิวเตอร์ ฐานข้อมูลแบบนี้จะมีโครงสร้างข้อมูลต่างจากฐานข้อมูลสองแบบแรก กล่าวคือ ข้อมูลจะถูกเก็บอยู่ในรูปแบบของ ตาราง (Table) ซึ่งภายในตารางก็จะแบ่งออกเป็น แถว (Row) และ คอลัมน์ (Column) แต่ละตารางจะมีจำนวนแถวได้หลายแถวและจำนวนคอลัมน์ได้หลายคอลัมน์ แต่ละแถวสามารถเรียกได้อีกอย่างว่า ระเบียนหรือเรคคอร์ด (Record) คอลัมน์ในแต่ละคอลัมน์สามารถเรียกได้ว่า เขตข้อมูลหรือฟิลด์ (Field)

ฐานข้อมูลเชิงสัมพันธ์สามารถค้นคืนรายละเอียดด้วยการเชื่อมตารางต่างๆ ตั้งแต่ 2 ตารางขึ้นไป โดยการใช้คุณลักษณะของ Field ที่เหมือนกันที่อยู่ในทุกๆ ตาราง ซึ่งขั้นตอนหรือการเชื่อมความสัมพันธ์ระหว่างตารางนี้เรียก “การปฏิบัติการเชื่อมความสัมพันธ์” (Join Operation) และจะได้ตารางใหม่ที่ทำการเชื่อมข้อมูลแล้ว ซึ่งทำให้ได้ข้อมูลที่ต้องการได้ ซึ่งการค้นคืนในฐานข้อมูลเชิงสัมพันธ์นี้จะมีประสิทธิภาพอย่างมากเพราะช่วยให้เกิดความหลากหลายในการประยุกต์ใช้งานมากขึ้น

การปฏิบัติการเชื่อมความสัมพันธ์ระหว่างตารางจะจัดเก็บรวบรวมข้อมูลที่มีความเกี่ยวข้องกันให้อยู่ตารางเดียวกัน ซึ่งมีข้อดีคือทำให้สามารถค้นคืนข้อมูลได้ในเวลาอันรวดเร็วกว่าการจัดเก็บไว้ในหลายๆ ตาราง แต่มีข้อเสียคือการที่นำข้อมูลต่างๆ ที่สัมพันธ์กันมาไว้ในตารางเดียวกันก็จะทำให้ปริมาณข้อมูลที่จัดเก็บในตารางก็เพิ่มขึ้นด้วย

รูปที่ 5.13 แสดงฐานข้อมูลแบบเชิงสัมพันธ์

บทที่ 5 : 5.3ความสัมพันธ์ในฐานข้อมูล

5.3ความสัมพันธ์ในฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๓ ความสัมพันธ์ในฐานข้อมูล

ในการจัดเก็บข้อมูลในฐานข้อมูล จะจัดเก็บในรูปแบบตาราง ที่มีความสัมพันธ์กัน ในฐานข้อมูลสามารถสร้างความสัมพันธ์ของตารางได้โดยกำหนดให้ตารางที่มีคุณลักษณะเหมือนกันมาสร้างความสัมพันธ์กัน ปกติในแฟ้มข้อมูลที่จัดเก็บข้อมูลอยู่นั้นจะต้องประกอบด้วยชื่อแฟ้มข้อมูล (Entity) และหัวข้อเรื่อง หรือรายละเอียด (Attribute) เช่น

รูปที่ 5.5 โครงสร้างตารางในแฟ้มข้อมูล

ความสัมพันธ์ระหว่างข้อมูลประชาชนในระดับหมู่บ้าน เป็นความสัมพันธ์ที่ว่าบุคคลนั้นอยู่ในตำบลใด อำเภอใด จังหวัดใด การสร้างความสัมพันธ์นี้จะทำได้โดยการใส่รหัสหมู่บ้าน ซึ่งร่วมกันเป็น คีย์หลัก (Primary Key) ทำให้สืบค้นข้อมูลได้ง่าย และรวดเร็วยิ่งขึ้น

รูปที่ 5.6 โครงสร้างการเชื่อมต่อตารางในแฟ้มข้อมูล

ดังนั้นค่าของรหัสหมู่บ้าน ในระเบียนทะเบียนราษฎร์ระดับหมู่บ้าน จะเป็นตัวกำหนดว่า บุคคลนั้นอยู่ในตำบลใด

ในฐานข้อมูลอาจจะมีความสัมพันธ์อยู่ 3 ประเภทดังนี้

๕.๔.๑ ความสัมพันธ์แบบหนึ่งต่อหนึ่ง (One-to-One Relationship)

เป็นลักษณะความสัมพันธ์ที่มีระเบียนเพียง 1 ระเบียนในแฟ้ม A มีความสัมพันธ์กับระเบียนเพียง 1 ระเบียนในแฟ้ม B และในทางกลับกัน ระเบียนเพียง 1 ระเบียนในแฟ้ม B ก็จะมีความสัมพันธ์กับระเบียนเพียง 1 ระเบียนในแฟ้ม A

ในการประยุกต์ใช้ความสัมพันธ์นี้ เช่น ข้อมูลแผนที่ขอบเขตการปกครองระดับอำเภอ ของจ. ปทุมธานี มีตารางประกอบแผนที่ แสดง 7 อำเภอ แต่ละอำเภอมีรหัสประจำอำเภอ 1 ตัว จะเชื่อมโยงไปยังตารางอธิบายรหัสอำเภอได้เพียง 1 รหัสเท่านั้น ดังรูปประกอบ

รูปที่ 5.7 การประยุกต์ใช้ความสัมพันธ์แบบหนึ่งต่อหนึ่งในระบบ GIS

๕.๔.๒ ความสัมพันธ์แบบหนึ่งต่อกลุ่ม (One-to-Many Relationship)

เป็นลักษณะความสัมพันธ์ที่มีระเบียนเพียง 1 ระเบียนในแฟ้ม A มีความสัมพันธ์กับระเบียนหลายระเบียนในแฟ้ม B และทางกลับกันหลายระเบียนในแฟ้ม B จะมีความสัมพันธ์กับระเบียนเพียง 1 ระเบียนในแฟ้ม A

ในการประยุกต์ใช้ความสัมพันธ์หนึ่งต่อกลุ่มนี้ เช่น ข้อมูลแผนที่ขอบเขตชุดดิน ของจ. ปทุมธานี มีตารางประกอบแผนที่ขอบเขตชุดดินที่มีในจังหวัด ซึ่งบางชุดดินจะมีอยู่หลายๆ แห่งในจังหวัด เช่น 141 มีอยู่ 2 polygon เป็นต้น จะเชื่อมโยงไปยังตารางอธิบายรหัสชุดดินได้เพียง 1 รหัสเท่านั้น ดังรูปประกอบ ในทางกลับกัน ตารางอธิบายชุดดินมีเพียงชุดละ 1 record เท่านั้น จะเชื่อมโยงไปยังตารางของแผนที่ได้หลายรหัส ดังในรูปประกอบ

รูปที่ 5.8 การประยุกต์ใช้ความสัมพันธ์แบบหนึ่งต่อกลุ่มในระบบ GIS

จะพบว่าความสัมพันธ์แบบหนึ่งต่อกลุ่มจะใช้งานกันมากในระบบสารสนเทศทางภูมิศาสตร์ เนื่องจากแผนที่ใดๆ แผนที่หนึ่งที่ประกอบด้วยตารางข้อมูลของแผนที่มักจะมี ข้อมูลบางอย่างซ้ำๆ กันได้ เช่น ประเภทการใช้ที่ดินเป็นที่นา หลายๆ แห่งในตารางข้อมูล เนื่องจากในแผนที่จะแสดงที่นาอยู่หลายแห่งในแผนที่ ซึ่งอาจจะแสดงด้วยรหัสของการใช้ที่ดินเหมือนกัน ซึ่งทุกตัวจะไปเชื่อมโยงกับตารางอธิบายรหัสการใช้ที่ดินตัวเดียวกันนั่นเอง

๕.๔.๓ ความสัมพันธ์แบบกลุ่มต่อกลุ่ม (Many-to-Many Relationship)

เป็นลักษณะความสัมพันธ์ที่แต่ละระเบียนในแฟ้ม A มีความสัมพันธ์กับหลายระเบียนในแฟ้ม B และในทางกลับกันแต่ละระเบียนในแฟ้ม B จะมีความสัมพันธ์กับระเบียนหลายระเบียนในแฟ้ม A

ในการประยุกต์ใช้ความสัมพันธ์กลุ่มต่อกลุ่ม เช่น ข้อมูลแผนที่ขอบเขตการปกครองระดับอำเภอ ของจ. ปทุมธานี มีตารางประกอบแผนที่ซึ่งแสดงถึงรหัสจังหวัด และรหัสอำเภอ ซึ่งทุกอำเภอจะมีรหัสจังหวัดหมายเลขเดียวกันคือ 28 ในฐานข้อมูลตารางอธิบายรหัสตำบลก็มีรหัสอำเภอที่ซ้ำกัน และรหัสจังหวัดที่ซ้ำกันด้วยเช่นกัน ดังนั้นในการเชื่อมโยงข้อมูลนี้ค่อนข้างซับซ้อน ซึ่งยากต่อการทำความเข้าใจ บางครั้งผู้ใช้มักจะเชื่อมความสัมพันธ์ตารางในรูปแบบนี้เพื่อการสอบถามข้อมูลว่ามีตำบลใดบ้างที่อยู่ในอำเภอคลองหลวง (2802) ดังรูปประกอบ ก็จะสามารถได้คำตอบหลายๆ ตำบลที่เชื่อมโยงกันนั้น เช่นเดียวกันแต่ละตำบลก็มีรหัสจังหวัดที่สามารถเชื่อมโยงด้วยรหัสจังหวัดซึ่งมีอยู่ในตารางแผนที่หลาย record

รูปที่ 5.9 การประยุกต์ใช้ความสัมพันธ์แบบกลุ่มต่อกลุ่มในระบบ GIS

บทที่ 5 : 5.2หลักการและความหมายฐานข้อมูล

5.2หลักการและความหมายฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๒ หลักการและความหมายฐานข้อมูล

๕.๒.๑ นิยามข้อมูล

ในทางทฤษฎีได้มีการให้ความหมายของคำว่า ข้อมูล (Data) ข่าวสาร(News) ข้อมูลสารสนเทศ (Information) โดยนัยจะมีความหมายที่ต่างกัน

ข้อมูล (Data) หมายถึงข้อเท็จจริงต่างๆ ที่มีอยู่ในโลกนี้ใช้แทนด้วยตัวเลข ภาษา หรือสัญลักษณ์ที่ยังไม่มีการปรุงแต่งหรือประมวลผลใดๆ อาจจะแบ่งข้อมูลได้เป็น 3 ประเภท คือ

1. ข้อเท็จจริงที่เป็นจำนวน ปริมาณ ระยะทาง

2. ข้อเท็จจริงที่ไม่เป็นตัวเลข เช่น ชื่อ ที่อยู่ สถานภาพ ประวัติการศึกษา

3. ข่าวสารที่ยังไม่ได้ประเมิน เช่น รายงาน บันทึก คำสั่ง ระเบียบ กฎหมาย และเหตุการณ์หรือสถานการณ์ต่างๆ

แหล่งข้อมูลที่จะได้มานั้น หรือแหล่งต้นตอของข้อมูลเรียกว่า แหล่งปฐมภูมิ (Primary Source) เช่นการไปเก็บรวบรวมข้อมูลจำนวนประชากรวัยทำงานในจังหวัดลพบุรี ส่วนแหล่งข้อมูลที่ผู้อื่นรวบรวมไว้แล้วเรียกว่า แหล่งทุติยภูมิ (Secondary source) เช่น การไปเก็บข้อมูลจำนวนครัวเรือนในเขตเทศบาลจากอำเภอที่ได้รวบรวมไว้แล้วว่าทั้งหมู่บ้านหรือตำบลมีกี่ครัวเรือน เป็นต้น ลักษณะของข้อมูลที่เก็บมาทั้งจากแหล่งปฐมภูมิและทุติยภูมิ อาจเป็นได้ทั้งข้อมูลเชิงปริมาณและข้อมูลเชิงคุณภาพ

๕.๒.๒ นิยามข้อมูลสารสนเทศ

ข้อมูลสารสนเทศ (information) อาจจะเป็นอะไรก็ได้ที่เชื่อว่าเป็นระบบที่สำคัญต่อการให้ความสะดวกต่อองค์กร หรืออาจจะกล่าวได้ว่า มันเป็นสิ่งจำเป็นอย่างยิ่งต่อกระบวนการตัดสินใจที่เกี่ยวข้องกับการจัดการกับเรื่องต่างๆ ในองค์กร

ข้อมูลสารสนเทศ (Information) หมายถึง ข้อมูลที่ได้ถูกกระทำให้มีความสัมพันธ์หรือมีความหมายนำไปใช้ประโยชน์ได้ตามวัตถุประสงค์ของผู้ใช้งานหรือหน่วยงาน

รูปที่ 5.1 หลักการของข้อมูลสารสนเทศ

ข้อมูลสารสนเทศจึงเป็นการนำข้อมูลที่รวบรวมได้จากการสำรวจพื้นที่หรือการสัมภาษณ์ชุมชน แล้วนำข้อมูลที่ได้นำมาผ่านการเปลี่ยนแปลงโดยการนำข้อมูลตั้งแต่ 2 ตัวขึ้นไปที่มีความเกี่ยวข้องกันมาจัดกระทำหรือประมวลผล เพื่อให้มีความหมายหรือมีคุณค่าเพิ่มขึ้นตามวัตถุประสงค์การใช้ เช่น เมื่อมีความต้องการรู้ว่า จำนวนโรงพยาบาลหรือสถานพยาบาลในชนบท 1 แห่ง จะต้องรองรับจำนวนประชาชนในบริเวณที่ใกล้เคียงจำนวนเฉลี่ยกี่คน ฉะนั้นการจะมีข้อมูลสารสนเทศได้นั้น จะต้องมีข้อมูลดิบก่อน และข้อมูลกับข้อมูลสารสนเทศจะมีความเกี่ยวข้องกัน มีความสำคัญและใช้ประโยชน์ด้วยกัน

ฉะนั้นข้อมูลที่มีความเหมายเกี่ยวเนื่องเชื่อมโยงหรือตอบสนองกับเป้าหมายหรือวัตถุประสงค์อะไรบางอย่างก็สามารถเรียกได้ว่าข้อมูลสารสนเทศ (information) เช่น มีข้อมูล (Data) ว่าด้วยปริมาณรถยนต์ที่สี่แยกไฟแดงหนึ่งอยู่ 2,000 ข้อมูล อย่างนี้ก็เป็นเพียงข้อมูลธรรมดาๆ แต่ถ้าข้อมูลนี้เชื่อมโยงเกี่ยวข้องกับเวลาต่างๆ เช่น 9:00 มีปริมาณรถยนต์ผ่านแยกไฟแดงนาทีละ 12 คัน 9:01 นาทีละ 15 คัน… อย่างนี้ไปทั้งสิ้น 2,000 ชุด เราก็สามารถตั้งโจทย์ว่า ถ้าเป้าหมายเราต้องการแก้ไขปัญหาการจราจรที่สี่แยกนี้ ข้อมูลที่ว่าจะแปรสภาพไปเป็น information

เรามี Information ดังกล่าวอยู่ในมือ ลองมาพิจารณาดูแล้ว ก็จะเกิดความเข้าใจ ชุดข้อมูลนี้ เช่น รถมากช่วงเวลาใด มาจากด้านไหน มีสัดส่วนอย่างไร สิ่งที่เราได้ก็คือ ความเข้าใจในปัญหา เหตุที่เกิดปัญหา ซึ่งถ้าเรามี Information หลายๆ ประเด็น คือมีข้อมูลหลากหลาย และนำมาสัมพันธ์กัน ก็จะทำให้เรายิ่งเข้าใจปัญหามากขึ้น

เมื่อเราเข้าใจถึงปัญหาแล้วสามารถถ่ายทอดให้ตัวเองและผู้อื่นเข้าใจได้อย่างถ่องแท้แล้ว ปัญญาก็จะเกิด พอเกิดปัญญาแตกฉานในปัญหา รู้เหตุที่มาที่ไป ให้ใครต่อใครเข้าใจและรู้แจ้งเท่าทันปัญหานั้น แล้วนำปัญญาไปใช้ในการปฏิบัติต่อ ถ้าทำงานด้วยปัญญา งานก็สัมฤทธิผล มีประสิทธิผล ข้อมูลสารสนเทศก็เหมือนสินค้าคงคลัง คือต้องมีความหลากหลาย และประเภทที่เหมาะสม จัดเก็บและหามาใช้ได้ในสถานที่เหมาะสม ในเวลาและบ่อยครั้งที่ต้องการ สารสนเทศที่มากเกินไปจะทำให้เสียค่าใช้จ่ายมาก สารสนเทศน้อยเกินไปทำให้เกิดความเสียหายต้องมีการป้องกันผู้ที่ไม่มีสิทธิ์ใช้สารสนเทศนั้นได้ และในขณะเดียวกันต้องป้องกันการสูญเสียทางกายภาพ อันเนื่องมาจาก ไฟ น้ำท่วม ไฟฟ้าตกหรือดับ

โดยสรุปแล้วข้อมูลสารสนเทศ (information) มีประโยชน์คือ ทำให้เกิดความรู้, ทำให้เกิดความคิดและความเข้าใจ, ทำให้เห็นสภาพปัญหา/ สภาพการเปลี่ยนแปลงว่าก้าวหน้าหรือตกต่ำ, ทำให้ประเมินค่าได้, ทำให้เกิดความน่าสนใจและเกิดการตื่นตัว, ช่วยในการตัดสินใจได้และสามารถทำนายอนาคตได้, ทำให้เกิดความคิดสร้างสรรค์ และก่อให้เกิดการเปลี่ยนแปลงเจตคติ เมื่อได้รู้ได้เห็นจากสภาพความเป็นจริงจากข้อมูลสารสนเทศเหล่านั้น

ข้อมูลสารสนเทศควรมีลักษณะที่พึงปรารถนาอย่างน้อย 5 ลักษณะดังต่อไปนี้

1. สารสนเทศที่นำเสนอชัดเจน และควรนำเสนอด้วยวิธีที่คุ้นเคยกันอยู่เพื่อให้สามารถเข้าใจได้อย่างรวดเร็ว

2. สารสนเทศนั้นควรทำให้ความเข้าใจสถานการณ์ของงานนั้นได้ละเอียดขึ้น

3. สารสนเทศที่มีคำแนะนำหรือส่วนแนะนำการตัดสินใจควรมีสิ่งช่วยที่ชัดเจนอย่างใดอย่างหนื่งให้ผู้ใช้พิจารณาได้ว่าทำอย่างไร และทำไมจึงจะได้ผล (Results) และคำแนะนำ

4. ความต้องการต่างๆ ด้านสารสนเทศควรอยู่บนพื้นฐานของการระบุความต้องการสารสนเทศสำหรับสถานการณ์นั้นโดยเฉพาะ

5. สารสนเทศและเรื่องราวต่างๆ เกี่ยวกับการควบคุมทางการจัดการที่เสนอโดยกระบวนการสนับสนุนควรเป็นในลักษณะที่ให้ผู้ทำการตัดสินใจเป็นผู้แนะแนว (Guide) กระบวนการวินิจฉัย และการเลือกยิ่งกว่าให้ระบบสนับสนุนคอมพิวเตอร์ทำการแนะแนวกระบวนการดังกล่าว

ข้อมูล (stored Data) จึงเป็นข้อมูลที่เก็บรวบรวมไว้ในระบบคอมพิวเตอร์ และสามารถเรียกใช้งานได้เพื่อใช้ในการประมวลผลเพื่อให้ได้ผลลัพธ์ตอบวัตถุประสงค์ที่ตั้งไว้โดยใช้โปรแกรมประยุกต์ต่างๆ ข้อมูลที่ถูกเก็บรวบรวมไว้ในระบบคอมพิวเตอร์ อาจจะอยู่ในรูปของ

� แฟ้มข้อมูล หรือ ไฟล์ (File) ซึ่งเป็นที่รวบรวมข้อมูลประเภทเดียวกันไว้ด้วยกันเพื่อสะดวกในการจัดเก็บและค้นหาข้อมูล ให้ตรงตามวัตถุประสงค์การใช้งาน

� ฐานข้อมูล (Database) ซึ่งเป็นแนวความคิดที่นำข้อมูลของหน่วยงานทั้งหมดมารวบรวมไว้ที่เดียวกัน เพื่อช่วยลดความซ้ำซ้อนของข้อมูล และทำให้เกิดประสิทธิภาพในการใช้งานสูงสุด

ข้อมูลที่จัดเก็บอยู่นั้นอาจเป็นแฟ้มข้อมูลเพียงแฟ้มเดียว หรือหลายแฟ้ม หรืออยู่ในรูปของฐานข้อมูลซึ่งจะเป็นการรวบรวมแฟ้มข้อมูลตั้งแต่หนึ่งแฟ้มขึ้นไป ที่มีความสัมพันธ์เกี่ยวข้องกันเก็บไว้ในที่เดียวกันในหน่วยเก็บข้อมูลสำรองเช่น จานแม่เหล็กหรือดิสค์ เพื่อให้บุคคลากรจากหลายหน่วยงานสามารถใช้ข้อมูลในฐานข้อมูลนี้ร่วมกันได้

๕.๒.๓ นิยามแฟ้มข้อมูล

แฟ้มข้อมูล (File) เป็นการจัดเก็บและรวบรวมข้อมูลประเภทเดียวกันไว้ด้วยกันเพื่อให้เกิดความสะดวกในการจัดเก็บและเรียกค้น ตามวัตถุประสงค์การใช้งานของหน่วยงาน

การจัดเก็บข้อมูลของหน่วยงานไว้แต่ละหน่วยงานหรือแต่ละแผนก เช่น งานบุคคลก็จะมีแฟ้มเกี่ยวกับบุคลากรขององค์กร งานวิชาการก็จะมีแฟ้มเกี่ยวข้องกับวิชาการที่หน่วยงานเผยแพร่หรือวิจัย เป็นต้น และจะมีโปรแกรมที่เขียนขึ้นมาเพื่อเรียกค้นข้อมูลของหน่วยงานตนเองเพื่อการประมวลผล

หน่วยงานต่างๆ มีการจัดเก็บข้อมูลไว้ในรูปแบบแฟ้มข้อมูล จะมีผลที่เกิดขึ้นคือ ความซ้ำซ้อนของข้อมูล (Data Redundancy) เช่น ทะเบียนรายชื่อบุคลากรขององค์กรก็จะมีปรากฎอยู่เกือบทุกหน่วยงานซึ่งมีแฟ้มบุคลากรเป็นของตนเอง ทำให้เกิดความซ้ำซ้อน ส่งผลให้เกิดความสิ้นเปลืองเนื้อที่ในการจัดเก็บข้อมูลเหล่านี้ และยังส่งผลให้การแก้ไขหรือปรับปรุงข้อมูลบุคลากรเป็นไปโดยลำบาก ทำให้แต่ละหน่วยงานจึงอาจมีข้อมูลที่ขัดแย้งกันได้ในอนาคต จึงทำให้เกิดแนวความคิดในการนำแฟ้มข้อมูลของแต่ละหน่วยงานมารวมไว้ในที่เดียวกัน หรือเรียกว่าระบบการประมวลผลฐานข้อมูล (Database)

รูปที่ 5.2 ระบบการประมวลผลแฟ้มข้อมูล

ในการประมวลผลแฟ้มข้อมูลซึ่งในการทำงานจะทำที่เครื่องของผู้ที่ดูแลฐานข้อมูลนั้นจะมีข้อดีคือ

1.ทำให้การประมวลผลข้อมูลทำได้อย่างรวดเร็วไม่ต้องไปพึ่งพาฐานข้อมูลจากส่วนกลาง หรือไม่ต้องรอข้อมูลจากส่วนกลาง

2. ค่าลงทุนในการจัดซื้ออุปกรณ์ก็จะต่ำ และไม่จำเป็นต้องใช้คอมพิวเตอร์ที่มีสมรรถนะสูงก็สามารถประมวลผลข้อมูลได้ และในปัจจุบันเครื่องคอมพิวเตอร์มีสมรรถนะสูงขึ้นและราคาถูกลงซึ่งทำให้สามารถทำงานได้ง่าย

3. โปรแกรมประยุกต์แต่ละโปรแกรมสามารถควบคุมการใช้ข้อมูลในแฟ้มข้อมูลของตนเองได้ โดยไม่ต้องไปพึ่งพาโปรแกรมจากส่วนกลาง ทำให้การทำงานเร็วขึ้น

แต่ไม่ใช่ว่าในการประมวลผลแฟ้มข้อมูลจะมีข้อดีเสมอไป ข้อเสียที่เกิดขึ้นสำหรับระบบการประมวลผลแฟ้มข้อมูลคือ

1. มีความซ้ำซ้อนของข้อมูล (Redundancy) การเก็บรวบรวมข้อมูลประเภทเดียวกันไว้ในการทำงาน เช่นมีการรวบรวมข้อมูลที่ซ้ำซ้อนกัน จากรูปที่ 5.2 มีการเก็บรวบรวมข้อมูลอาคารเรียน และห้องเรียนซ้ำซ้อนกัน ทำให้เสียเนื้อที่ในอุปกรณ์สำรองข้อมูลไปเก็บข้อมูลที่สามารถใช้งานร่วมกันได้ไว้ในคอมพิวเตอร์ทั้ง 2 เครื่อง บางครั้งในการลงทุนเพื่อเก็บข้อมูลก็ทำให้ลงทุนในงบประมาณที่ซ้ำซ้อนได้เพื่อจัดเก็บข้อมูลประเภทเดียวกัน เนื่องจากไม่ทราบว่าอีกหน่วยงานหนึ่งนั้นมีฐานข้อมูลใดบ้าง

2. ความขัดแย้งของข้อมูล (Inconsistency) เมื่อมีการจัดเก็บข้อมูลแยกหน่วยงานกัน ในเรื่องเดียวกันนั้นย่อมมีโอกาสที่ฐานข้อมูลเกิดความขัดแย้งกันได้ เช่น การเปลี่ยนแปลงชื่ออาคารเรียน หรือการเปลี่ยนแปลงชื่อห้องหรือหมายเลขห้อง แม้กระทั่งการให้รหัส (Code) ของห้องเรียนหรืออาคารเรียน ไม่มีมาตราฐาน ทำให้ไม่สามารถนำข้อมูลมาใช้ร่วมกันได้ หรืออาจจะยุ่งยากหากจะเปลี่ยนแปลงระบบให้ใช้งานฐานข้อมูลร่วมกันได้

3. ความยุ่งยากในการประมวลผลข้อมูลในแฟ้มข้อมูลหลายแฟ้มข้อมูล ในการสร้างผลรายงานของรหัสของแผนที่อาคารเรียนหรือห้องเรียน ต้องมีการเขียนโปรแกรมประยุกต์เช่นโปรแกรมการใช้ที่ดิน ม.ธ. เพื่อทำการดึงฐานข้อมูลจากแฟ้มข้อมูลอาคารเรียน แฟ้มข้อมูลการใช้ที่ดิน แฟ้มข้อมูลห้องเรียน

4. ไม่มีผู้ควบคุมหรือรับผิดชอบระบบทั้งหมด เนื่องจากผู้ใช้เครื่องคอมพิวเตอร์เครื่องใดก็ต้องดูแลเครื่องรับผิดชอบเครื่องที่ตนเองใช้งาน จะไม่มีการใช้ข้อมูลหรือทรัพยากรร่วมกันแต่อย่างใด

5. ความขึ้นต่อกัน (Dependency) ระหว่างโปรแกรมประยุกต์และโครงสร้างของแฟ้มข้อมูล เนื่องจากการจัดเก็บข้อมูลในระบบการประมวลผลแฟ้มข้อมูลนั้นจะมีโครงสร้างของแฟ้มข้อมูลในรูปแบบของโปรแกรมประยุกต์ที่เครื่องคอมพิวเตอร์ชุดนั้นใช้งาน เช่น ถ้ามีการเขียนโปรแกรมประยุกต์ด้วยการสร้างฐานข้อมูลจาก Microsoft Access โครงสร้างหรือแฟ้มข้อมูลที่จะใช้ ตัวอย่างเช่นชื่อเขตข้อมูล (Field) ต่างๆ ขนาดของเขตข้อมูล หรือชนิดของเขตข้อมูลไม่ตรงกันกับอีกระบบหนึ่ง ทำให้เกิดปัญหาขึ้นได้ในอนาคตที่จะต้องลงทุนในการใช้ข้อมูลร่วมกันในอนาคต ซึ่งเหมือนกับต้องสร้างฐานข้อมูลอีกระบบหนึ่งใหม่หากจะมีการปรับเข้าสู่การประมวลผลฐานข้อมูล

๕.๒.๔ นิยามฐานข้อมูล

การประมวลผลรูปแบบใหม่ได้พัฒนาขึ้นมาเพื่อช่วยลดข้อเสียของการประมวลผลในระบบแฟ้มข้อมูล ซึ่งเรียกว่า การประมวลผลฐานข้อมูล

ฐานข้อมูล (Database) เป็นวิธีการที่จะเก็บข้อมูลที่มีความสัมพันธ์กันไว้ในที่เดียวกันและรวบรวมข้อมูลที่ไม่ซ้ำซ้อนและสามารถใช้ข้อมูลร่วมกันได้อย่างเป็นระบบ ให้สะดวกต่อการเรียกใช้ สามารถแก้ไขได้ง่าย สำหรับผู้ใช้จำนวนมาก และสามารถป้องกันไม่ให้ผู้ไม่มีสิทธิ์ใช้เข้าถึงข้อมูลได้

ในระบบการประมวลผลฐานข้อมูลนั้นมีองค์ประกอบที่เรียกว่า ระบบการจัดการฐานข้อมูล หรือ Database Management System (DBMS) เข้ามาช่วยในการลดข้อบกพร่องของการประมวลผลแฟ้มข้อมูล ช่วยลดความซ้ำซ้อนของข้อมูลและสามารถปรับปรุงฐานข้อมูลให้ทันสมัย ทันสถานการณ์ และมีความถูกต้อง ซึ่งวัตถุประสงค์ที่สำคัญในการจัดทำระบบสารสนเทศหรือฐานข้อมูลนั้น เพื่อสร้าง วิเคราะห์และทำให้ผู้ใช้ที่เหมาะสมได้รับข้อมูลและสารสนเทศที่หลากหลาย จุดเริ่มต้นก็คือการสร้างข้อมูลหรือการหา (Finding) ข้อมูลมาให้ได้ เมื่อได้ข้อมูลมาแล้ว มีขั้นตอนการดำเนินการตามมาดังนี้

1. การจัดเก็บ (Storing) จำเป็นต้องระบุวิธีการต่างๆ ในการจัดเก็บข้อมูล โดยอาศัยเกณฑ์ต่างๆ ที่จำเป็นสำหรับการวิเคราะห์ การเข้าถึง และผู้ที่มีศักยภาพเป็นผู้ใช้

2. การแปลงผัน (Converting) การวิเคราะห์ รูปแบบต่างๆ ที่ใช้งานได้

3. การส่ง (Converying) ปกติแล้วข้อมูลไม่ได้มีประโยชน์แค่ในที่จัดเก็บต้นแหล่งเท่านั้น แต่ต้องส่งถ่ายไปยังผู้ใช้ (คนหนึ่ง หรือหลายคน)

4. การทำซ้ำ (Reproducing) อาจจำเป็นต้องทำซ้ำหลายฉบับ (Copies) ในรูปแบบต่างๆ

5. การจำแนกประเภท (Classifying) การตัดสินใจกำหนดหัวเรื่อง (Headings) ที่ถูกต้องเพื่อจัดเก็บข้อมูลเป็นเรื่องที่สำคัญยิ่ง

6. การสังเคราะห์ (Synthesizing) ต้องใช้ข้อมูลจากหลายแหล่งเพื่อให้มีสารสนเทศพอเพียงสำหรับการตัดสินใจ

7. การจัดกระทำ (Manipulating) ข้อมูลอาจมีความหมายมากขึ้นโดยการจัดกระทำเชิงสถิติ

8. การค้นคืน (Retrieving) การที่ผู้ใช้ที่เหมาะสมสามารถเข้าถึงข้อมูลเมื่อต้องการ เป็นเรื่องสำคัญ

9. การพิจารณาทบทวน (Reviewing) ข้อมูลอะไรที่จำเป็นต้องมีไว้ และมีไว้เป็นเวลานานแค่ไหน? ระบบจัดเก็บและสมรรถภาพในการจัดกระทำสามารถรับมือกับข้อมูลเชิงประวัติศาสตร์จำนวนมากได้หรือไม่ หรือข้อมูลบางอย่างไม่จำเป็นควรทำลาย?

10. การทำลาย (Destroying) การพิจารณาทบทวนว่าข้อมูลใดจำเป็นหรือข้อมูลใดใช้อยู่เป็นประจำอาจบ่งบอกได้ว่าควรขจัดข้อมูลใดออกไป

๕.๒.๕ ระบบการประมวลผลฐานข้อมูล

ในระบบการประมวลผลฐานข้อมูลนี้แฟ้มข้อมูลต่างๆ ที่มีความเกี่ยวข้องกันหรือมีความสัมพันธ์กันจะถูกเก็บอยู่รวมกันในที่ที่เดียว ซึ่งจะช่วยลดความซ้ำซ้อนของข้อมูล ทำให้ข้อมูลมีความถูกต้องและทันสมัยอยู่ตลอด นอกจากนี้โปรแกรมประยุกต์ที่เขียนขึ้นก็จะไม่ขึ้นกับโครงสร้างของแฟ้มข้อมูลอีกด้วย ซึ่งระบบการจัดการฐานข้อมูลนี้จะทำหน้าที่ควบคุมดูแล และเรียกค้นฐานข้อมูลเพื่ออำนวยความสะดวกให้กับผู้ใช้งานให้สามารถใช้ฐานข้อมูลได้อย่างง่าย ระบบการจัดการฐานข้อมูล (DBMS) เป็นระบบการจัดเก็บบันทึกข้อมูลโดยใช้คอมพิวเตอร์ ซึ่งผู้ที่เลือกใช้ระบบมีจุดมุ่งหมายเพื่อทำการบันทึกและรักษาข้อมูล (information) ฐานข้อมูลมีทั้งการรูปแบบการใช้ร่วมกัน (integrated) หรือแบ่งข้อมูลให้ใช้ (shared) ฐานข้อมูลที่หลายๆ หน่วยงานนำมารวมกัน หรือกล่าวได้ว่าเป็นแฟ้มข้อมูลที่แตกต่างกัน คือ ไม่มีการซ้ำซ้อนของข้อมูลที่มีอยู่ในฐานข้อมูลทั้งหมด (การแบ่งข้อมูลใช้ร่วมกันในเวลาเดียวกัน คือ ผู้ใช้หลายๆคนสามารถเข้าสู่ฐานข้อมูลในเวลาเดียวกัน) แต่จะลดการซ้ำซ้อนของข้อมูลที่มีอยู่ทำให้ไม่เปลืองเนื้อที่ในการจัดเก็บ และนอกจากนี้ DBMS จะช่วยในการสร้าง เรียกค้น หรือสืบค้นฐานข้อมูล และปรับปรุงฐานข้อมูล โดยการทำงานนี้จะต้องผ่าน DBMS ทำให้การสร้างฐานข้อมูลหรือการปรับปรุงข้อมูลนั้นมีความสะดวกมากขึ้น โดยผู้ป้อนข้อมูลหรือสร้างฐานข้อมูลนั้นไม่ต้องสนใจรูปแบบการจัดเก็บข้อมูลทางกายภาพ ผู้ป้อนข้อมูลสามารถใช้ผ่าน DBMS ในการบริหารและจัดการฐานข้อมูลได้โดยตรง เช่น การเพิ่ม การลบ การเปลี่ยนแปลงข้อมูลเหล่านั้น

รูปที่ 5.3 ระบบการประมวลผลฐานข้อมูล

DBMS จะช่วยในการสร้าง เรียกใช้ข้อมูล และปรับปรุงฐานข้อมูล โดยจะทำหน้าที่เสมือนตัวกลาง ระหว่างผู้ใช้ และฐานข้อมูลให้สามารถติดต่อกันได้

ให้สังเกตข้อแตกต่างระหว่างระบบการประมวลผลแฟ้มข้อมูลในรูป 5.2 และระบบการประมวลผลฐานข้อมูลในรูป 5.3 จะเห็นว่าแฟ้มข้อมูลต่างๆ ในรูป 5.2 โปรแกรมประยุกต์ที่สร้างขึ้นในระบบการประมวลผลแฟ้มข้อมูล จะมีการอ่านหรือเขียนข้อมูลโดยตรง ในขณะที่โปรแกรมประยุกต์ที่สร้างในระบบการประมวลผลฐานข้อมูลนั้น จะต้องออกคำสั่งผ่าน DBMS ก่อน DBMS จึงจะทำหน้าที่อ่านข้อมูลที่ต้องการแล้วส่งต่อให้กับโปรแกรมประยุกต์อีกทีหนึ่ง

๕.๒.๕.๑ ข้อดีของการประมวลผลข้อมูลในฐานข้อมูล

1. ข้อมูลมีการเก็บอยู่รวมกันและสามารถใช้ข้อมูลร่วมกันได้ ในระบบฐานข้อมูล ข้อมูลทั้งหมดจะถูกเก็บอยู่ในที่เดียวกัน ที่เรียกว่า ฐานข้อมูล โปรแกรมประยุกต์สามารถออกคำสั่งผ่าน DBMS ให้ทำการอ่านข้อมูลจากหลายตารางได้ เช่น จากรูป 5.3

2. ลดความซ้ำซ้อนของข้อมูล ในการประมวลผลฐานข้อมูล ข้อมูลจะมีความซ้ำซ้อนกันน้อยที่สุด เนื่องจากข้อมูลจะถูกเก็บอยู่เพียงที่เดียวในฐานข้อมูล เช่น ข้อมูลขอบเขตการปกครองระดับจังหวัด ข้อมูลระดับอำเภอ ข้อมูลระดับตำบล ซึ่งจะเป็นการประหยัดเนื้อที่การใช้งานหน่วยเก็บข้อมูลสำรอง นอกจากนี้ถ้ามีการเปลี่ยนแปลงหรือปรับปรุงข้อมูลใด ก็จะทำกับข้อมูลเพียงที่เดียวเท่านั้น ดังนั้นจึงเป็นการลดความซ้ำซ้อนของข้อมูลลง ข้อมูลจะมีความถูกต้อง ไม่มีความขัดแย้งของข้อมูลเกิดขึ้น

3. สามารถหลีกเลี่ยงความขัดแย้งกันของข้อมูลที่อาจเกิดขึ้นได้ สืบเนื่องมาจากผลของข้อ 2 คือการลดความซ้ำซ้อนของข้อมูล จะทำให้สามารถลดความขัดแย้งของข้อมูลที่อาจเกิดขึ้นได้ด้วย ตัวอย่างเช่น ฐานข้อมูลระบบทะเบียนราษฎร์ระดับตำบล จังหวัดนครศรีธรรมราช ชื่อของประชาชน จะถูกเก็บอยู่ในตารางรายชื่อประชาชนในระดับหมู่บ้าน เพียงแห่งเดียว ดังนั้นถ้าจะมีการเปลี่ยนแปลงชื่อสกุลประชาชน เช่น การตาย หรือย้ายถิ่น ก็สามารถแก้ไขในตารางรายชื่อประชาชนระดับหมู่บ้านเพียงแห่งเดียว

4. การควบคุมความคงสภาพของข้อมูล ความคงสภาพ (Integrity) หมายถึงความถูกต้อง ความคล้องจอง ความสมเหตุสมผล หรือความเชื่อถือได้ของข้อมูล ซึ่งนอกจากลักษณะของข้อมูลที่ต้องมีความซ้ำซ้อนน้อยที่สุดแล้ว ความคงสภาพของข้อมูลก็มีความสำคัญไม่ยิ่งหย่อนไปกว่ากัน กล่าวคือ ข้อมูลภายในฐานข้อมูลนั้นควรจะต้องมีความถูกต้อง สมเหตุสมผล เช่น อายุของประชากรในระดับหมู่บ้าน ในฐานข้อมูลไม่ควรจะเกิน 200 ปี (ในความเป็นจริงไม่ถึง 150 ปี) ระบบฐานข้อมูลที่ดีต้องมีการป้องกันการบันทึกข้อมูลที่ไม่สมเหตุสมผลนื้ โดย DBMS เป็นตัวควบคุมไม่ให้มีการบันทึกข้อมูลที่ไม่ถูกต้องลงไปเก็บในฐานข้อมูล อีกตัวอย่างหนึ่งของความคงสภาพเช่น ประชาชนคนใดเสียชีวิต ในตารางรายชื่อจะต้องลบรายชื่อบุคคลนั้นออก และจำเป็นจะต้องลบข้อมูลของบุคคลนั้นออกจากตารางทะเบียนราษฎร์ระดับหมู่บ้าน เพื่อทำให้ฐานข้อมูลมีความคงสภาพของข้อมูลเกิดขึ้น

5. การจัดการข้อมูลในฐานข้อมูลจะทำได้ง่าย การจัดการกับข้อมูลไม่ว่าจะเป็นการเรียกใช้ข้อมูล การเพิ่มข้อมูล การแก้ไขข้อมูล หรือการลบข้อมูลของตารางใดภายในฐานข้อมูล จะสามารถทำได้ง่ายโดยการออกคำสั่งผ่านไปยัง DBMS ซึ่ง DBMS จะเป็นตัวจัดการข้อมูลภายในฐานข้อมูลให้เอง

6. ความเป็นอิสระระหว่างโปรแกรมประยุกต์และข้อมูล โปรแกรมประยุกต์ที่เขียนขึ้นจะไม่ขึ้นกับโครงสร้างของตารางข้อมูลที่เปลี่ยนแปลงไป เนื่องจากโครงสร้างของตารางต่างๆ และตัวข้อมูลในแต่ละตารางจะถูกเก็บอยู่ในฐานข้อมูลทั้งหมด โปรแกรมประยุกต์ไม่จำเป็นต้องเก็บโครงสร้างของตารางที่จะใช้ไว้ ซึ่งต่างกับระบบการประมวลผลแฟ้มข้อมูล ดังนั้นการเปลี่ยนแปลงโครงสร้างของตาราง เช่น การเปลี่ยนแปลงขนาดของเขตข้อมูลในตารางใดภายในฐานข้อมูล ก็ไม่จำเป็นต้องไปทำการแก้ไขโปรแกรมประยุกต์ที่มีการเรียกใช้เขตข้อมูลนั้น

7. การมีผู้ควบคุมระบบเพียงคนเดียว ผู้ควบคุมระบบฐานข้อมูลจะเรียกว่า DBA (Database Administrator) ซึ่งจะเป็นผู้ควบคุมและบริหารจัดการระบบฐานข้อมูลทั้งหมด โดยสามารถจัดการกับโครงสร้างฐานข้อมูลได้ เพื่อป้องกันผู้ที่ไม่มีส่วนเกี่ยวข้องกับการใช้งานฐานข้อมูลเข้าไปก่อความเสียหายให้กับระบบฐานข้อมูลได้

๕.๒.๕.๒ ข้อเสียของการประมวลผลข้อมูลในฐานข้อมูล

1. การใช้งานฐานข้อมูลจะเสียค่าใช้จ่ายค่อนข้างสูง เนื่องจาก DBMS มีราคาค่อนข้างแพง นอกจากนี้การใช้ฐานข้อมูล จะต้องใช้เครื่องคอมพิวเตอร์ที่มีประสิทธิภาพค่อนข้างสูง เช่นต้องมีความเร็วสูง และหน่วยเก็บข้อมูลสำรองความจุสูง เป็นต้น

2. การสูญเสียข้อมูลที่อาจเกิดขึ้นได้ เนื่องจากข้อมูลต่างๆ ในฐานข้อมูลจะถูกเก็บอยู่ในที่ที่เดียวกัน ถ้าดิสค์ที่เก็บฐานข้อมูลนั้นเกิดมีปัญหา อาจทำให้ต้องสูญเสียข้อมูลทั้งหมดในฐานข้อมูลได้ ในขณะที่ระบบแฟ้มข้อมูล จะสามารถเก็บแฟ้มข้อมูลต่างๆ แยกกันอยู่ในดิสค์หลายๆ ตัวได้ ถ้าดิสค์ตัวใดมีปัญหา ตัวอื่นก็ยังคงทำงานได้อยู่ ดังนั้นวิธีการป้องกันโดยต้องมีการสำรองข้อมูลทั้งหมดจากดิสค์ขึ้นเก็บไว้ในเทปแม่เหล็กทุกสิ้นเดือน หรือสัปดาห์ และเก็บไว้ในที่ที่ปลอดภัย

3. ความซับซ้อน ฐานข้อมูลจะมีการจัดเก็บซับซ้อนกว่าในรูปแบบแฟ้มข้อมูล ซึ่งระบบที่มีความซับซ้อนมากเท่าใด โอกาสที่จะเกิดความผิดพลาดของข้อมูลมีมากขึ้นเท่านั้น

ระบบการประมวลผลฐานข้อมูลเป็นระบบที่สามารถแก้ไขข้อบกพร่องของระบบการประมวลผลแบบแฟ้มข้อมูลได้ ดังนั้นในปัจจุบันนี้มีหลายหน่วยงานได้หันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก บางหน่วยงานถึงกับมีการเปลี่ยนแปลงระบบการทำงานจากระบบเดิมคือระบบการประมวลผลแฟ้มข้อมูลมาเป็นระบบการประมวลผลฐานข้อมูล

๕.๒.๖ องค์ประกอบทางด้านข้อมูล

เป็นองค์ประกอบที่สำคัญอีกองค์ประกอบหนึ่งที่จำเป็นต้องมีในระบบฐานข้อมูล ตัวอย่างของข้อมูล เช่น รหัสของจังหวัดที่เก็บอยู่ในจังหวัด ซึ่งประกอบด้วยเขตข้อมูลรหัสจังหวัด อำเภอ ตำบล และระดับหมู่บ้าน เป็นต้น ข้อมูลที่เก็บอยู่ในฐานข้อมูลควรมีคุณสมบัติดังต่อไปนี้

1) มีความถูกต้อง ทันสมัย สมเหตุสมผล เช่น ถ้ามีการเก็บข้อมูลเพศของประชาชนในพื้นที่ ควรมีข้อมูลเพศชายเป็น 1 (Male) และข้อมูลเพศหญิงเป็น 0 (Female) เป็นต้น

2) มีความซ้ำซ้อนของข้อมูลน้อยที่สุด เนื่องจากข้อมูลในฐานข้อมูลสามารถประกอบด้วยตารางตั้งแต่หนึ่งตารางขึ้นไปที่มีความสัมพันธ์กัน ข้อมูลในแต่ละตารางจะต้องมีความซ้ำซ้อนของข้อมูลน้อยที่สุด หรือไม่มีเลย

3) มีการแบ่งกันใช้งานข้อมูล ข้อมูลภายในฐานข้อมูลควรมีลักษณะที่สามารถให้ผู้ใช้งานหลายคนใช้ข้อมูลนั้นร่วมกันได้ เป็นการแบ่งกันใช้ข้อมูล (Sharing) กล่าวคือผู้ใช้งานฐานข้อมูลแต่ละคน จะสามารถดึงข้อมูลชิ้นเดียวกันขึ้นมาดูได้พร้อมกัน แต่ถ้าจะทำการแก้ไขข้อมูล จะมีเพียงคนเดียวเท่านั้นที่จะสามารถทำได้ เป็นต้น

จากนิยามของฐานข้อมูลที่ว่า ฐานข้อมูลหมายถึงการเก็บรวบรวมข้อมูลที่มีความสัมพันธ์กันไว้ในที่ที่เดียวกัน จะมีโครงสร้างของข้อมูลพื้นฐานที่มีอยู่ในแฟ้มข้อมูลและระบบฐานข้อมูลดังนี้

ข้อมูลพื้นฐานที่เล็กที่สุดภายในแฟ้มข้อมูลคือ (Bit : Binary Digit) บิท ซึ่งเป็นหน่วยข้อมูลพื้นฐานที่เก็บอยู่ในหน่วยความจำภายในคอมพิวเตอร์ บิทนี้จะแทนด้วยตัวเลข 1 ตัว ได้แก่ 0 หรือ 1 อย่างใดอย่างหนึ่ง เรียกตัวเลข 1 หรือ 0 นี้ว่าเป็น 1 บิท

ข้อมูลซึ่งได้แก่ตัวอักษร (Character) แต่ละตัวเช่น A,B,C…,Z,0,1,….9 และสัญลักษณ์พิเศษอื่นๆ เช่น $,&,+,-,*,/ ฯลฯ เมื่อจะถูกนำไปเก็บไว้ในคอมพิวเตอร์ จะต้องถูกแปลงอยู่ในรูปของบิทหลายบิทที่มาประกอบกัน โดยตัวอักษร 1 ตัว จะแทนด้วย บิท 7 หรือ 8 บิท ฉะนั้นตัวอักษร 1 ตัวที่เห็นจะเรียกได้อีกอย่างว่า ไบท์ (Byte) ตัวอย่างเช่น ตัวอักษร A เมื่อเก็บอยู่ในคอมพิวเตอร์จะเก็บเป็น 1000001 เป็นต้น

ตัวอักษรแต่ละตัวจะถูกนำมาประกอบกันเป็นกลุ่มคำซึ่งมีความหมาย เช่น ชื่อ-สกุล เป็นต้น กลุ่มตัวเลขที่ประกอบกันเป็นรหัสประจำตัว จะเรียกข้อมูลกลุ่มของตัวอักษรที่รวมกันขึ้นมานี้ว่า เขตข้อมูลหรือฟิลด์ (Field) เช่น เขตข้อมูลรหัสอำเภอ เขตข้อมูลรหัสตำบล เป็นต้น

เมื่อนำเขตข้อมูลหลายเขตข้อมูลมารวมกันจะเรียกว่าเป็น ระเบียนหรือเรคอร์ด (Record) เช่นระเบียนนักศึกษา ประกอบด้วยเขตข้อมูลรหัสนักศึกษา ชื่อนักศึกษา รหัสคณะ และรหัสสาขา เป็นต้น

ระเบียนแต่ละระเบียนของข้อมูลชนิดเดียวกันจะสามารถนำมารวมกันเป็น แฟ้มข้อมูลหรือไฟล์ (File)

รูปที่ 5.4 โครงสร้างแฟ้มข้อมูลในฐานข้อมูล

ปัจจุบันนี้หลายหน่วยงานหันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก บางหน่วยงานถึงกับมีการเปลี่ยนแปลงการทำงานจากระบบเดิมคือระบบการประมวลผลแฟ้มข้อมูลมาเป็นระบบการประมวลผลฐานข้อมูล

จากคำนิยามของฐานข้อมูลหลายคนอาจคิดว่าถ้านำแฟ้มข้อมูลหลายแฟ้มข้อมูลมารวมกันไว้ในที่ที่เดียวกันก็จะกลายมาเป็นฐานข้อมูลได้ ซึ่งข้อความนี้ยังไม่ถูกต้องนัก เนื่องจากฐานข้อมูลจะเป็นยิ่งกว่าการเก็บรวบรวมแฟ้มข้อมูลหลายแฟ้มเข้าด้วยกัน แต่ฐานข้อมูลยังต้องมีการเก็บคำอธิบายเกี่ยวกับโครงสร้างของฐานข้อมูลที่เรียกว่า พจนานุกรมข้อมูล (Data Dictionary) หรืออาจเรียกอีกอย่างว่า เมตะดาต้า (Meta-Datda)

๕.๓ พจนานุกรมข้อมูล (Data Dictionary)

DBMS หลายตัวจะมีการรวมพจนานุกรมข้อมูลเป็นส่วนหนึ่งของ DBMS ซึ่งพจนานุกรมข้อมูลนี้จะเป็นองค์ประกอบทางซอฟท์แวร์ ทำหน้าที่เก็บรายละเอียดเกี่ยวกับข้อมูลภายในฐานข้อมูล เช่น โครงสร้างของแต่ละตาราง ใครเป็นผู้สร้าง สร้างเมื่อใด และแต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง คุณลักษณะของแต่ละเขตข้อมูลเป็นอย่างไร และมีตารางใดที่มีความสัมพันธ์กันบ้าง มีเขตข้อมูลใดเป็นคีย์บ้าง เป็นต้น

ถ้าเปรียบเทียบฐานข้อมูลเหมือนกันห้องสมุดของมหาวิทยาลัยที่มีการเก็บหนังสือเล่มต่างๆ หนังสือเหล่านั้นจะเปรียบเสมือนกับข้อมูลที่เก็บอยู่ภายในฐานข้อมูล และในห้องสมุดจะต้องมีการทำบัญชีรายชื่อหนังสือต่างๆที่เก็บไว้ เพื่อใช้บอกรายละเอียดเกี่ยวกับหนังสือแต่ละเล่มว่าใครเป็นผู้แต่ง เก็บอยู่ที่ใดในห้องสมุด บัญชีรายชื่อหนังสือนี้ก็เปรียบได้กับพจนานุกรมข้อมูล ซึ่งมีหน้าที่อธิบายลักษณะของข้อมูลที่เก็บอยู่ในฐานข้อมูลรวมทั้งความสัมพันธ์ของข้อมูล เช่น ระหว่างระเบียนของแฟ้มข้อมูลหนึ่งและแฟ้มข้อมูลอื่นๆ ซึ่งพจนานุกรมข้อมูลนี้จะถูกเก็บและถูกเรียกใช้งานในระหว่างที่มีการประมวลผลฐานข้อมูล

บทที่ 5 : 5.1 บทนำ : GIS และ ฐานข้อมูล

บทที่ 5 ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

5.1บทนำ : GIS และ ฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

ระบบสารสนเทศทางภูมิศาสตร์นั้นมีข้อมูลอยู่ 2 รูปแบบ คือ Spatial data และ Non-spatial data ซึ่งได้เรียนรู้มาในบทแรกที่เกี่ยวข้องกับการนำเข้าข้อมูลประเภท Spatial data มาแล้ว ในส่วนต่อมาที่ต้องเกี่ยวข้องกันคือ Non-spatial data หรือข้อมูลเชิงคุณลักษณะ ที่จะต้องสร้างขึ้นเพิ่มเติม หรือค้นหามาจากแหล่งข้อมูลต่างๆ เพื่อจัดทำฐานข้อมูลระบบสารสนเทศทางภูมิศาสตร์ให้สมบูรณ์ขึ้น

๕.๑ บทนำ : GIS และ ฐานข้อมูล

ระบบสารสนเทศทางภูมิศาสตร์นั้นจะมีรากฐานที่สำคัญมากที่สุดคือ ฐานข้อมูล (Database) เพราะฉะนั้นในการเรียนรู้และทำความเข้าใจเทคโนโลยีระบบสารสนเทศทางภูมิศาสตร์ ถ้าเราไม่มีความรู้พื้นฐานเกี่ยวกับฐานข้อมูลเลยเราจะไม่สามารถที่จะเข้าใจและเรียนรู้ได้อย่างบรรลุถึงศาสตร์ของระบบสารสนเทศทางภูมิศาสตร์

ข้อมูลในระบบสารสนเทศทางภูมิศาสตร์จะเก็บอยู่ในรูปแบบฐานข้อมูล ซึ่งจะต้องอาศัยความรู้เฉพาะอย่างในการจัดการข้อมูลเหล่านั้นอย่างเป็นระบบ เช่น ลักษณะโครงสร้างทั่วไปของฐานข้อมูลมาตรฐาน ว่าในปัจจุบันนี้ในการจัดเก็บข้อมูลเหล่านั้นจะเก็บอยู่ในรูปแบบใด

ปัจจุบันนี้ระบบการจัดการฐานข้อมูล (Database Management System — DBMS) ที่มีอยู่ทั่วไปก็สามารถสร้างระบบสารสนเทศทางภูมิศาสตร์ขึ้นมาได้

� จัดซื้อ หรือลงทุนซื้อ DBMS ซึ่งเป็นค่าลงทุนหลักที่สำคัญของระบบซอฟท์แวร์

� DBMS จะมีความสามารถหลายอย่าง ซึ่งสามารถที่จะทำงานร่วมกับ GIS

ระบบการจัดการฐานข้อมูล (DBMS) หลายๆระบบ ทำให้เกิดข้อสมมติฐานที่เกี่ยวข้องกับข้อมูลที่จัดเก็บไว้ในระบบ

� ทำให้เกิดการใช้ประโยชน์ระบบการจัดการฐานข้อมูล (DBMS) ว่าเป็นสิ่งจำเป็นอย่างยิ่ง ต่อการนำมาจัดเก็บหรือนำเข้าข้อมูลดิบ (data) ที่มีอยู่ได้อย่างง่าย

� เป็นชนิดของระบบฐานข้อมูลที่เหมาะสมต่อระบบ GIS มากกว่าระบบอื่นๆ เพราะข้อมูลที่ใช้สามารถนำเข้าเชื่อมโยงกับข้อมูลเชิงพื้นที่ได้ดีกว่าระบบอื่นๆ

ผู้ใช้หลายคนมักจะคาดหวังว่า GIS เป็นทั้งเครื่องมือและฐานข้อมูล (a tool and a database) และมีความพยายามที่จะพัฒนาระบบสารสนเทศภูมิศาสตร์เพื่อให้ได้ตามวัตถุประสงค์ของหน่วยงาน ดังนั้นในบทนี้จึงกล่าวถึงฐานข้อมูลที่เป็นพื้นฐานที่สำคัญของระบบสารสนเทศทางภูมิศาสตร์

บทที่ 4 : 4.3การนำเข้าข้อมูลเชิงคุณลักษณะ

4.3การนำเข้าข้อมูลเชิงคุณลักษณะ บทที่ ๔

โครงสร้างและการนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS Structure and Data Input)

๔.๓ การนำเข้าข้อมูลเชิงคุณลักษณะ

ข้อมูลเชิงคุณลักษณะ หรือลักษณะประจำที่เกี่ยวข้องที่ไม่อิงพื้นที่ (Attribute Data) ได้แก่ คุณสมบัติของเอนติตี้ทางพื้นที่ซึ่งจำเป็นต้องมีการจัดการใน GIS เช่น การดิจิไทซ์เส้นถนน เส้นถนนแต่ละประเภทอยู่ในรูปข้อมูลทางพื้นที่ของ GIS ซึ่งแสดงด้วยสี สัญลักษณ์ หรือตำแหน่งบนแผนที่ ข้อมูลเกี่ยวกับประเภทของถนน อาจรวมในสัญลักษณ์แผนที่ซึ่งมีอยู่ตามปกติอยู่แล้ว เมื่อผู้ใช้งานต้องการบันทึกข้อมูลเกี่ยวกับความกว้างของถนน หรือความหนาของชั้นซีเมนต์ ชนิดของซีเมนต์ วิธีการสร้าง วันที่สร้าง ตำแหน่งของสี่แยกหรือไฟแดง เป็นต้น เนื่องจากข้อมูลเหล่านี้มีเอนติตี้ทางพื้นที่ร่วมกัน เราจึงสามารถเก็บแยกและประมวลผลข้อมูลเหล่านี้ต่างหากได้ โดยไม่รวมกับข้อมูลเชิงพื้นที่ หากเป็นข้อมูลประเภทขอบเขตการปกครองอาจจะใส่ข้อมูลเรื่องประชากรชาย หญิง และรายได้เฉลี่ย เป็นต้น ดังรูปที่ 4.8

รูปที่ 4.8 การนำเข้าข้อมูลเชิงคุณลักษณะ

๔.๒.๓ การเชื่อมข้อมูลพื้นที่กับข้อมูลที่ไม่อิงพื้นที่

เราสามารถกำหนดเครื่องหมายประจำตัวให้แก่เอนติตี้กราฟิกโดยตรง ในการสร้างรูปหลายเหลี่ยม (polygon) จะต้องสร้างรูปหลายเหลี่ยมขึ้นก่อน จากนั้นจึงจะให้เครื่องหมายประจำตัวแก่รูปหลายเหลี่ยมเหล่านั้นโดยการดิจิไทซ์ข้อมูลเข้า

เมื่อนำเข้าข้อมูลทางพื้นที่และให้เครื่องหมายประจำเรียบร้อยแล้ว ควรมีการทวนสอบคุณภาพของข้อมูลด้วย โดยเฉพาะรหัสที่จะกำหนดเป็นตัวเชื่อมโยงระหว่างข้อมูลเชิงพื้นที่กับข้อมูลลักษณะ

ในการเชื่อมต่อข้อมูลนั้นสามารถสร้างตารางคำอธิบายเสริมขึ้นมาได้เป็นจำนวนมาก ในส่วนนี้จะต้องศึกษาทฤษฎีของการออกแบบและสร้างฐานข้อมูล (Database Design) เพื่อให้การสร้างฐานข้อมูลเป็นไปอย่างมีประสิทธิภาพมากขึ้น

การเชื่อมต่อข้อมูลเชิงพื้นที่เข้ากับข้อมูลเชิงคุณลักษณะนั้นจะสามารถทำได้โดยการเชื่อมต่อเพียงชั่วคราว หรือการทำให้เป็นการเชื่อมต่อแบบถาวรได้ โดยกระบวนการทางระบบสารสนเทศภูมิศาสตร์ ซึ่งจะต้องคำนึงถึงขนาดของข้อมูลที่จะมีขนาดใหญ่เพิ่มขึ้นไปด้วย

ฐานข้อมูลใหม่ในตารางใหม่ที่ได้นั้นสามารถนำไปใช้ในการสอบถามค้นหา หรือวิเคราะห์ในขั้นต่อไปได้อย่างมีประสิทธิภาพมากขึ้น หากฐานข้อมูลนั้นมีความถูกต้องจากการเก็บรวบรวมอย่างมีประสิทธิภาพ

รูปที่ 4.9 การเชื่อมข้อมูลเชิงพื้นที่ร่วมกับข้อมูลเชิงคุณลักษณะ

บทที่ 4 : 4.2 การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

4.2 การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์ บทที่ ๔

โครงสร้างและการนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS Structure and Data Input)

๔.๒ การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

การนำเข้าข้อมูล หมายถึง การกำหนดรหัสให้แก่ข้อมูล แล้วบันทึกข้อมูลเหล่านั้นลงในฐานข้อมูล การสร้างข้อมูลตัวเลขที่ปราศจากที่ผิด (errors) เป็นงานสำคัญและซับซ้อนที่สุด

การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์อาจนำเข้าได้ดังกระบวนการดังต่อไปนี้

1) การนำเข้าข้อมูลทางพื้นที่ (Spatial Data) (การดิจิไทซ์)

2) การนำเข้าข้อมูลลักษณะประจำที่เกี่ยวข้องที่ไม่อิงพื้นที่ (Attribute Data)

3) การเชื่อมโยงข้อมูลทางพื้นที่กับข้อมูลลักษณะประจำที่ไม่อิงพื้นที่

ในแต่ละขั้นตอนจะต้องมีการตรวจสอบข้อมูลเพื่อให้แน่ใจว่าฐานข้อมูลที่ได้ให้มีจุดที่ผิดพลาดน้อยที่สุด

๔.๒.๑ การนำเข้าข้อมูลทางพื้นที่

วิธีการนำเข้าข้อมูลทางพื้นที่ใน GIS มีหลายวิธี ซึ่งขึ้นอยู่กับอุปกรณ์ของหน่วยงานนั้นๆ หรืองบประมาณที่สามารถจัดซื้อ ลักษณะของการใช้งาน และชนิดของข้อมูลที่จะนำเข้าด้วย

ชนิดของข้อมูล ได้แก่ แผนที่ที่มีอยู่แล้ว เอกสารจากการสำรวจภาคสนาม เอกสารที่เขียนด้วยมือ ภาพถ่ายทางอากาศ และภาพถ่ายด้วยระบบการรับรู้ระยะไกล (Remotely Sensed Imagery) ข้อมูลจากการสำรวจภาคสนาม เช่น กระบวนการศึกษาชุมชนอย่างรวดเร็ว (Rural Rapid Appraisal -RRA)

(1) การนำเข้าข้อมูลสู่ระบบเวกเตอร์ด้วยมือ

ข้อมูลพื้นฐานของระบบนี้คือ จุด เส้น และพื้นที่ ค่าพิกัดของข้อมูลที่ได้จากกริดอ้างอิงที่มีอยู่ในแผนที่ หรือได้จากการอ้างอิงจากกริดที่นำมาซ้อนบนแผนที่ ข้อมูลเหล่านี้อาจจะพิมพ์เข้าเครื่องเพื่อเก็บในแฟ้มข้อมูลธรรมดา หรือนำเข้าสู่โปรแกรมก็ได้

(2) การนำเข้าข้อมูลสู่ระบบกริดด้วยมือ

สำหรับระบบกริดนั้น ทั้งจุด เส้น และพื้นที่ ล้วนแสดงด้วยช่องกริด

(2.1) เลือกขนาดของช่องกริด (ราสเตอร์) แล้ววางแผ่นกริดโปร่งใสตามขนาดที่เลือกซ้อนบนแผนที่

(2.2) กรอกค่าลักษณะประจำของแผนที่หนึ่งค่าต่อช่องกริดหนึ่งช่อง หรือใช้สีสัญลักษณ์แทน

(2.3) พิมพ์เข้าแฟ้มข้อความในคอมพิวเตอร์

(3) การนำเข้าด้วยการดิจิไทซ์

การเขียนรหัสและพิมพ์รหัสนำเข้าแฟ้มคอมพิวเตอร์จะต้องใช้เวลาและค่าใช้จ่ายสูง เราสามารถใช้เครื่องอ่านพิกัดในการกำหนดรหัส (X,Y) ให้แก่จุด เส้น และพื้นที่ หรือช่องกริดได้อย่างรวดเร็วขึ้น สำหรับเครื่องอ่านพิกัดที่นิยมใช้กันมากคือ Digitizer ซึ่งเครื่องที่ใช้สำหรับการทำแผนที่หรืองานกราฟิกคุณภาพสูงชนิดที่นิยมกันในปัจจุบัน ได้แก่ แบบที่ใช้ลวดเส้นเล็กๆ สานตัดกันในแนวฉากเป็นกริด หรือชนิดที่ใช้เฟสคลื่นไฟฟ้า มีขนาดตั้งแต่ 11×11 นิ้ว ถึงขนาด 40×60 นิ้ว ทั้งแบบวางบนโต๊ะหรือมีขาตั้งในตัว ทั้งที่มีและไม่มีแสงส่องจากใต้โต๊ะ

คอมพิวเตอร์จะติดต่อกับเครื่องอ่านพิกัดได้ด้วยคำสั่งทางเมนูกราฟฟิก ค่าพิกัดของจุดที่อยู่บนกระดานเครื่องอ่านพิกัดจะถูกส่งไปยังคอมพิวเตอร์ทางปากกาแม่เหล็กที่ลากด้วยมือ ซึ่งเป็นอุปกรณ์ง่ายๆ ที่เรียกว่า “เมาส์” (Mouse) หรือ “พัค” (Puck) สำหรับการทำแผนที่ซึ่งต้องการความถูกต้องสูง ในเมาส์จะมีขดลวดฝังอยู่ในกล่องพลาสติกซึ่งมีช่องพร้อมกับกากบาทซึ่งออกแบบเพื่อให้มีความถูกต้องแม่นยำสูงขึ้น พิกัดของจุดจะถูกดิจิไทซ์ด้วยการวางเส้นกากบาทเหนือจุดที่ต้องการแล้วกดปุ่มบนเมาส์

รูปที่ 4.5 เครื่องวาดพิกัด Digitizer

เครื่องอ่านพิกัดใช้ในการนำเข้าข้อมูลในรูปแบบ จุด เส้น และพื้นที่หลายเหลี่ยม โดยอาศัยการทำงานร่วมกับโปรแกรมประยุกต์ด้าน GIS ส่วนการแปลงเป็นฐานข้อมูลเวกเตอร์หรือกริด (ราสเตอร์) ทำด้วยโปรแกรมหลังการดิจิไทซ์

(4) การแปลงเวกเตอร์ให้เป็นกริด การแปลงข้อมูลเวกเตอร์ให้เป็นราสเตอร์ทำให้มีการสูญเสียข้อมูลโดยไม่สามารถหลีกเลี่ยงได้ เพราะจุดภาพที่ใกล้เส้นของมักคลาดเคลื่อนหรือมีรหัสผิดไป การสูญเสียความถูกต้องแปรผันตามขนาดของช่องกริด คือช่องกริดยิ่งเล็กมากเท่าไร ความผิดพลาดยิ่งลดลง ดังรูปที่ 5.6

เครื่องอ่านพิกัดที่มีความละเอียดสูง 0.001 นิ้ว (0.0254 มม.) มีค่าเบี่ยงเบนไม่ควรจะเกิน + 0.07-0.15 มม. ความผิดพลาดเกิดจากความเหนื่อยล้าจากการทำงาน ไม่ควรทำงานกับเครื่องอ่านพิกัดเกิน 4 ชั่วโมงต่อวัน ถ้าต้องการงานที่มีคุณภาพสม่ำเสมอ

เมื่อแผนที่ถูกดิจิไทซ์แล้ว สามารถบันทึกเก็บไว้ในเทปแม่เหล็กเพื่อการใช้ประโยชน์ต่อไป ขณะที่การทำแผนที่ด้วยคอมพิวเตอร์มีความสำคัญมากขึ้น ได้มีการแปลงแผนที่ภูมิประเทศมาตรฐาน และแผนที่ดิน ธรณีวิทยา การใช้ที่ดิน ฯลฯ เป็นข้อมูลเชิงตัวเลขมากขึ้น การดิจิไทซ์ก็ยังคงจะต้องกระทำในการทำแผนที่นั้นๆ ให้ทันสมัยยิ่งขึ้น

แต่การดิจิไทซ์เป็นงานที่ใช้เวลา และพลังงาน การทำแผนที่ฉบับหนึ่งๆ ให้มีความถูกต้อง อาจใช้เวลาเท่าๆ กับการเขียนใหม่ด้วยมือ อัตราความเร็วเฉลี่ยของการดิจิไทซ์ประมาณ 10 ซม. ต่อนาที การดิจิไทซ์แผนที่ดินมาตรส่วน 1:50,000 ขนาด 60×40 ซม. ต้องใช้เวลาประมาณ 20-40 คน-ชั่วโมง

เมื่อได้มีการนำเข้าข้อมูลแผนที่เข้าสู่ระบบ Vector แล้วเราสามารถแปลงไปเป็น Raster ได้โดยมีรูปแบบของทฤษฎีในการแปลงไปสู่ระบบราสเตอร์ คือ
1. จากรูป 5.7 a ให้พิจารณาว่า “อยู่หรือไม่อยู่บนเส้น presence/absence” ์ เช่นการแปลงเส้นแม่น้ำซึ่งอยู่ในรูปแบบเวกเตอร์ ให้ไปอยู่ในรูปแบบราสเตอร์ โดยพิจารณาว่าเส้นลากผ่านที่กริดหรือเซลใด ให้เซลนั้นมีความหมายรหัสเป็น 1 คือแม่น้ำ
2. จากรูปที่ 5.7 b ให้พิจารณาว่า “ผ่านกึ่งกลางกริด centroid-of-cell method” ตัวอย่างเช่น ถ้ามีการแบ่งการใช้ที่ดินเป็น 2 ประเภทคือ 1 เป็นป่าไม้ และ 2 คือทุ่งหญ้า จากรูป ถ้าเราแปลงจากเวกเตอร์ซึ่งเป็นขอบเขตของโซนแบ่งการใช้ที่ดิน 2 ประเภทนั้น โดยอาศัยการพิจารณาว่า เส้นแบ่งเขตลากผ่านกึ่งกลางเซลใดมากกว่ากัน หรือขอบเขตโซนกินเนื้อที่ของกึ่งกลางเซลการใช้ที่ดินประเภทใดให้ยึดหรือจำแนกเป็นรหัสการใช้ที่ดินประเภทนั้นโดยไม่สนใจว่ารูปแบบการใช้ที่ดินใดมีเนื้อที่มากกว่ากัน แต่อาศัยจุดศูนย์กลางเซลหรือกริดเป็นตัวแบ่ง
3. รูปที่ 5.7 c ให้พิจารณาว่า “ที่มีมากที่สุด dominant type method” ตัวอย่างเช่น ให้เส้นแบ่งเขตการใช้ที่ดินเป็นตัวแบ่ง และตัวแบ่งนั้นกินเนื้อที่เขตการใช้ที่ดินประเภทใดมากกว่ากัน ให้ยึดเป็นการใช้ที่ดินประเภทที่มากนั้นเป็นหลัก
4. รูปที่ 5.7 d ให้พิจารณาว่า “คิดตามเปอร์เซ็นต์ที่ผู้ใช้สนใจหรือตั้งเงื่อนไข persent occurrence method” โดยให้พิจารณายึดผู้ใช้ซึ่งเป็นผู้ตั้งเงื่อนไขความสนใจของประเภทการใช้ที่ดินนั้น และถ้าประเภทการใช้ที่ดินนั้นอยู่เต็ม pixel ให้เป็น 100% โดยถ้ามีการผสมกันให้ยึดการใช้ที่ดินที่สนใจเป็นหลัก ส่วนที่ไม่สนใจให้ค่าเป็น 0% นั่นเอง

รูปที่ 4.7 กระบวนการในการนำเข้าข้อมูลประเภทราสเตอร์ มี 4 ขั้นตอนในการนำเข้าข้อมูลประเภทราสเตอร์ (a) อยู่หรือไม่อยู่บนเส้น presence/absence (b) ผ่านกึ่งกลางกริด centroid-of-cell method (c) ที่มีมากที่สุด dominant type method (d) คิดตามเปอร์เซ็นต์ที่ผู้ใช้สนใจหรือตั้งเงื่อนไข persent occurrence method

Source : Michael N. Demers, Fundamentals of Geographic Information System, John Wiley & Sons, Inc., 1997, Figure 5.6, Page 143.

บทที่ 4 : 4.1 ลักษณะโครงสร้างแบบเวคเตอร์ (Vector Structure)

บทที่ 4 โครงสร้างและการนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

4.1 ลักษณะโครงสร้างแบบเวคเตอร์ (Vector Structure) บทที่ ๔

โครงสร้างและการนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS Structure and Data Input)

ในบทนี้จะพูดถึงการนำเข้าข้อมูลในระบบ Vector ที่จะสามารถดำเนินการได้เพื่อจัดทำระบบสารสนเทศภูมิศาสตร์ ทั้งในรูปแบบ Spatial data และ Non-Spatial data เพื่อให้เข้าในถึงรูปแบบในการทำงานของระบบสารสนเทศภูมิศาสตร์ในเบื้องต้น เพื่อสามารถที่จะนำไปปฏิบัติได้ในขั้นประยุกต์

๔.๑ ลักษณะโครงสร้างแบบเวคเตอร์ (Vector Structure)

ตัวแทนของเวกเตอร์นี้อาจแสดงด้วยข้อมูลประเภทจุด เส้น หรือพื้นที่รูปปิด ซึ่งอาศัยจุดพิกัดในการบ่งบอกถึงตำแหน่งทางภูมิศาสตร์ได้ ทำให้ข้อมูลเชิงพื้นที่สามารถที่จะสืบค้นหาตำแหน่งที่ตั้งทางภูมิศาตร์ได้ ในข้อมูลระบบเวคเตอร์นั้น จะใช้ลักษณะของจุดและเส้น ในการแสดงลักษณะทางภูมิศาสตร์โดยจุดที่เชื่อมโยงต่อกันด้วยเส้นตรงที่เรียกว่า อาร์ค (Arc) เป็นองค์ประกอบที่สำคัญของข้อมูลรูปแบบเส้น (Linear Feature) บางครั้งอาจจะเรียกว่า Line เช่น ถนน แม่น้ำ เป็นต้น ปลายของอาร์คหลายๆ อาร์คที่ต่อกันจนเกิดเป็นขอบเขตนั้นเรียกว่า โพลีกอน (Polygon) ขบวนการของข้อมูลแบบเวคเตอร์นี้จะใช้คู่ของพิกัด X และ Y เป็นตัวชี้ตำแหน่ง และลักษณะของสิ่งต่างๆ และนำเข้าตามมาตราส่วนของแผนที่ที่เป็นต้นฉบับ จะทำให้ได้รูปร่างลักษณะ มาตราส่วน และรายละเอียดตามต้องการ

วิธีการนำเข้าข้อมูลของระบบ GIS ในลักษณะโครงสร้างแบบเวคเตอร์ แบ่งออกเป็นวิธีการในรูปแบบต่างๆดังนี้คือ

๔.๑.๑ การป้อนข้อมูลที่เป็นจุด (Point Entities)

การป้อนข้อมูลที่เป็นจุดจะใช้คู่พิกัด X และ Y เพื่อแสดงตำแหน่งของข้อมูลทางภูมิศาสตร์ หรือลักษณะของภาพต่างๆ นอกเหนือจากพิกัด X และ Y แล้ว ก็อาจจะระบุถึงข้อมูลอื่นๆ ที่ใช้ในการอธิบายความหมาย หรือชนิดของข้อมูลที่เป็นจุดนั้นๆ เช่น จุด อาจจะเป็นสัญลักษณ์ที่ไม่ได้มีความสัมพันธ์กับข้อมูลอื่น การบันทึกข้อมูลจำเป็นที่จะต้องรวมถึงข้อมูลที่ใช้อธิบายความหมายของจุดและขนาดของข้อมูลจุดนั้นๆ หรือถ้าจุดนั้นเป็นลักษณะของข้อมูลเกี่ยวกับรายละเอียดต่างๆ (Text Entity) การบันทึกข้อมูลจะต้องอธิบายถึงลักษณะที่จะใช้ในการแสดงผล รูปแบบ ตำแหน่งและมาตราส่วนต่างๆ การนำเข้าข้อมูลแบบจุดในปัจจุบันนี้สามารถแสดงถึงตำแหน่งที่ตั้งของวัตถุบนโลกมนุษย์อาจจะประยุกต์ใช้โดยนำระบบ Remote Sensing เช่น ภาพถ่ายทางอากาศหรือภาพถ่ายดาวเทียมเข้ามาช่วยในการนำเข้าข้อมูลแบบจุดให้รวดเร็วขึ้น หรืออาจมีการออกภาคสนามแล้วใน Global Positioning System (GPS) ในการตรวจวัดพิกัดภูมิศาสตร์ของพื้นที่ศึกษาได้อย่างรวดเร็วและสามารถนำค่าที่ได้จาก GPS ไปใช้ในระบบสารสนเทศภูมิศาสตร์ได้โดยตรง และรวดเร็วขึ้นในปัจจุบัน

รูปที่ 4.1 การนำเข้าข้อมูลประเภทจุดโดยประยุกต์ใช้ GIS และ GPS ร่วมกัน

๔.๑.๒ การป้อนข้อมูลรูปแบบเส้น (Linear Entities)

ลักษณะของข้อมูลรูปแบบเส้นนั้น สามารถแบ่งแยกได้ในลักษณะรูปแบบของเส้นที่เกิดจากการประกอบกันของเส้นตรงย่อยๆ (Segment) ที่มีพิกัดตั้งแต่ 2 พิกัดขึ้นไป ลักษณะของเส้นจะถูกเก็บข้อมูลที่จุดเริ่มต้นและจุดปลายของเส้นเป็นอย่างน้อย รวมถึงข้อมูลที่ใช้อธิบาย หรือแสดงความหมายของสัญลักษณ์นั้นๆ สำหรับเส้นที่มีลักษณะต่อเนื่องและซับซ้อน จะใช้ลักษณะของคู่พิกัดจำนวนมากในการใช้อธิบาย ซึ่งได้แก่ ลักษณะของอาร์คและลักษณะลูกโซ่ (Chain or String) ในการป้อนข้อมูลที่เป็นโครงข่ายต่อเนื่อง (Connectivity Network) เช่น ระบบระบายน้ำ หรือระบบขนส่ง เป็นต้น จึงจำเป็นที่จะต้องสร้างตัวเชื่อมหรือตัวชี้ (Pointer) ในโครงสร้างของข้อมูลเพื่อเชื่อม Chain ในแขนงต่างๆ ซึ่งจะมีจุดที่เรียกว่า Node เป็นตัวช่วย โดยที่Node จะบันทึกข้อมูลขนาดของมุมแต่ละ Chain ที่อยู่ร่วมในแต่ละ Node ในการนำเข้าข้อมูลประเภทเส้นนั้นบางครั้งเราสามารถนำเข้าจากรูปแบบอื่นๆ เช่น AutoCAD ที่อยู่ในรูปแบบ DXF สามารถนำเข้ามาสู่ระบบสารสนเทศภูมิศาสตร์ โดยจะต้องทำการให้รหัส (Code) ใหม่อีกครั้ง หรืออาจจะนำเข้าจาก GPS ได้เช่นเดียวกัน



รูปที่ 4.2 การป้อนข้อมูลรูปแบบเส้นโดยอาศัยภาพถ่ายทางอากาศเป็นแผนที่ฐาน

๔.๑.๓ การป้อนข้อมูลรูปแบบพื้นที่ (Area Entities)

การป้อนข้อมูลรูปแบบพื้นที่ในระบบ GIS เป็นการนำเข้าข้อมูลโดยอาศัยจุดและเส้น โดยจุดเริ่มต้นและจุดสิ้นสุดมักเรียกว่า Node และจุดที่เป็นจุดต่อเนื่องของเส้นจะเรียกว่า Vertex พิจารณาในรูปของโพลีกอนเพื่อใช้อธิบายคุณสมบัติทางวิชาวิภาคเฉพาะส่วน (Topological Properties) ของพื้นที่ซึ่งได้แก่ รูปร่าง (Shape) ข้อมูลใกล้เคียง (Neighbour) และระดับชั้นต่างๆ (Hierarchy) ในลักษณะที่สามารถแสดง และคำนวณผลเป็นข้อมูลในแผนที่ได้ วิธีการป้อนข้อมูลของข้อมูลโพลีกอนที่มีลักษณะง่ายๆ จะใช้วิธีที่เรียกว่า Point List Structure โดยจะป้อนข้อมูลคู่พิกัดของแต่ละโพลีกอนไว้ในตาราง แต่วิธีการนี้มีข้อจำกัดตรงที่มีคู่พิกัด (Coordinate Pairs) เป็นจำนวนมาก เช่นจุดหนึ่งๆ จะเป็นตัวแทนมากกว่า 1 โพลีกอน เป็นต้น และการแก้ไขเปลี่ยนแปลงขอบเขตของโพลีกอนทำได้ยาก ดังนั้น จึงอาจปรับปรุงวิธีการการป้อนข้อมูลไปเป็น Common Point Dictionary Structure โดยจะแยกข้อมูลออกเป็น 2 ส่วน ส่วนแรกจะเป็นข้อมูลคู่พิกัดของจุดยอดในแต่ละโพลีกอน ส่วนที่ 2 จะบอกขอบเขตของโพลีกอนต่างๆ นอกจากนี้ สำหรับข้อมูลที่มีความซับซ้อนมากขึ้นก็จะใช้ลักษณะ Chain และ Node ในการกำหนดโครงสร้างของข้อมูล

รูปที่ 4.3 ลักษณะการป้อนข้อมูลรูปแบบพื้นที่

สำหรับข้อผิดพลาดที่อาจจะเกิดขึ้นในการเก็บข้อมูลของ Simple Polygon คือ การลาก ( Digitize ) ขอบเขตที่ติดต่อกันของแต่ละโพลีกอน ซึ่งจำเป็นที่จะต้องทำการลากหรือเก็บข้อมูลซ้ำอาจก่อให้เกิดข้อผิดพลาดที่เรียกว่า “ Gap” และ “ Sliver” หรือ อาจจะลากขอบเขตของโพลีกอนได้ไม่ครบถ้วนที่เรียกว่า “Dead Ends” และการลากขอบเขตซ้อนตัดกันที่เรียกว่า “Weird Polygon” เป็นต้น ดังนั้น จึงจำเป็นที่จะต้องใช้ความระมัดระวังในการนี้พอสมควร เพื่อให้ได้ข้อมูลที่ถูกต้องมากที่สุดเท่าที่จะทำได้ โดยในกระบวนการของโปรแกรมจะสามารถช่วยได้มากในการกำหนดค่าความน่าเชื่อถือของข้อมูล (Tolerance) ก่อนการนำเข้าอาจจะมีการตั้งค่าระยะการเชื่อมต่อของข้อมูล (Snap) เพื่อให้ข้อมูลสามารถปิดได้สนิทเป็นรูปหลายเหลี่ยมปิด และลดปริมาณความผิดพลาดของข้อมูลประเภทพื้นที่ลง เพราะเป็นส่วนที่มักจะเจอปัญหาในการทำงานบ่อยครั้ง

รูปที่ 4.4 ข้อผิดพลาดในการป้อนข้อมูล

ข่าวสารย้อนหลัง
Who's Online
3 visitors online now
1 guests, 2 bots, 0 members
Powered by Visitor Maps