Archive for the ‘เรียนรู้-ระบบสารสนเทศภูมิศาสตร์’ Category

arcview3 : 1. รู้จักโปรแกรม ArcView

เรียนรู้ PC  ArcView GIS เวอร์ชั่น 3.X  เป็นโปรแกรมที่ในการประมวลผลทางด้านระบบสารสนเทศภูมิศาสตร์ (GIS)  เช่นการทำแผนที่
ทำงานบน Desktop ที่เป็นที่นิยมมากที่สุด เนื่องจากความสะดวกในการใช้งาน ด้วยความสามารถ ทางด้านการทำแผนที่และวิเคราะห์เชิงพื้นที่

ในเอกสารประกอบให้ download อ่านได้  chapter00.pdf

หนังสืออ้างอิง

หนังสืออ้างอิง ครรชิต มาลัยวงศ์ และคณะ. 2527. คอมพิวเตอร์เบื้องต้น เล่ม 1. กรุงเทพฯ : เค.เอส. คอมพิวเตอร์.

ครรชิต มาลัยวงศ์. 2544. ความรู้เรื่องสารสนเทศสำหรับนักวิจัย. [ออนไลน์]. เข้าถึงได้จาก: http://stang.li.mahidol.ac.th/text/research.htm

โครงการจัดการทรัพยากรธรรมชาติและสิ่งแวดล้อม-NREM. 2541. คู่มือฝึกอบรมระบบสารสนเทศภูมิศาสตร์ (ArcView 3.0) สำหรับการวางแผนการจัดการทรัพยากรธรรมชาติและสิ่งแวดล้อม. กทม. : โครงการจัดการทรัพยากรธรรมชาติและสิ่งแวดล้อม.

ฝ่ายทรัพยากรธรรมชาติและสิ่งแวดล้อม สถาบันวิจัยเพื่อการพัฒนาประเทศไทย. 2536. โครงการจัดทำแผนหลักการจัดตั้งระบบสารสนเทศภูมิศาสตร์. กรุงเทพฯ : สถาบันวิจัยเพื่อการพัฒนาประเทศไทย.

ศรีสอาด ตั้งประเสริฐ, ผู้แปล. 2537. ระบบสารสนเทศภูมิศาสตร์เพื่อการประเมินค่าทรัพยากรที่ดิน. กรุงเทพฯ : ศูนย์พัฒนาหนังสือ กรมวิชาการ กระทรวงศึกษาธิการ.

ศูนย์รีโมทเซนซิ่งและระบบสารสนเทศภูมิศาสตร์ ภาคใต้ มหาวิทยาลัยสงขลานครินทร์. 2544. เทคโนโลยีรีโมทเซนซิ่งและระบบสารสนเทศภูมิศาสตร์. [ออนไลน์]. เข้าถึงได้จาก: http://www.rs.psu.ac.th/

สมจิตร อาจอินทร์ และงามนิจ อาจอินทร์. 2541. ระบบฐานข้อมูล. พิมพ์ครั้งที่ 3. ขอนแก่น : ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยขอนแก่นขอน.

สุพรรณ กาญจนสุธรรม และคณะ. 2534. ระบบสารสนเทศภูมิศาสตร์เพื่อการวางแผนพัฒนาการเกษตร. กรุงเทพฯ : กระทรวงเกษตรและสหกรณ์.

สุรีย์ บุญญานุพงศ์ และคณะ. 2541. แนวทางการใช้ระบบสารสนเทศภูมิศาสตร์เพื่อการวางแผน. เชียงใหม่ : สถาบันวิจัยสังคม มหาวิทยาลัยเชียงใหม่.

Amir H. Razavi and Valerie Warwick. 2000. ArcView GIS/Avenue programmer’s reference : Class hierarchy quick reference and 100+scripts. Albany, New York : OnWord Press.

Clark Labs. 2000. Idrisi and CartaLinx GIS and Image Processing software. [online]. Available: http://www.clarklabs.org/

Environmental Systems Research Institute. 1994. ArcView : The geographic information system for everyone. Redlands, C.A. : Environmental Systems Research Institute Inc.

Environmental Systems Research Institute. 1995. Understanding GIS. Redlands, C.A. : Environmental Systems Research Institute Inc.

Environmental Systems Research Institute. 2000. ESRI – The GIS Software Leader. [online]. Available: http://www.esri.com/

Environmental Systems Research Institute. 2000. GIS.com–Your Internet Guide to GIS (Geographic Information Systems). [online]. Available: http://www.gis.com/

Intergraph. 2000. World Premier Provider of Mapping and GIS (Geographic Information Systems). [online]. Available: http://www.intergraph.com/gis/

ITC ILWIS. 2000. ILWIS 3.0 – the Remote Sensing and GIS software. [online]. Available: http://www.itc.nl/ilwis/ilwis.html

Michael N. Demers. 1997. Fundamentals of Geographic Information Systems. USA : John Wiley & Sons, inc.

P. C. Muehrcke, and J.O. Muehrcke. 1992. Map Use : Reading, Analysis and Interpretation. 3rd ed., JP Publication, Madison, WI.

PCI Geomatics. 2000. Geomatica Advanced GIS Module ~Using PAMAP GIS Technology. [online]. Available: http://www.pcigeomatics.com/product_ind/prpamap.html

William E. Huxhold. 1995. Managing geographic information system projects. New York : Oxford University Press.

บทที่ 6 : 6.3การซ้อนทับข้อมูล (Overlay Function)

6.3การซ้อนทับข้อมูล (Overlay Function) บทที่ ๖

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS DATA ANALYSIS)

๖.๓ การซ้อนทับข้อมูล (Overlay Function)

� การซ้อนทับข้อมูล เป็นขั้นตอนหนึ่งที่สำคัญและเป็นพื้นฐานทั่วไปในระบบสารสนเทศภูมิศาสตร์ หลักการคือการนำข้อมูลที่มีอยู่เข้ามารวมกันจากแหล่งข้อมูลที่มีอยู่หลากหลาย เพื่อใช้ในการตัดสินใจแก้ปัญหา (Decision Making)

� หลักการ ในการซ้อนทับข้อมูล

– โดยทั่วไปในการซ้อนทับข้อมูลแผนที่จะอาศัยจุดคู่ควบ (x,y) และข้อมูลเชิงบรรยายจะถูกสร้างขึ้นใหม่ หลังจากที่เราทำการ overlay ในระบบสารสนเทศภูมิศาสตร์

– การซ้อนทับข้อมูลอาจจะใช้กระบวนการทางเลขคณิต (arithmetic) (เช่น การบวก, ลบ, คูณ, หาร) หรือตรรกศาสตร์ logical (เช่น AND, OR, XOR, etc.)

� รูปแบบของการซ้อนทับข้อมูลได้แก่ การทำ Buffer, การตัดข้อมูล-Clip, การเชื่อมต่อแผนที่-Merge, การรวมข้อมูล-Dissolve, การขจัดข้อมูล-Eliminate, การลบข้อมูล-Erase, การซ้อนทับข้อมูลแบบ Identity, การซ้อนทับข้อมูลแบบ Intersect, การซ้อนทับข้อมูลแบบ Union, การหาระยะทางระหว่างข้อมูล 2 Theme-Near, การปรับปรุงข้อมูล-Update

๑) แนวระยะห่างด้วย Buffer – Buffers selected features
เป็นการหาระยะทางให้ห่างจากรูปแบบภูมิศาสตร์ (Featues) ที่กำหนด
โดยที่การจัดทำ Buffer เป็นการวิเคราะห์พื้นที่เพียง 1 Theme และเป็นการสร้างพื้นที่ล้อมรอบ Graphic Features (point, line and polygon) ของ 1 theme ที่ได้คัดเลือกไว้บางส่วน หากไม่ได้เลือกจะทำ buffer ทั้ง theme ผลที่ได้รับคือ theme ใหม่ ที่มีขนาดความกว้างของพื้นที่จากตำแหน่งที่เลือก เท่ากับขนาดของ Buffer ที่ได้กำหนดมีหน่วยเป็นเมตร

รูปที่ 6.7 การหาแนวระยะห่างด้วย Buffer

๒) การตัดขอบเขตข้อมูลด้วย Clip – Clips one theme using another
เป็นการตัดข้อมูลแผนที่ออกจาก Theme เป้าหมาย (Theme to be clipped) กับ แผนที่หรือพื้นที่ที่ใช้ตัด เช่น พื้นที่อำเภอเดียว ที่ต้องการใช้เป็นขอบเขตในการตัด (Theme to clip)

รูปที่ 6.8 การตัดขอบเขตข้อมูลด้วย Clip

๓) การหาพื้นที่ซ้อนทับด้วย Union – Overlays two polygon themes
เป็นฟังก์ชั่นทางคณิตศาสตร์ที่เกิดจากการสนใจในพื้นที่ของวัตถุที่ซ้อนกัน มากกว่า 2 พื้นที่ โดยที่เป็นการรวมแผนที่จำนวน 2 พื้นที่ขึ้นไปเข้าด้วยกัน โดยสร้างขึ้นมาเป็นแผนที่ชุดใหม่

รูปที่ 6.9 การหาพื้นที่ซ้อนทับด้วย Union

๔) การหาพื้นที่ซ้อนทับแบบ Intersect – Overlays two themes and preserves only features that intersect
เป็นการซ้อนทับ (Overlay) ข้อมูลระหว่าง theme 2 themes โดย Theme ผลลัพธ์ (Out-Theme) จะอยู่ในทั้งขอบเขตพื้นที่ (map extent) ของทั้ง 2 theme ไม่เกินจากข้อมูลทั้ง 2 Theme ทั้งนี้ in-theme เป็นได้ทั้ง point, line และ polygon ส่วน Intersect-Theme จะต้องเป็น polygon เท่านั้น

รูปที่ 6.10 การหาพื้นที่ซ้อนทับแบบ Intersect

๕) การหาพื้นที่ซ้อนทับข้อมูลแบบ Identity – Overlays two themes and preserves only features that falls within the first themes extent
การซ้อนทับ (Overlay) ข้อมูลเชิงพื้นที่ 2 themes โดยยึดขอบเขตของแผนที่ต้นฉบับ (In-Theme) เป็นหลัก และจะรักษาข้อมูลเชิงคุณลักษณะของทั้ง 2 themes เข้าไว้ด้วยกัน ข้อมูลจากแผนที่ต้นฉบับ (In-Theme) เป็นได้ทั้ง point, line, polygon และ multi-point แต่ identity-theme จะต้องเป็นเฉพาะ polygon theme เท่านั้น
ตัวอย่างเช่น มีข้อมูลสถานีวัดปริมาณน้ำฝน (in-theme) ที่ไม่ทราบว่าตั้งอยู่ในตำบลใด ก็นำข้อมูลตำบล (identity-theme) มาซ้อนทับแบบ identity จะทำให้ข้อมูลใหม่ของสถานีวัดปริมาณน้ำฝนมีข้อมูลว่าอยู่ในตำบลใด

รูปที่ 6.11 การหาพื้นที่ซ้อนทับแบบ Identity

๖) การเชื่อมต่อข้อมูลแผนที่ MapJoin และ Merge
เป็นการรวม Graphic Features จากหลาย theme เข้าเป็น Theme เดียว Mapjoin สามารถดำเนินการทั้งข้อมูลที่เป็น point, line และ polygon เพื่อเป็นการเชื่อมต่อแผนที่ที่มีพิกัดภูมิศาสตร์อยู่ในพื้นที่ใกล้เคียงกัน หรือต่อกัน

รูปที่ 6.12 การเชื่อมต่อข้อมูลแผนที่ MapJoin และ Merge

๗) การรวมขอบเขตข้อมูลด้วย Dissolve – Removes borders between polygon witch share the same values
Dissolve ใช้ฟังก์ชันนี้เพื่อรวมข้อมูลพื้นที่ (polygon) ที่มีคุณสมบัติหรือ attribute เหมือนกันที่อยู่ติดกันเข้าด้วยกัน เพื่อลดความซ้ำซ้อนของ Theme ให้น้อยลง ซึ่งเป็นการเอาเส้นขอบเขตของพื้นที่ที่มีค่าเหมือนกันในหนึ่งหรือหลาย Fields ออกไป

รูปที่ 6.13 การรวมขอบเขตข้อมูลด้วย Dissolve

๘) การลบแล้วรวมข้อมูลด้วยEliminate- Removes the longest border on selected polygons
Eliminate เป็นคำสั่งที่ใช้รวม Polygon ที่ได้ถูกเลือกไว้แล้ว (เช่น Polygon ที่มีขนาดเล็ก) โดยการเรียกค้น (Query) หรือเลือกโดยตรง เข้ากับ Polygon ข้างเคียง ในระยะ snap tolerance ที่กำหนดไว้ โดยการลบเส้นที่ยาวที่สุดของ Polygon ที่ถูกเลือก โดยส่วนใหญ่ใช้ในการลบข้อมูลที่ได้จากการจำแนกประเภทการใช้ที่ดิน ในส่วนของ noise หรือ ส่วนที่มีเนื้อที่น้อย ออกไปแล้วทำการรวมให้เป็นเนื้อที่ส่วนใหญ่ (Dominant)

รูปที่ 6.14 การลบแล้วรวมข้อมูลด้วยEliminate

๙) การลบข้อมูลด้วย Erase Cover – Erases from one theme using another
การลบข้อมูลจากแผนที่ (Graphic feature) จากแผนที่หนึ่ง (in-theme) โดยการใช้อีกแผนที่หนึ่งเป็นกรอบ (The erase-theme) ที่มีพื้นที่ซ้อนทับกัน ซึ่งอาจเป็น Polygon, line, point หรือ multi-point คล้ายกับการ Clip แต่การ Erase cover เป็นการเหลือข้อมูลที่อยู่นอก erase-theme

รูปที่ 6.15 การลบข้อมูลด้วย Erase Cover

๑๐) ระยะทางระหว่างข้อมูลของ 2 Themes ด้วย Near – Calculates distance from features in one theme to the nearest feature in another theme
Near เป็นคำสั่งที่ใช้ในการคำนวณระยะทางจากแต่ละ Feature ใน 1 theme ไปยัง feature ที่ใกล้ที่สุดใน Theme อื่น (ไม่สามารถเลือก Feature เป้าหมายได้) ระยะทางจะถูกบันทึกไว้ใน field ชื่อ called_distance

รูปที่ 6.16 การหาระยะทางระหว่างข้อมูลของ 2 Themes ด้วย Near

๑๑) การปรับแก้ข้อมูลพื้นที่บางส่วน Update
เป็นการแทนที่พื้นที่ใน Theme หนึ่งโดย Theme อื่นๆ โดยการซ้อนทับระหว่าง in-Theme กับ Update-theme (เฉพาะข้อมูลที่เป็นพื้นที่ polygon) out-theme จะประกอบด้วย Field ทั้งหมดของ 2 Theme

รูปที่ 6.17 การปรับแก้ข้อมูลพื้นที่บางส่วน Update

ส่วนในการปฏิบัติใช้งานจริงนั้นเกิดจากการผสมผสานของขั้นตอนต่างๆ ข้างต้น ซึ่งต้องอาศัยประสบการณ์ของผู้ปฏิบัติงานในการทำงานทางด้าน GIS โดยการใช้โปรแกรมต่างๆ ให้เหมาะสมต่อวัตถุประสงค์ของการใช้รูปแบบคำสั่งนั้นๆ ด้วย

บทที่ 6 : 6.2รูปแบบการวิเคราะห์ด้านระบบสารสนเทศภูมิศาสตร์

6.2รูปแบบการวิเคราะห์ด้านระบบสารสนเทศภูมิศาสตร์ บทที่ ๖

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS DATA ANALYSIS)

๖.๓ รูปแบบการวิเคราะห์ด้านระบบสารสนเทศภูมิศาสตร์

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์ที่มีความสามารถในการวิเคราะห์ข้อมูลเชิงพื้นที่ ร่วมกับข้อมูลเชิงคุณลักษณะได้ ทำให้การวิเคราะห์ที่ต้องการจึงมีความซับซ้อน และสามารถนำไปประยุกต์ใช้ได้อย่างเหมาะสม เพื่อตอบสนองความต้องการของผู้ใช้งานได้หลายๆ อย่าง เช่น

�การสอบถามข้อมูลการหาที่ตั้ง (Location) โดยผู้ใช้ฐานข้อมูลสามารถสอบถามได้ว่า “มีอะไรอยู่ที่ไหน? (What is at…?)” เป็นคำถามที่สามารถตอบได้ด้วย GIS ซึ่งหากมีการเตรียมแผนที่ GIS ได้อย่างถูกต้อง ทำให้ผู้สอบถามข้อมูลจากฐานข้อมูลสามารถตอบคำถามได้ว่า จุดที่ตั้งสถานีวัดปริมาณน้ำฝน ตั้งอยู่ที่ตำบล หรืออำเภอ หรือจังหวัดใด หรืออาจจะอยู่ใกล้กับถนนใด เพื่อให้ง่ายต่อการไปถึงจุดที่ต้องการ และสามารถสอบถามรายละเอียดอื่นๆ เพิ่มเติมได้ และทำให้เราทราบถึงพิกัดทางภูมิศาสตร์ได้

�การสอบถามข้อมูลโดยการตั้งเงื่อนไข (Condition) โดยตั้งเงื่อนไขในการสอบถามหรือวิเคราะห์ข้อมูลว่า “สิ่งที่สอบถามนั้นอยู่ที่ไหน? (Where is it?)” พื้นที่ที่ตั้งเงื่อนไขที่ผู้ใช้ต้องการสร้างสถานีวัดปริมาณน้ำฝนเพิ่มเติมในพื้นที่นั้นอยู่บริเวณใดในพื้นที่ศึกษา เช่น ห่างจากแม่น้ำ 500 เมตร ห่างจากถนนไม่เกิน 1000 เมตร และไม่ตั้งอยู่ในพื้นที่การเกษตร เพื่อไม่ให้สูญเสียการใช้ประโยชน์ที่ดินทางด้านการเกษตร เป็นต้น GIS สามารถช่วยค้นหาพื้นที่ที่ตั้งเงื่อนไขไว้และสามารถแสดงผลในรูปแบบแผนที่และข้อมูลเชิงคุณลักษณะได้

�การสอบถามข้อมูลถึงแนวโน้มการเปลี่ยนแปลง (Trends) โดยที่ผู้ใช้ฐานข้อมูล GIS สามารถสอบถามข้อมูลการเปลี่ยนแปลงในฐานข้อมูลที่รวบรวมไว้ว่า “ในช่วงระยะเวลาที่ผ่านมามีอะไรในพื้นที่ศึกษาเปลี่ยนแปลงไปบ้าง? (What has changed since…?) เช่น สภาพการใช้ที่ดินที่เปลี่ยนแปลงไปในระยะ 10 ปี จากพื้นที่เกษตรไปเป็นพื้นที่อุตสาหรรมในปัจจุบันนี้ มีเนื้อที่เท่าไร หรืออยู่บริเวณใดบ้าง ซึ่งสามารถทำให้เห็นแนวโน้มหรือพัฒนาการของพื้นที่ศึกษาหรือชุมชนในพื้นที่ศึกษาได้

�การสอบถามข้อมูลรูปแบบการเปลี่ยนแปลง (Patterns) ในการสอบถามข้อมูลถึงรูปแบบของสิ่งที่ก่อให้เกิดการเปลี่ยนแปลงนี้จะต้องใช้การแสดงแผนที่หรือข้อมูลในรูปแบบความสัมพันธ์ของสิ่งที่ปรากฎบนแผนที่เพื่อตรวจสอบดูว่า “ข้อมูลมีความสัมพันธ์กันในด้านพื้นที่เป็นอย่างไร? (What spatial patterns exist?)” อยากจะหาสาเหตุของการกระจายตัวของอุตสาหกรรมขนาดกลางและขนาดย่อม (SMEs) ในชุมชนชนบท หรือพื้นที่ศึกษา บางแห่งมีการกระจุกตัวของโรงงานอุตสาหกรรม SMEs เป็นจำนวนมาก เมื่อแสดงด้วยแผนที่แล้วพบว่าการกระจายตัวของโรงงานอุตสาหกรรมที่เกิดขึ้นนี้ส่วนใหญ่จะตั้งไปตามเส้นทางคมนาคมทางบกเป็นปัจจัยสำคัญ เพราะวางตัวไปตามแนวถนนหลัก และปัจจัยรองคือแหล่งน้ำเนื่องจากมีน้ำประปา และน้ำบาดาลที่ใช้ในกระบวนการผลิตอย่างพอเพียง และสามารถคาดการณ์ไปได้อีกว่าการกระจายตัวจะไปทิศทางใด

�การสอบถามข้อมูลด้วยการสร้างแบบจำลอง (Modeling) ซึ่งในการจัดทำแบบจำลองสถานการณ์นี้สามารถทำให้ผู้ใช้ฐานข้อมูลซึ่งจะต้องมีความรู้ด้าน GIS มาบ้างสามารถใช้งานได้ในการกำหนดรูปแบบจำลองโดยใช้ฐานข้อมูล และทำให้คาดการณ์ถึงสิ่งที่จะเกิดขึ้นต่อไปหากมีการเปลี่ยนแปลงปัจจัยหรือตัวแปรใดๆ ในฐานข้อมูล (What if…?) เช่น การเตรียมข้อมูลสภาพพื้นที่บริเวณที่ราบลุ่มเชิงเขา ในหมู่บ้านน้ำก้อ จังหวัดเพชรบูรณ์ ผู้จัดเตรียมฐานข้อมูลจะต้องสร้างฐานข้อมูลเส้นชั้นความสูง ข้อมูลชุดดิน และความสามารถในการซึมน้ำ และการระเหยของน้ำในบริเวณพื้นที่ศึกษา สภาพป่าไม้ และปริมาณน้ำฝนโดยเฉลี่ย และคาบของปริมาณน้ำฝนอย่างน้อย 30 ปี เพื่อให้สามารถคาดการณ์ได้อย่างแม่นยำมากขึ้นในเรื่องของปริมาณฝนที่ตก รวมถึงการไหลเข้าของน้ำ และการไหลออกของน้ำจากพื้นที่ศึกษา เพื่อตรวจดูความสมดุลย์ของน้ำที่ชะล้างลงมาสู่พื้นที่ว่าสามารถระบายออกจากพื้นที่ได้ทันเวลาหรือไม่หรือจะต้องท่วมเป็นเวลากี่ชั่วโมงหรือกี่วัน ผู้ใช้จึงสามารถจำลองสถานการณ์ได้ว่าหากฝนตกมาในปริมาณ 1000 มิลลิเมตร จะท่วมหรือไม่บริเวณใดบ้างได้รับผลกระทบ

ในระบบสารสนเทศภูมิศาสตร์อาจจะแบ่งรูปแบบหลักในการวิเคราะห์ข้อมูลได้ 3 รูปแบบคือ

ก) การวิเคราะห์ข้อมูลเชิงพื้นที่ (Analysis of Spatial Data )

ข) การวิเคราะห์ข้อมูลเชิงบรรยาย (Analysis of Attribute Data)

ค) การวิเคราะห์ข้อมูลเชิงพื้นที่ร่วมกับข้อมูลเชิงบรรยาย (Integrated analyses of spatial and attribute data)

๖.๓.๑ การวิเคราะห์ข้อมูลเชิงพื้นที่ (Analysis of the Spatial Data)

ก) การแปลงระบบพิกัดทางภูมิศาสตร์ (Transformation or Projection)

การแปลงระบบพิกัดทางภูมิศาสตร์, มาตราส่วน (เช่น Geographic–lat./log. UTM) เป็นการเปลี่ยนจากระบบพิกัดทางภูมิศาสตร์อย่างระบบหนึ่งไปเป็นอีกระบบหนึ่ง เช่น ระบบพิกัดทางภูมิศาสตร์แบบ Geographic–Lat./Lon. ไปเป็นระบบ UTM

เส้นโครงแผนที่จะมีอยู่หลายประเภท มีคุณสมบัติที่แตกต่างกันออกไป การจะเลือกใช้เส้นโครงแผนที่ประเภทใดนั้น ขึ้นอยู่กับวัตถุประสงค์ของการใช้งาน

แผนที่ส่วนใหญ่ในประเทศไทยจะใช้เส้นโครงแผนที่แบบยูนิเวอร์ซัล ทรานสเวอร์ส เมอร์เคเตอร์ (Universal Transverse Mercator Projection – UTM) ซึ่งสามารถใช้โปรแกรมระบบสารสนเทศภูมิศาสตร์ช่วยในการแปลงระบบพิกัดได้

รูปที่ 6.1 ผลลัพธ์ที่ได้จากการแปลงพิกัดจากระบบ Geographic มาเป็น UTM

ข) การต่อแผนที่ (Mosaic) หรือการเทียบขอบ (Edge-matching)

รูปที่ 6.2 รูปแบบการต่อแผนที่โดยใช้โปรแกรมช่วย

การเชื่อมต่อแผนที่หลายๆ ระวางเข้าด้วยกัน หรือการเชื่อมต่อแผนที่เรื่องเดียวกันแต่มีหลายๆ ระวางหรือหลายแผ่นเข้าด้วยกัน เรียกกระบวนการนี้ว่า Mosaic ส่วน Edge-matching (การเทียบขอบ) เป็นวิธีการปรับตำแหน่งรายละเอียดของแผนที่ 2 ระวางขึ้นไปที่อยู่ต่อเนื่องกัน แต่เชื่อมต่อกันไม่สนิท จึงจำต้องทำการปรับแผนที่เพื่อให้เป็นแผนที่ที่ต่อเนื่องกัน

ค) คำนวณพื้นที่, เส้นรอบวง และระยะทาง

การคำนวณพื้นที่ที่อยู่ในฐานข้อมูล และสามารถวัดพื้นที่เส้นรอบวง ความยาวเส้น และระยะทางของเส้นได้ โดยโปรแกรมระบบสารสนเทศภูมิศาสตร์จะคำนวณได้อัตโนมัติหลังการทำ Topology แล้ว หรือ อาจจะสอบถามผ่านโปรแกรมได้ โดยใช้เครื่องมือหรือคำสั่งในโปรแกรมเพื่อบอกระยะทางและพื้นที่ได้

๖.๓.๒ การวิเคราะห์ข้อมูลเชิงบรรยาย (Analysis of Non-Spatial Data)

ในการประมวลผลข้อมูลในระบบสารสนเทศภูมิศาสตร์ เราจะใช้การแก้ไขข้อมูล ตรวจสอบความถูกต้อง และวิเคราะห์ผล ข้อมูลเชิงบรรยาย ซึ่งกระบวนการนี้ดูคล้ายกับกระบวนการวิเคราะห์ผลในรูปแบบดั้งเดิม ซึ่งอาศัยกระบวนการฐานข้อมูลและสถิติ

ก) การแก้ไขข้อมูลเชิงบรรยาย (Attribute Editing Function) จะสามารถเรียกค้น ตรวจสอบและเปลี่ยนแปลงข้อมูลสามารถเพิ่มหรือลบข้อมูลได้ รวมถึงการเชื่อมต่อตารางและรวมให้เป็นตารางเดียวกันได้

รูปที่ 6.3 การแก้ไขและการเชื่อมความสัมพันธ์ตาราง

ข) การสอบถามข้อมูลเชิงบรรยาย (Attribute Query Function) เป็นการเรียกค้นข้อมูลในฐานข้อมูลที่เกี่ยวข้องกับเงื่อนไขที่ผู้ใช้ตั้งคำถามแล้วสอบถามโดยใช้วิธีการต่างๆ เช่น

*** การเรียกค้นข้อมูลอย่างง่าย เช่น การค้นหาข้อมูลตามลำดับชั้น หรือ polygon ที่เลือก

*** การสอบถามข้อมูลเชิงซ้อน เช่น การค้นหาทางเลือกจากข้อมูลเชิงบรรยายที่มีอยู่จำนวนชุดข้อมูลหนึ่งหรือมากกว่า

*** กระบวนการที่ใช้ในการเรียกค้นข้อมูลที่เชื่อมโยงกัน เช่น กระบวนการ relation-join

รูปที่ 6.4 การสอบถามข้อมูลโดยตั้งเงื่อนไข

ค) กระบวนการทางสถิติ (Attribute Statistic Function) คำนวณค่าทางสถิติจากตารางข้อมูล เช่น mean, standard deviation, minimum, maximum, correlation etc.

-คำนวณค่าทางสถิติสามารถได้ตารางข้อมูลใหม่ และสามารถใช้ร่วมกับการสอบถามข้อมูล (query) และจัดเตรียมรายงานที่สมบูรณ์

รูปที่ 6.5 คำนวณค่าสถิติของข้อมูลเชิงคุณลักษณะ

๖.๓.๓ การวิเคราะห์ข้อมูลเชิงพื้นที่ร่วมกับข้อมูลเชิงบรรยาย (Integrated Analysis of the Spatial and Non-Spatial Data)

การวิเคราะห์ข้อมูลเชิงบรรยายร่วมกับข้อมูลเชิงพื้นที่จะทำให้ ระบบสารสนเทศมีประสิทธิภาพสูงมากขึ้น และระบบสารสนเทศภูมิศาสตร์อาจใช้งานร่วมกับโปรแกรมประยุกต์อื่นๆ ซึ่งจะทำให้การทำงานบนระบบสารสนเทศภูมิศาสตร์มีความสมบูรณ์มากยิ่งขึ้น

ก) การเรียกค้นข้อมูล, การแบ่งกลุ่มข้อมูล และการวัด (Data retrieval, Classification and Measurement)

ในกระบวนการนี้เป็นการทำงานร่วมกันกับข้อมูลเชิงพื้นที่และข้อมูลเชิงบรรยาย คือเมื่อเราทำการเปลี่ยนแปลงหรือดัดแปลงข้อมูลเชิงบรรยายแล้ว ทำให้ตำแหน่งที่ตั้งหรือข้อมูลเชิงพื้นที่จะถูกสร้างขึ้นมาใหม่ด้วย

1) การเรียกค้นข้อมูล (Retrieval)

� การเรียกค้นข้อมูลเกี่ยวข้องกับการค้นหาทางเลือก การดัดแปลงแก้ไข และผลลัพธ์ข้อมูลจะไม่มีการดัดแปลงรูปแบบใดๆ เลย

� การค้นหาข้อมูลมาตรฐาน (Standard Query Language-SQL)

� SQL เป็นมาตรฐานที่ใช้กันในฐานข้อมูลที่เชื่อมโยงกัน และใช้ในด้าน GIS

� การค้นหาทางเลือกจากฐานข้อมูลที่มีอยู่หลายชั้น การใช้ Boolean Logic มักจะใช้เป็นหลักในการทำงานข้อมูลเชิงบรรยาย และข้อมูลเชิงพื้นที่

� การเรียกค้นข้อมูลสามารถเลือกพื้นที่ที่ต้องการ และแสดงผลลัพธ์จากที่สืบค้นข้อมูลจากตารางข้อมูลเชิงบรรยาย ในแต่ละ record หรือผลลัพธ์จากการสอบถามจากแผนที่ที่ถูกเลือกในฐานข้อมูล

� การเรียกค้นข้อมูลแบบซับซ้อน (เช่น ค้นหาตำแหน่งที่ตั้งของบ้านภายในระยะทาง 2 กิโลเมตรจากร้านค้า) เป็นการใช้วิธี Boolean Logic ร่วมกับการซ้อนทับข้อมูล (Overlay)

2) การแบ่งกลุ่มข้อมูล (Classification)

� เป็นกระบวนในการจัดกลุ่มของสิ่งที่มีลักษณะเดียวกัน หรือที่เรียกว่า Classification

� หลังจากที่มีการแบ่งกลุ่มใหม่แล้ว เราจะต้องการรวมแผนที่ที่มีรายละเอียดในส่วนที่แบ่งเหมือนกันให้เป็นชิ้นเดียวกัน เราเรียกกระบวนการนั้นว่า Generalization หรือ Map Dissolve

� กระบวนการแบ่งกลุ่มข้อมูลนี้มักจะใช้ข้อมูลเชิงบรรยายในการทำงานเป็นส่วนใหญ่ เช่นเลือกกลุ่มที่มีการใช้ที่ดินประเภท “ที่รกร้างว่างเปล่า” และต้องห่างจากถนน “มากกว่า 500เมตร” ให้จัดกลุ่มเป็น “เหมาะสมต่อการตั้งโรงงานมากที่สุด” เป็นต้น

� การพิจารณาแผนที่ชุดดิน : เราจะสร้างแผนที่ชุดดินหลักจากชั้นข้อมูล (layer) ซึ่งมีพื้นที่อยู่มากมาย ที่ถูกแบ่งตามลักษณะโดยรวม เราอาจทำการจัดกลุ่มใหม่ (reclassify) และลบขอบเขต (Dissolve) และการรวมข้อมูล (Merge)

1. Reclassify การจัดกลุ่มข้อมูลใหม่ โดยการใช้ข้อมูลเชิงบรรยายอันใดอันหนึ่งหรือหลายอันรวมกัน เช่น การจัดกลุ่มพื้นที่ชุดดินโดยอาศัยชนิดของดินเท่านั้น

2. Dissolve การลบขอบเขตระหว่างพื้นที่ที่เป็นชนิดเดียวกันโดยการลบเส้น (arc) ระหว่างสอง polygon ที่เป็นข้อมูลกลุ่มเดียวกัน หรือข้อมูลเชิงบรรยายที่ถูกจัดกลุ่มให้เป็นกลุ่มเดียวกัน

3. Merge การรวมข้อมูลพื้นที่เข้าด้วยกันให้เป็นพื้นที่ขนาดใหญ่ขึ้นโดยการให้รหัสหรือค่าใหม่ตามลำดับของเส้นซึ่งมีขอบเขตเชื่อมต่อกัน (เช่น การสร้าง topology ใหม่) และให้ค่า ID ใหม่ทุกๆ polygon

รูปที่ 6.6 การรวมข้อมูลเชิงพื้นทีเข้าด้วยกัน

3) การวัด (Measurement)

โดยปกติการวัดมักจะเกี่ยวข้องกับข้อมูลเชิงพื้นที่ แต่การแสดงผลของการวัดสามารถเก็บไว้ในฐานข้อมูลใหม่หรือกลุ่มใหม่ได้

บทที่ 6 : 6.1การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

บทที่ 6 การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

6.1การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์ บทที่ ๖

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS DATA ANALYSIS)

๖.๑ บทนำ

การวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์ เป็นหลักที่สำคัญอันหนึ่งที่ทำให้ระบบสารสนเทศภูมิศาสตร์แตกต่างจากโปรแกรมอื่นๆ ที่ใช้ในการจัดทำแผนที่เพียงอย่างเดียว หรือจัดทำฐานข้อมูลเพียงอย่างเดียว ซึ่งในระบบสารสนเทศภูมิศาสตร์นั้นจะใช้รายละเอียดข้อมูลทั้งที่เป็นข้อมูลเชิงพื้นที่ (Spatial data) และข้อมูลเชิงบรรยาย (Non-spatial data) มาใช้ในการวิเคราะห์

การวิเคราะห์เชิงพื้นที่ ในระบบสารสนเทศทางภูมิศาสตร์ เป็นวิธีหนึ่งที่เปิดโอกาสให้นักวิเคราะห์ GIS (GIS Analyst) สามารถศึกษาหาความสัมพันธ์ทางพื้นที่ (Spatial Relationship) ของข้อมูลเดิม เพื่อสร้างข้อมูลใหม่ ตามเงื่อนไขต่างๆ เช่น ต้องการทราบว่าพื้นที่ใดที่เหมาะสมต่อการปลูกป่า โดยมีเงื่อนไขว่าต้องเป็นพื้นที่ที่ตั้งอยู่ในเขตป่าอนุรักษ์ หรือพื้นที่ที่มีความสูงชัน และถูกบุกรุกแผ้วถาง เป็นต้น ซึ่งจากตัวอย่างนี้ สังเกตได้ว่านักวิเคราะห์ GIS ต้องศึกษาความสัมพันธ์ของข้อมูลเชิงพื้นที่ 3 ข้อมูล คือ ป่าอนุรักษ์ การใช้ที่ดิน และความลาดชัน ซึ่งจะแตกต่างจากการเรียกค้นข้อมูล (Query) ที่เป็นการเรียกค้นข้อมูลจาก Theme เดียว

ในการวิเคราะห์ข้อมูลในระบบสารสนเทศภูมิศาสตร์นั้น เป็นการนำหลักการหรือวิธีการต่างๆ มาประยุกต์ใช้ในการเปลี่ยนแปลงรูปแบบของข้อมูล หรือค่าของกริดที่มีอยู่ให้สามารถนำไปผสมผสานกับข้อมูลอื่นๆ ในขบวนการของการวิเคราะห์ข้อมูล เพื่อความสะดวกรวดเร็วและความถูกต้องของผลลัพธ์ที่ต้องการได้ดียิ่งขึ้น

รายละเอียดข้อมูลในระบบสารสนเทศภูมิศาสตร์สามารถตอบคำถามที่เกี่ยวข้องกับสถานที่ตั้ง เช่น ที่ไหน? (Where) ในส่วนการวิเคราะห์ข้อมูลระบบสารสนเทศภูมิศาสตร์ (GIS Data Analysis) จะตอบได้ว่า “ทำไมถึงอยู่ที่นั้น” (Why is it there?) ระบบสารสนเทศภูมิศาสตร์ยังสามารถอธิบายในรูปแบบตัวเลข และรวมถึงภาพ จะทำให้สะดวกในการวิเคราะห์แบบจำลอง (model) วิเคราะห์ผลคาดการณ์ทั้งรูปแบบแผนที่และข้อมูลสารสนเทศ

แต่ปัจจัยความสำเร็จของ GIS ไม่ได้อยู่ที่ตัวระบบเอง GIS ไม่ได้ทำงานทุกอย่างได้อย่างถูกต้อง แต่ GIS ต้องอาศัยบุคลากรทางด้าน GIS เป็นสิ่งสำคัญที่ช่วยลดความผิดพลาดในการนำเข้าข้อมูลสู่ฐานข้อมูล และความละเอียดของข้อมูลที่นำเข้าเช่นมาตราส่วนแผนที่ GIS ไม่สามารถตอบคำถามได้เองว่าพื้นที่ที่เลือกนั้นเหมาะสมหรือไม่ แต่ต้องอาศัยบุคลากรหรือผู้เชี่ยวชาญในแต่ละด้านที่จะตอบได้ว่าการวิเคราะห์ข้อมูลในรูปแบบต่างๆ นั้นได้คำตอบถูกต้องตามหลักวิชาการมากน้อยเพียงใด เพราะ GIS ไม่สามารถคิดและมีชีวิตจิตใจเหมือนมนุษย์

๖.๒ รูปแบบของการวิเคราะห์ระบบสารสนเทศภูมิศาสตร์

๖.๒.๑ ระบบสารสนเทศภูมิศาสตร์และระบบสารสนเทศอื่นๆ

ระบบสารสนเทศภูมิศาสตร์มีความแตกต่างจากระบบสารสนเทศอื่นๆ คือ ระบบสารสนเทศภูมิศาสตร์สามารถทำงานและวิเคราะห์ข้อมูลเชิงแผนที่ได้ ในการวิเคราะห์ข้อมูลอาจใช้ข้อมูลเชิงแผนที่ และข้อมูลเชิงบรรยายในระบบฐานข้อมูลของ GIS เพื่อให้ได้คำตอบที่อ้างอิงบนพิกัดภูมิศาสตร์ได้ แต่ในขณะที่ระบบสารสนเทศจะสามารถวิเคราะห์ข้อมูลในฐานข้อมูล ในเชิงสถิติหรืออื่นๆ แต่ไม่สามารถบ่งบอกตำแหน่งพิกัดภูมิศาสตร์ได้

ผลลัพธ์ของการวิเคราะห์ด้วยระบบ GIS สามารถแสดงผลในรูปแบบข้อมูลเชิงพื้นที่ หรือข้อมูลคำอธิบาย และเห็นภาพรวมที่สามารถเชื่อมโยงความสัมพันธ์ของข้อมูล และสามารถอธิบายได้อย่างชัดเจนถึงปรากฎการณ์ที่เกิดขึ้น หรือคำตอบที่ต้องนำไปใช้ในการตัดสินใจ

๖.๒.๒ การวิเคราะห์ด้วย GIS และการวิเคราะห์ข้อมูลแบบดั้งเดิม

การวิเคราะห์ข้อมูล GIS แตกต่างจากทางสถิติ เพราะ GIS สามารถทำงานโดยอาศัยคุณสมบัติทางแผนที่ของข้อมูล และผลลัพธ์ที่สามารถแทนด้วยแผนที่เพื่อการวิเคราะห์ด้วยสายตา (Visual Analysis)

ระบบสารสนเทศภูมิศาสตร์สามารถให้ผลลัพธ์ในรูปแแผนที่โดยใช้ระบบพิกัด โดยใช้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ให้มีความสัมพันธ์กับข้อมูลเชิงพื้นที่ ระบบสารสนเทศภูมิศาสตร์สามารถนำค่าจากสถิติมาใช้ร่วมกับระบบ GIS ได้และแสดงผลออกมาในรูปแบบแผนที่

การวิเคราะห์เชิงพื้นที่ (spatial analysis) เมื่อเปรียบเทียบกับ “การทำแผนที่” (map) การวิเคราะห์เชิงพื้นที่จะสามารถใช้ข้อมูลที่หลากหลายกว่า เพื่อใช้ในการวิเคราะห์และคาดการณ์อนาคต หรือสร้างผลลัพธ์ในรูปแผนที่ที่เรายังคาดการณ์ไม่ถึง เช่น การใช้แบบจำลอง (model) สามารถช่วยอธิบายและคาดการณ์หลังจากการวิเคราะห์ GIS

การประมวลผลทางสถิติของ GIS โดยส่วนใหญ่จะใช้การเรียกค้นข้อมูลและดัดแปลงข้อมูล เช่น การทำ Buffer และการกระจายตัว หรือ การจัดกระทำกับข้อมูลเชิงบรรยายด้วยคำสั่งตรรกศาาตร์

ระบบสารสนเทศภูมิศาสตร์ จะมีงานหลักคือจะสร้างกลุ่มข้อมูลทางสถิติเชิงพื้นที่ และมีเครื่องมือในการสืบค้นหาความสัมพันธ์เชิงพื้นที่ และสำหรับการทำแบบจำลองเพื่อใช้ทำงานร่วมกันใน GIS

บทที่ 5 : 5.6 การพัฒนาฐานข้อมูลของระบบสารสนเทศทางภูมิศาสตร์

5.6การพัฒนาฐานข้อมูลของระบบสารสนเทศทางภูมิศาสตร์ บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๖ การพัฒนาฐานข้อมูลของระบบสารสนเทศทางภูมิศาสตร์

ในองค์กรที่มีการใช้งานฐานข้อมูลโดยทั่วไป การจะใช้งานฐานข้อมูลได้อย่างมีประสิทธิภาพและตรงกับความต้องการของผู้ใช้นั้น ย่อมจะต้องมาจากการออกแบบฐานข้อมูลที่มีการวางแผนมาเป็นอย่างดี โดยจะต้องมีการพัฒนาระบบฐานข้อมูลตามขั้นตอนที่ถูกต้อง ซึ่งการพัฒนาระบบสารสนเทศ เป็นกระบวนการจัดการข้อมูลดิบให้เป็นสารสนเทศซึ่งอยู่ในรูปแบบที่นำมาใช้ประโยชน์ได้สะดวก โดยมีกระบวนการดังต่อไปนี้

๕.๖.๑ ขั้นตอนการพัฒนาระบบฐานข้อมูล

ในการพัฒนาฐานข้อมูลเพื่อสร้างระบบสารสนเทศ โดยทั่วไปนั้นจะมีวงจรในการพัฒนา ซึ่งเป็นขั้นตอนที่มีการทำงานเป็นลำดับตั้งแต่ต้นจนกระทั่งสามารถสร้างระบบสารสนเทศออกมาได้ และเป็นขั้นตอนที่ผู้พัฒนาระบบซึ่งอาจประกอบด้วยผู้จัดการโครงการ นักวิเคราะห์ระบบ (System Analyst) และผู้ออกแบบฐานข้อมูล (DBA) จะต้องร่วมกันศึกษาและทำความเข้าใจในแต่ละขั้นตอน ซึ่งโดยทั่วไปแล้วขั้นตอนในการพัฒนาระบบจะมีอยู่ด้วยกัน 3 ขั้นตอนดังต่อไปนี้

1) การวิเคราะห์ปัญหา (Problem Analysis)

เป็นขั้นตอนการวิเคราะห์ปัญหาของระบบงานเดิม เมื่อผู้บริหารขององค์กรมีความต้องการที่จะสร้างระบบสารสนเทศขึ้น เนื่องจากความล้าหลังของระบบงานเดิม หรือการไม่มีประสิทธิภาพเพียงพอของระบบงานเดิมที่จะตอบสนองความต้องการในปัจจุบันได้ ตัวอย่างเช่น ระบบงานเดิมไม่สามารถให้ข้อมูลข่าวสารว่าสินค้าใดของบริษัทใดที่มียอดขายสูงที่สุด หรือการจัดกลุ่มลูกค้า เพื่อดูสถิติว่าสินค้าชนิดหนึ่งเป็นที่สนใจในลูกค้ากลุ่มใด เพื่อนำสารสนเทศที่ได้มาใช้ในการวางแผนและการตัดสินใจ

2) การศึกษาความเป็นไปได้ (Feasibility Study)

หลังจากที่ทราบปัญหาของระบบงานเดิมแล้ว ขั้นตอนต่อไปคือการศึกษาความเป็นไปได้ ว่าการสร้างระบบสารสนเทศ หรือการแก้ไขระบบสารสนเทศเดิมมีความเป็นไปได้หรือไม่ ซึ่งจะมีการศึกษาความเป็นไปได้ ในด้านต่างๆ ดังนี้

� ความเป็นไปได้ของเทคโนโลยี (Technological Feasibility)

การศึกษาระบบงานเดิมมีอุปกรณ์ทางด้านฮาร์ดแวร์และซอฟท์แวร์เพียงพอที่จะรองรับสารสนเทศที่จะเกิดขึ้นได้หรือไม่ ถ้าไม่เพียงพอหรือยังไม่มีก็ต้องวิเคราะห์ได้ว่าควรจะมีการจัดซื้อฮาร์ดแวร์และซอฟท์แวร์ประเภทใดเพิ่มเติม หรือถ้ามีอยู่แล้วก็จะต้องวิเคราะห์ถึงความสามารถของฮาร์ดแวร์และซอฟท์แวร์ดังกล่าว ว่ามีความสามารถอยู่ในระดับใด เพียงพอที่จะใช้สร้างระบบสารสนเทศได้หรือไม่ เป็นต้น

� ความเป็นไปได้ทางด้านการปฎิบัติการ (Operation Feasibility)

เป็นการวิเคราะห์ว่าระบบงานเดิมมีบุคลากรที่มีความสามารถหรือมีประสพการณ์ในการพัฒนาและติดตั้งระบบหรือไม่ ถ้าไม่มีจะหาได้หรือไม่ นอกจากนี้ยังต้องพิจารณาด้วยว่าผู้ใช้ระบบมีความคิดเห็นอย่างไรกับการเปลี่ยนแปลงของระบบที่จะเกิดขึ้น

� ความเป็นไปได้ทางเศรษฐศาสตร์ (Economic Feasibility)

เป็นการศึกษาค่าใช้จ่ายต่างๆ ที่จะเกิดขึ้นตั้งแต่เริ่มต้นพัฒนาระบบจะกระทั่งมีการติดตั้งและใช้งานระบบจริง รวมไปถึงค่าใช้จ่ายประจำวันที่จะเกิดขึ้นด้วย นอกจากนี้ยังต้องทำการคาดการณ์ถึงผลประโยชน์ที่จะได้รับ รวมทั้งเวลาที่จะต้องใช้ในการพัฒนาระบบ เพื่อจะนำข้อมูลที่ได้มาสรุปว่าคุ้มค่าหรือไม่ ที่จะมีการเปลี่ยนแปลงระบบเกิดขึ้น ซึ่งในการนี้ผู้บริหารจะเป็นผู้ตัดสินใจเองว่าสมควรจะให้ดำเนินการพัฒนาต่อไปหรือจะยกเลิกโครงการพัฒนาดังกล่าว

3) การพัฒนาระบบสารสนเทศทางภูมิศาสตร์

หลังจากศึกษาความเป็นไปได้ของระบบ และผู้บริหารเห็นสมควรที่จะให้ดำเนินการพัฒนาต่อ ขั้นตอนต่อไปคือการวิเคราะห์ความต้องการของผู้ใช้ (User Requirement) และการศึกษาสถานภาพของระบบสารสนเทศทางภูมิศาสตร์ที่มีใช้อยู่ในปัจจุบัน (Existing System) เพื่อให้เกิดแนวทางในการพัฒนาระบบสารสนเทศทางภูมิศาสตร์ของหน่วยงาน โดยมีกระบวนการดังกล่าวมีขั้นตอนสำคัญดังนี้

� ขอบเขตของฐานข้อมูลที่จะสร้าง

จาการวิเคราะห์ความต้องการของข้อมูลสารสนเทศขององค์กร ผู้ออกแบบต้องทราบว่าระบบฐานข้อมูลที่สร้างขึ้นนั้น จะนำมาใช้ช่วยงานทางด้านใดขององค์กร และมีความสามารถที่จะทำงานเกี่ยวกับอะไรบ้าง ฐานข้อมูลนั้นจะเป็นแบบฐานข้อมูลรวม (Centralized Database) หรือเป็นฐานข้อมูลแบบกระจาย (Distributed Database)

� ความสามารถของโปรแกรมประยุกต์ที่จะสร้างขึ้น

ความสามารถในการทำงานของโปรแกรมประยุกต์ทำงานด้านใดบ้าง เช่น

– การนำเสนอรูปแบบของผลลัพธ์

– รูปแบบการคำนวณ หรือประมวลผลข้อมูลมีขั้นตอนวิธีการอย่างไร

– กฎเกณฑ์ข้อบังคับต่างๆ

– การควบคุมความคงสภาพของข้อมูล

� อุปกรณ์ทางด้านฮาร์ดแวร์และซอฟท์แวร์ที่จะมีการใช้

ความสามารถของฮาร์ดแวร์และซอฟท์แวร์นั้นๆ จะมีราคาสูงขึ้นไปตามลำดับ

� การวางแผนระยะเวลาในการทำงาน

เพื่อให้การดำเนินงานสามารถบรรลุตามระยะเวลาที่ได้ตั้งไว้

๕.๖.๒ แนวทางการพัฒนาระบบสารสนเทศ

หลังจากนั้นก็นำมาพัฒนาระบบสารสนเทศโดยอาศัยแนวทางดังนี้

1. กำหนดวัตถุประสงค์ และกลุ่มผู้ใช้ (Objective Formulation and Users Identification)

2. การศึกษาเบื้องต้น (Preliminary Study) ซึ่งประกอบด้วย การศึกษาความต้องการใช้ระบบสารสนเทศของผู้ใช้ (User Requirement) และการศึกษาสถานภาพของระบบสารสนเทศที่มีใช้อยู่ในปัจจุบัน (Existing System)

3. การวิเคราะห์ระบบ (System Analysis) เป็นการวิเคราะห์เพื่อที่จะหาข้อสรุปเกี่ยวกับโครงสร้างของระบบสารสนเทศที่จะต้องพัฒนาขึ้น

4. การออกแบบระบบ (System Design) เป็นขั้นตอนดำเนินงานเพื่อให้ได้ระบบสารสนเทศตามโครงสร้างที่กำหนด

5. การพัฒนาระบบ (Construction) เป็นการดำเนินการตามขั้นตอนและกระบวนการที่ได้ออกแบบระบบไว้ ซึ่งประกอบด้วย การจัดหาโปรแกรม การทดสอบ และการปรับปรุงโปรแกรม และจัดทำคู่มือใช้งาน

การดำเนินงานเพื่อพัฒนาระบบสารสนเทศทางภูมิศาสตร์ของหน่วยงาน จะต้องทำการศึกษาและเข้าใจถึงภารกิจหลักขององค์กร เพื่อให้ออกแบบระบบให้สอดคล้องกับการดำเนินงาน เพื่อให้เกิดการนำระบบสารสนเทศทางภูมิศาสตร์ไปใช้ได้เกิดประสิทธิผลสูงสุด และสามารถตัดสินใจในการดำเนินงานต่างๆ ได้อย่างมีประสิทธิภาพยิ่งขึ้น

ดังนั้นระบบสารสนเทศทางภูมิศาสตร์ที่ได้พัฒนาขึ้นมาจะสามารถเชื่อมโยงระบบฐานข้อมูลที่แสดงคุณลักษณะต่างๆ ในรูปแบบแผนที่และคำอธิบาย

ในลักษณะการประยุกต์ใช้งานกับการจัดการฐานข้อมูลจริงในปัจจุบัน สำหรับหน่วยงานที่ไม่ใหญ่มากนักเราสามารถจัดเตรียมฐานข้อมูลอย่างง่ายๆ ด้วยโปรแกรมที่เรามีอยู่แล้วจึงจะเรียนรู้ในกระบวนการที่จะนำเข้าไปสัมพันธ์กับ GIS เช่น เราสามารถใช้โปรแกรม Microsoft Excel หรือ Microsoft Access เพื่อใช้ในการเก็บข้อมูลของหน่วยงานของเรา ซึ่งเราสามารถที่จะนำมาใช้ประโยชน์ได้ต่อไปในอนาคต ความยากของการจัดการฐานข้อมูลคือ การออกแบบโครงสร้างฐานข้อมูลว่าจะจัดเก็บอยู่ในลักษณะใด เช่น รูปแบบตาราง เป็นต้น และนอกจากนี้จะต้องมีคู่มือประกอบแฟ้มข้อมูลนั้นๆ ด้วยเพื่อประโยชน์ในการค้นหาข้อมูลในอดีตได้ง่ายขึ้น หากเราจัดทำได้สมบูรณ์ต่อไปเราก็สามารถที่จะเรียกใช้ประโยชน์จากข้อมูลเหล่านั้นได้

บทที่ 5 : 5.5 ส่วนประกอบของ DBMS

5.5ส่วนประกอบของ DBMS บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๕ ส่วนประกอบของ DBMS

ในการใช้ข้อมูลในฐานข้อมูลจะต้องมีการสอบถามหรือค้นหาคำตอบ รวมถึงการเพิ่มและการลบข้อมูล ซึ่งโดยทั่วไปผู้ใช้ไม่จำเป็นต้องทราบวิธีการในการจัดเก็บข้อมูล แต่ผู้ใช้จะต้องศึกษาภาษาที่ใช้ในการค้นหาข้อมูลจากฐานข้อมูล โดยผ่านทางระบบการจัดการฐานข้อมูล (DBMS)

1) ภาษา SQL (Structured Query Language)

เป็นภาษาที่รูปแบบเป็นภาษาอังกฤษ ง่ายต่อการเรียนรู้และการเขียนโปรแกรม ซึ่งเป็นภาษาที่มีอยู่ใน DBMS หลายตัว มีความสามารถใช้นิยามโครงสร้างตารางภายในฐานข้อมูล การจัดการข้อมูล รวมไปถึงการควบคุมสิทธิการใช้งานฐานข้อมูล SQL จะประกอบด้วยภาษา 3 รูปแบบด้วยกัน แต่ละแบบก็จะมีหน้าที่เฉพาะแตกต่างกันไปดังต่อไปนี้

รูปที่ 5.14 โครงสร้างภาษา SQL

2) ภาษาสำหรับนิยามข้อมูล (Data Definition Language – DDL)

เป็นภาษาที่ใช้นิยามโครงสร้างของฐานข้อมูล เพื่อทำการสร้าง เปลี่ยนแปลงหรือยกเลิกโครงสร้างของฐานข้อมูลตามที่ได้ออกแบบไว้ ซึ่งโครงสร้างของฐานข้อมูลนี้จะสามารถเรียกได้อีกอย่างว่า สคีมา (Schema) ดังนั้น DLL จึงเป็นภาษาที่ใช้ในการสร้างสคีมานั่นเอง ตัวอย่างเช่นจะเป็นการกำหนดว่าฐานข้อมูลที่สร้างมีชื่อว่าอะไร มีโครงสร้างที่ประกอบด้วยตารางที่ชื่ออะไรบ้าง แต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง เขตข้อมูลแต่ละตัวมีประเภทของข้อมูลเป็นอะไร มีความกว้างของข้อมูลเท่าใด แต่ละตารางมีการอินเด็กซ์ (INDEX) ช่วยในการค้นหาข้อมูลหรือไม่ ถ้ามีจะใช้เขตข้อมูลใดบ้างที่เป็นคีย์ เป็นต้น

ตัวอย่างของภาษา DDL เช่น

� คำสั่งการสร้าง(CREATE) ได้แก่การสร้างตาราง และการสร้างดัชนี

� คำสั่งเปลี่ยนโครงสร้างตาราง(ALTER)

� คำสั่งยกเลิก(DROP) ได้แก่การยกเลิกโครงสร้างตาราง และการยกเลิกโครงสร้างดัชนี

3) ภาษาสำหรับการจัดการข้อมูล (Data Manipulation Language-DML)

องค์ประกอบของภาษาในรูปแบบที่ 2 ของภาษา SQL ซึ่ง DML เป็นภาษาที่ใช้จัดการข้อมูลภายในตารางของฐานข้อมูล ตัวอย่างของภาษา DML เช่น

� คำสั่งการเรียกค้นระเบียนข้อมูล(SELECT)

� คำสั่งการเพิ่มระเบียนข้อมูล(INSERT)

� คำสั่งการเปลี่ยนแปลงระเบียนข้อมูล(UPDATE)

� คำสั่งลบระเบียนข้อมูล(DELETE)

รูปแบบของภาษาที่เป็น DML นี้จะถูกจัดอยู่ในกลุ่มของภาษาในยุคที่ 4 ที่มีความง่ายต่อการเขียนและการทำความเข้าใจมากกว่าภาษาในยุคที่ 3 เช่น COBOL หรือ C

ดังนั้นจะเห็นว่า DDL จะเป็นภาษาที่ใช้กำหนดโครงสร้างของฐานข้อมูล แต่ DML จะเป็นภาษาที่ใช้จัดการกับข้อมูลที่อยู่ภายในโครงสร้างนั้น

DBMS บางตัวจะมีภาษาการจัดการข้อมูลเป็นของตนเองเช่น dBASE IV, FoxPro, R:BASE ฯลฯ แต่มีการปรับปรุงเพิ่มเติม SQL เข้าไปด้วยในเวอร์ชั่นปัจจุบัน และมีDBMS หลายตัวจะมีภาษาที่เรียกว่า QBE (Query By Example) และ QUEL (Query Language) รวมอยู่ด้วยซึ่งเป็นรูปแบบของภาษาการเรียกค้นข้อมูลได้อย่างง่ายอีกแบบหนึ่ง นอกจากนี้ DBMS หลายตัวอนุญาตให้ซอฟต์แวร์ประยุกต์บางตัวที่เขียนด้วยภาษาในยุคที่ 3 เช่น COBOL สามารถใช้คำสั่งการจัดการข้อมูลที่มีอยู่ใน SQL เขียนร่วมอยู่ในภาษายุคที่ 3 นั้นได้(Embeded SQL) เพื่อให้การเขียนโปรแกรมที่เกี่ยวกับการจัดการข้อมูลทำได้ง่ายขึ้น

4) ภาษาสำหรับการควบคุมข้อมูล (Data Control Language-DCL)

เป็นส่วนของภาษาที่ใช้ควบคุมความถูกต้องของข้อมูล และ ควบคุมความปลอดภัยของข้อมูล ทำการป้องกันการเกิดเหตุการณ์ที่ User หลายคนเรียกใช้ข้อมูลพร้อมกัน โดยจะทำหน้าที่ควบคุมความถูกต้องของการใช้ข้อมูลและทำการลำดับการใช้ข้อมูลของ User แต่ละคน และตรวจสอบสิทธิ์ในการใช้ข้อมูลนั้นๆ
GRANT คือการให้สิทธิในการเข้าถึงข้อมูล
REVOKE คือการยกเลิกสิทธิในการเข้าถึงข้อมูล

บทที่ 5 : 5.4ประเภทโครงสร้างของฐานข้อมูล

5.4ประเภทโครงสร้างของฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๔ ประเภทโครงสร้างของฐานข้อมูล

ข้อมูลในฐานข้อมูลโดยทั่วไปจะถูกสร้างให้มีโครงสร้างที่ง่ายต่อความเข้าใจและการใช้งานของผู้ใช้ โดยทั่วไปแล้วฐานข้อมูลที่มีใช้อยู่ในปัจจุบันจะมีโครงสร้าง 3 แบบด้วยกัน คือ ฐานข้อมูลแบบลำดับขั้น (Hierarchical Database) ฐานข้อมูลแบบเครือข่าย (Network Database) และฐานข้อมูลแบบเชิงสัมพันธ์ (Relational Database)

๕.๕.๑ ฐานข้อมูลแบบลำดับขั้น (Hierarchical Database)

เป็นลักษณะของฐานข้อมูลที่มีความสัมพันธ์ของข้อมูลเป็นแบบหนึ่งต่อหนึ่ง หรือ แบบหนึ่งต่อกลุ่ม แต่จะไม่มีความสัมพันธ์แบบกลุ่มต่อกลุ่มในฐานข้อมูลแบบนี้

ลักษณะโครงสร้างของฐานข้อมูลแบบลำดับขั้นนี้ จะมีลักษณะคล้ายต้นไม้ที่คว่ำหัวลง จึงอาจเรียกโครงสร้างฐานข้อมูลแบบนี้ได้อีกแบบว่าเป็น โครงสร้างแบบต้นไม้ (Tree Structure) โดยจะมีระเบียนที่อยู่แถวบนซึ่งจะเรียกว่าเป็น ระเบียนพ่อแม่ (Parent record) ระเบียนในแถวถัดลงมาจะเรียกว่า ระเบียนลูก (Child record) ซึ่งระเบียนพ่อแม่จะสามารถมีระเบียนลูกได้มากกว่าหนึ่งระเบียน แต่ระเบียนลูกแต่ละระเบียนสามารถมีระเบียนพ่อแม่ได้เพียงหนึ่งระเบียนเท่านั้น

รูปที่ 5.10 ฐานข้อมูลแบบลำดับขั้นในระบบ GIS

รูปที่ 5.11 โครงสร้างฐานข้อมูลแบบลำดับขั้น

การค้นคืนข้อมูลในฐานข้อมูลแบบลำดับขั้น จะต้องทำเป็นลำดับชั้นตามโครงสร้าง คือ

ถ้าต้องการสอบถามข้อมูลโรงงานในแต่ละอำเภอว่ามีตำบลอะไรบ้าง จะต้องสอบถามเป็นลำดับขั้น ซึ่งสามารถสอบถามในครั้งเดียว เนื่องจากเอนติตี้ของตำบล เชื่อมโยงโดยตรงกับเอนติตี้อำเภอนั่นเอง แต่ เมื่อต้องการสอบถามข้อมูลโรงงานในแต่ละอำเภอว่ามีโรงงานอะไรบ้าง จำนวนเท่าไร จะต้องสอบถามเป็นลำดับขั้น ไม่สามารถสอบถามในครั้งเดียว เนื่องจากเอนติตี้ของโรงงานอุตสาหกรรม ไม่ได้เชื่อมโยงโดยตรงกับเอนติตี้อำเภอนั่นเอง ซึ่งทำให้ประสิทธิภาพในการสอบถามข้อมูลลดลง คือ

ขั้นแรก จะต้องสอบถามว่าในอำเภอหนองเสือ (2807) มีตำบลใดบ้าง จากตารางขอบเขตอำเภอ

ขั้นที่สอง สอบถามว่าในตำบลที่เลือกไว้แล้วนั้นมีโรงงานใดอยู่ในตำบลดังกล่าวบ้าง จากตารางตำบลซึ่งเชื่อมโยงกับโรงงานอุตสาหกรรมนั่นเอง

การสอบถามหรือค้นคืนข้อมูลจากฐานข้อมูลแบบลำดับขั้นจึงขาดประสิทธิภาพ หรือลดความรวดเร็วในการสอบถาม เนื่องจากมีเอนติตี้ระหว่างกลาง (Intermediate entity)

๕.๕.๒ ฐานข้อมูลแบบเครือข่าย (Network Database)

ข้อมูลภายในฐานข้อมูลแบบนี้สามารถมีความสัมพันธ์กันแบบใดก็ได้ เช่นอาจเป็นแบบหนึ่งต่อหนึ่ง หนึ่งต่อกลุ่ม หรือกลุ่มต่อกลุ่ม และไม่จำเป็นต้องมีลำดับชั้นที่สูงกว่า ซึ่งจะทำให้การค้นคืนข้อมูลเป็นไปได้โดยง่ายขึ้นกว่าแบบลำดับขั้น

รูปที่ 5.12 แสดงฐานข้อมูลแบบเครือข่าย

๕.๕.๓ ฐานข้อมูลแบบเชิงสัมพันธ์ (Relational Database)

ฐานข้อมูลเชิงสัมพันธ์เป็นฐานข้อมูลที่มีความนิยมใช้กันมากในปัจจุบัน ซึ่งสามารถใช้งานได้กับเครื่องคอมพิวเตอร์ทุกระดับตั้งแต่ไมโครคอมพิวเตอร์ จนกระทั่งถึงเมนเฟรมคอมพิวเตอร์ ฐานข้อมูลแบบนี้จะมีโครงสร้างข้อมูลต่างจากฐานข้อมูลสองแบบแรก กล่าวคือ ข้อมูลจะถูกเก็บอยู่ในรูปแบบของ ตาราง (Table) ซึ่งภายในตารางก็จะแบ่งออกเป็น แถว (Row) และ คอลัมน์ (Column) แต่ละตารางจะมีจำนวนแถวได้หลายแถวและจำนวนคอลัมน์ได้หลายคอลัมน์ แต่ละแถวสามารถเรียกได้อีกอย่างว่า ระเบียนหรือเรคคอร์ด (Record) คอลัมน์ในแต่ละคอลัมน์สามารถเรียกได้ว่า เขตข้อมูลหรือฟิลด์ (Field)

ฐานข้อมูลเชิงสัมพันธ์สามารถค้นคืนรายละเอียดด้วยการเชื่อมตารางต่างๆ ตั้งแต่ 2 ตารางขึ้นไป โดยการใช้คุณลักษณะของ Field ที่เหมือนกันที่อยู่ในทุกๆ ตาราง ซึ่งขั้นตอนหรือการเชื่อมความสัมพันธ์ระหว่างตารางนี้เรียก “การปฏิบัติการเชื่อมความสัมพันธ์” (Join Operation) และจะได้ตารางใหม่ที่ทำการเชื่อมข้อมูลแล้ว ซึ่งทำให้ได้ข้อมูลที่ต้องการได้ ซึ่งการค้นคืนในฐานข้อมูลเชิงสัมพันธ์นี้จะมีประสิทธิภาพอย่างมากเพราะช่วยให้เกิดความหลากหลายในการประยุกต์ใช้งานมากขึ้น

การปฏิบัติการเชื่อมความสัมพันธ์ระหว่างตารางจะจัดเก็บรวบรวมข้อมูลที่มีความเกี่ยวข้องกันให้อยู่ตารางเดียวกัน ซึ่งมีข้อดีคือทำให้สามารถค้นคืนข้อมูลได้ในเวลาอันรวดเร็วกว่าการจัดเก็บไว้ในหลายๆ ตาราง แต่มีข้อเสียคือการที่นำข้อมูลต่างๆ ที่สัมพันธ์กันมาไว้ในตารางเดียวกันก็จะทำให้ปริมาณข้อมูลที่จัดเก็บในตารางก็เพิ่มขึ้นด้วย

รูปที่ 5.13 แสดงฐานข้อมูลแบบเชิงสัมพันธ์

บทที่ 5 : 5.3ความสัมพันธ์ในฐานข้อมูล

5.3ความสัมพันธ์ในฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๓ ความสัมพันธ์ในฐานข้อมูล

ในการจัดเก็บข้อมูลในฐานข้อมูล จะจัดเก็บในรูปแบบตาราง ที่มีความสัมพันธ์กัน ในฐานข้อมูลสามารถสร้างความสัมพันธ์ของตารางได้โดยกำหนดให้ตารางที่มีคุณลักษณะเหมือนกันมาสร้างความสัมพันธ์กัน ปกติในแฟ้มข้อมูลที่จัดเก็บข้อมูลอยู่นั้นจะต้องประกอบด้วยชื่อแฟ้มข้อมูล (Entity) และหัวข้อเรื่อง หรือรายละเอียด (Attribute) เช่น

รูปที่ 5.5 โครงสร้างตารางในแฟ้มข้อมูล

ความสัมพันธ์ระหว่างข้อมูลประชาชนในระดับหมู่บ้าน เป็นความสัมพันธ์ที่ว่าบุคคลนั้นอยู่ในตำบลใด อำเภอใด จังหวัดใด การสร้างความสัมพันธ์นี้จะทำได้โดยการใส่รหัสหมู่บ้าน ซึ่งร่วมกันเป็น คีย์หลัก (Primary Key) ทำให้สืบค้นข้อมูลได้ง่าย และรวดเร็วยิ่งขึ้น

รูปที่ 5.6 โครงสร้างการเชื่อมต่อตารางในแฟ้มข้อมูล

ดังนั้นค่าของรหัสหมู่บ้าน ในระเบียนทะเบียนราษฎร์ระดับหมู่บ้าน จะเป็นตัวกำหนดว่า บุคคลนั้นอยู่ในตำบลใด

ในฐานข้อมูลอาจจะมีความสัมพันธ์อยู่ 3 ประเภทดังนี้

๕.๔.๑ ความสัมพันธ์แบบหนึ่งต่อหนึ่ง (One-to-One Relationship)

เป็นลักษณะความสัมพันธ์ที่มีระเบียนเพียง 1 ระเบียนในแฟ้ม A มีความสัมพันธ์กับระเบียนเพียง 1 ระเบียนในแฟ้ม B และในทางกลับกัน ระเบียนเพียง 1 ระเบียนในแฟ้ม B ก็จะมีความสัมพันธ์กับระเบียนเพียง 1 ระเบียนในแฟ้ม A

ในการประยุกต์ใช้ความสัมพันธ์นี้ เช่น ข้อมูลแผนที่ขอบเขตการปกครองระดับอำเภอ ของจ. ปทุมธานี มีตารางประกอบแผนที่ แสดง 7 อำเภอ แต่ละอำเภอมีรหัสประจำอำเภอ 1 ตัว จะเชื่อมโยงไปยังตารางอธิบายรหัสอำเภอได้เพียง 1 รหัสเท่านั้น ดังรูปประกอบ

รูปที่ 5.7 การประยุกต์ใช้ความสัมพันธ์แบบหนึ่งต่อหนึ่งในระบบ GIS

๕.๔.๒ ความสัมพันธ์แบบหนึ่งต่อกลุ่ม (One-to-Many Relationship)

เป็นลักษณะความสัมพันธ์ที่มีระเบียนเพียง 1 ระเบียนในแฟ้ม A มีความสัมพันธ์กับระเบียนหลายระเบียนในแฟ้ม B และทางกลับกันหลายระเบียนในแฟ้ม B จะมีความสัมพันธ์กับระเบียนเพียง 1 ระเบียนในแฟ้ม A

ในการประยุกต์ใช้ความสัมพันธ์หนึ่งต่อกลุ่มนี้ เช่น ข้อมูลแผนที่ขอบเขตชุดดิน ของจ. ปทุมธานี มีตารางประกอบแผนที่ขอบเขตชุดดินที่มีในจังหวัด ซึ่งบางชุดดินจะมีอยู่หลายๆ แห่งในจังหวัด เช่น 141 มีอยู่ 2 polygon เป็นต้น จะเชื่อมโยงไปยังตารางอธิบายรหัสชุดดินได้เพียง 1 รหัสเท่านั้น ดังรูปประกอบ ในทางกลับกัน ตารางอธิบายชุดดินมีเพียงชุดละ 1 record เท่านั้น จะเชื่อมโยงไปยังตารางของแผนที่ได้หลายรหัส ดังในรูปประกอบ

รูปที่ 5.8 การประยุกต์ใช้ความสัมพันธ์แบบหนึ่งต่อกลุ่มในระบบ GIS

จะพบว่าความสัมพันธ์แบบหนึ่งต่อกลุ่มจะใช้งานกันมากในระบบสารสนเทศทางภูมิศาสตร์ เนื่องจากแผนที่ใดๆ แผนที่หนึ่งที่ประกอบด้วยตารางข้อมูลของแผนที่มักจะมี ข้อมูลบางอย่างซ้ำๆ กันได้ เช่น ประเภทการใช้ที่ดินเป็นที่นา หลายๆ แห่งในตารางข้อมูล เนื่องจากในแผนที่จะแสดงที่นาอยู่หลายแห่งในแผนที่ ซึ่งอาจจะแสดงด้วยรหัสของการใช้ที่ดินเหมือนกัน ซึ่งทุกตัวจะไปเชื่อมโยงกับตารางอธิบายรหัสการใช้ที่ดินตัวเดียวกันนั่นเอง

๕.๔.๓ ความสัมพันธ์แบบกลุ่มต่อกลุ่ม (Many-to-Many Relationship)

เป็นลักษณะความสัมพันธ์ที่แต่ละระเบียนในแฟ้ม A มีความสัมพันธ์กับหลายระเบียนในแฟ้ม B และในทางกลับกันแต่ละระเบียนในแฟ้ม B จะมีความสัมพันธ์กับระเบียนหลายระเบียนในแฟ้ม A

ในการประยุกต์ใช้ความสัมพันธ์กลุ่มต่อกลุ่ม เช่น ข้อมูลแผนที่ขอบเขตการปกครองระดับอำเภอ ของจ. ปทุมธานี มีตารางประกอบแผนที่ซึ่งแสดงถึงรหัสจังหวัด และรหัสอำเภอ ซึ่งทุกอำเภอจะมีรหัสจังหวัดหมายเลขเดียวกันคือ 28 ในฐานข้อมูลตารางอธิบายรหัสตำบลก็มีรหัสอำเภอที่ซ้ำกัน และรหัสจังหวัดที่ซ้ำกันด้วยเช่นกัน ดังนั้นในการเชื่อมโยงข้อมูลนี้ค่อนข้างซับซ้อน ซึ่งยากต่อการทำความเข้าใจ บางครั้งผู้ใช้มักจะเชื่อมความสัมพันธ์ตารางในรูปแบบนี้เพื่อการสอบถามข้อมูลว่ามีตำบลใดบ้างที่อยู่ในอำเภอคลองหลวง (2802) ดังรูปประกอบ ก็จะสามารถได้คำตอบหลายๆ ตำบลที่เชื่อมโยงกันนั้น เช่นเดียวกันแต่ละตำบลก็มีรหัสจังหวัดที่สามารถเชื่อมโยงด้วยรหัสจังหวัดซึ่งมีอยู่ในตารางแผนที่หลาย record

รูปที่ 5.9 การประยุกต์ใช้ความสัมพันธ์แบบกลุ่มต่อกลุ่มในระบบ GIS

บทที่ 5 : 5.2หลักการและความหมายฐานข้อมูล

5.2หลักการและความหมายฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

๕.๒ หลักการและความหมายฐานข้อมูล

๕.๒.๑ นิยามข้อมูล

ในทางทฤษฎีได้มีการให้ความหมายของคำว่า ข้อมูล (Data) ข่าวสาร(News) ข้อมูลสารสนเทศ (Information) โดยนัยจะมีความหมายที่ต่างกัน

ข้อมูล (Data) หมายถึงข้อเท็จจริงต่างๆ ที่มีอยู่ในโลกนี้ใช้แทนด้วยตัวเลข ภาษา หรือสัญลักษณ์ที่ยังไม่มีการปรุงแต่งหรือประมวลผลใดๆ อาจจะแบ่งข้อมูลได้เป็น 3 ประเภท คือ

1. ข้อเท็จจริงที่เป็นจำนวน ปริมาณ ระยะทาง

2. ข้อเท็จจริงที่ไม่เป็นตัวเลข เช่น ชื่อ ที่อยู่ สถานภาพ ประวัติการศึกษา

3. ข่าวสารที่ยังไม่ได้ประเมิน เช่น รายงาน บันทึก คำสั่ง ระเบียบ กฎหมาย และเหตุการณ์หรือสถานการณ์ต่างๆ

แหล่งข้อมูลที่จะได้มานั้น หรือแหล่งต้นตอของข้อมูลเรียกว่า แหล่งปฐมภูมิ (Primary Source) เช่นการไปเก็บรวบรวมข้อมูลจำนวนประชากรวัยทำงานในจังหวัดลพบุรี ส่วนแหล่งข้อมูลที่ผู้อื่นรวบรวมไว้แล้วเรียกว่า แหล่งทุติยภูมิ (Secondary source) เช่น การไปเก็บข้อมูลจำนวนครัวเรือนในเขตเทศบาลจากอำเภอที่ได้รวบรวมไว้แล้วว่าทั้งหมู่บ้านหรือตำบลมีกี่ครัวเรือน เป็นต้น ลักษณะของข้อมูลที่เก็บมาทั้งจากแหล่งปฐมภูมิและทุติยภูมิ อาจเป็นได้ทั้งข้อมูลเชิงปริมาณและข้อมูลเชิงคุณภาพ

๕.๒.๒ นิยามข้อมูลสารสนเทศ

ข้อมูลสารสนเทศ (information) อาจจะเป็นอะไรก็ได้ที่เชื่อว่าเป็นระบบที่สำคัญต่อการให้ความสะดวกต่อองค์กร หรืออาจจะกล่าวได้ว่า มันเป็นสิ่งจำเป็นอย่างยิ่งต่อกระบวนการตัดสินใจที่เกี่ยวข้องกับการจัดการกับเรื่องต่างๆ ในองค์กร

ข้อมูลสารสนเทศ (Information) หมายถึง ข้อมูลที่ได้ถูกกระทำให้มีความสัมพันธ์หรือมีความหมายนำไปใช้ประโยชน์ได้ตามวัตถุประสงค์ของผู้ใช้งานหรือหน่วยงาน

รูปที่ 5.1 หลักการของข้อมูลสารสนเทศ

ข้อมูลสารสนเทศจึงเป็นการนำข้อมูลที่รวบรวมได้จากการสำรวจพื้นที่หรือการสัมภาษณ์ชุมชน แล้วนำข้อมูลที่ได้นำมาผ่านการเปลี่ยนแปลงโดยการนำข้อมูลตั้งแต่ 2 ตัวขึ้นไปที่มีความเกี่ยวข้องกันมาจัดกระทำหรือประมวลผล เพื่อให้มีความหมายหรือมีคุณค่าเพิ่มขึ้นตามวัตถุประสงค์การใช้ เช่น เมื่อมีความต้องการรู้ว่า จำนวนโรงพยาบาลหรือสถานพยาบาลในชนบท 1 แห่ง จะต้องรองรับจำนวนประชาชนในบริเวณที่ใกล้เคียงจำนวนเฉลี่ยกี่คน ฉะนั้นการจะมีข้อมูลสารสนเทศได้นั้น จะต้องมีข้อมูลดิบก่อน และข้อมูลกับข้อมูลสารสนเทศจะมีความเกี่ยวข้องกัน มีความสำคัญและใช้ประโยชน์ด้วยกัน

ฉะนั้นข้อมูลที่มีความเหมายเกี่ยวเนื่องเชื่อมโยงหรือตอบสนองกับเป้าหมายหรือวัตถุประสงค์อะไรบางอย่างก็สามารถเรียกได้ว่าข้อมูลสารสนเทศ (information) เช่น มีข้อมูล (Data) ว่าด้วยปริมาณรถยนต์ที่สี่แยกไฟแดงหนึ่งอยู่ 2,000 ข้อมูล อย่างนี้ก็เป็นเพียงข้อมูลธรรมดาๆ แต่ถ้าข้อมูลนี้เชื่อมโยงเกี่ยวข้องกับเวลาต่างๆ เช่น 9:00 มีปริมาณรถยนต์ผ่านแยกไฟแดงนาทีละ 12 คัน 9:01 นาทีละ 15 คัน… อย่างนี้ไปทั้งสิ้น 2,000 ชุด เราก็สามารถตั้งโจทย์ว่า ถ้าเป้าหมายเราต้องการแก้ไขปัญหาการจราจรที่สี่แยกนี้ ข้อมูลที่ว่าจะแปรสภาพไปเป็น information

เรามี Information ดังกล่าวอยู่ในมือ ลองมาพิจารณาดูแล้ว ก็จะเกิดความเข้าใจ ชุดข้อมูลนี้ เช่น รถมากช่วงเวลาใด มาจากด้านไหน มีสัดส่วนอย่างไร สิ่งที่เราได้ก็คือ ความเข้าใจในปัญหา เหตุที่เกิดปัญหา ซึ่งถ้าเรามี Information หลายๆ ประเด็น คือมีข้อมูลหลากหลาย และนำมาสัมพันธ์กัน ก็จะทำให้เรายิ่งเข้าใจปัญหามากขึ้น

เมื่อเราเข้าใจถึงปัญหาแล้วสามารถถ่ายทอดให้ตัวเองและผู้อื่นเข้าใจได้อย่างถ่องแท้แล้ว ปัญญาก็จะเกิด พอเกิดปัญญาแตกฉานในปัญหา รู้เหตุที่มาที่ไป ให้ใครต่อใครเข้าใจและรู้แจ้งเท่าทันปัญหานั้น แล้วนำปัญญาไปใช้ในการปฏิบัติต่อ ถ้าทำงานด้วยปัญญา งานก็สัมฤทธิผล มีประสิทธิผล ข้อมูลสารสนเทศก็เหมือนสินค้าคงคลัง คือต้องมีความหลากหลาย และประเภทที่เหมาะสม จัดเก็บและหามาใช้ได้ในสถานที่เหมาะสม ในเวลาและบ่อยครั้งที่ต้องการ สารสนเทศที่มากเกินไปจะทำให้เสียค่าใช้จ่ายมาก สารสนเทศน้อยเกินไปทำให้เกิดความเสียหายต้องมีการป้องกันผู้ที่ไม่มีสิทธิ์ใช้สารสนเทศนั้นได้ และในขณะเดียวกันต้องป้องกันการสูญเสียทางกายภาพ อันเนื่องมาจาก ไฟ น้ำท่วม ไฟฟ้าตกหรือดับ

โดยสรุปแล้วข้อมูลสารสนเทศ (information) มีประโยชน์คือ ทำให้เกิดความรู้, ทำให้เกิดความคิดและความเข้าใจ, ทำให้เห็นสภาพปัญหา/ สภาพการเปลี่ยนแปลงว่าก้าวหน้าหรือตกต่ำ, ทำให้ประเมินค่าได้, ทำให้เกิดความน่าสนใจและเกิดการตื่นตัว, ช่วยในการตัดสินใจได้และสามารถทำนายอนาคตได้, ทำให้เกิดความคิดสร้างสรรค์ และก่อให้เกิดการเปลี่ยนแปลงเจตคติ เมื่อได้รู้ได้เห็นจากสภาพความเป็นจริงจากข้อมูลสารสนเทศเหล่านั้น

ข้อมูลสารสนเทศควรมีลักษณะที่พึงปรารถนาอย่างน้อย 5 ลักษณะดังต่อไปนี้

1. สารสนเทศที่นำเสนอชัดเจน และควรนำเสนอด้วยวิธีที่คุ้นเคยกันอยู่เพื่อให้สามารถเข้าใจได้อย่างรวดเร็ว

2. สารสนเทศนั้นควรทำให้ความเข้าใจสถานการณ์ของงานนั้นได้ละเอียดขึ้น

3. สารสนเทศที่มีคำแนะนำหรือส่วนแนะนำการตัดสินใจควรมีสิ่งช่วยที่ชัดเจนอย่างใดอย่างหนื่งให้ผู้ใช้พิจารณาได้ว่าทำอย่างไร และทำไมจึงจะได้ผล (Results) และคำแนะนำ

4. ความต้องการต่างๆ ด้านสารสนเทศควรอยู่บนพื้นฐานของการระบุความต้องการสารสนเทศสำหรับสถานการณ์นั้นโดยเฉพาะ

5. สารสนเทศและเรื่องราวต่างๆ เกี่ยวกับการควบคุมทางการจัดการที่เสนอโดยกระบวนการสนับสนุนควรเป็นในลักษณะที่ให้ผู้ทำการตัดสินใจเป็นผู้แนะแนว (Guide) กระบวนการวินิจฉัย และการเลือกยิ่งกว่าให้ระบบสนับสนุนคอมพิวเตอร์ทำการแนะแนวกระบวนการดังกล่าว

ข้อมูล (stored Data) จึงเป็นข้อมูลที่เก็บรวบรวมไว้ในระบบคอมพิวเตอร์ และสามารถเรียกใช้งานได้เพื่อใช้ในการประมวลผลเพื่อให้ได้ผลลัพธ์ตอบวัตถุประสงค์ที่ตั้งไว้โดยใช้โปรแกรมประยุกต์ต่างๆ ข้อมูลที่ถูกเก็บรวบรวมไว้ในระบบคอมพิวเตอร์ อาจจะอยู่ในรูปของ

� แฟ้มข้อมูล หรือ ไฟล์ (File) ซึ่งเป็นที่รวบรวมข้อมูลประเภทเดียวกันไว้ด้วยกันเพื่อสะดวกในการจัดเก็บและค้นหาข้อมูล ให้ตรงตามวัตถุประสงค์การใช้งาน

� ฐานข้อมูล (Database) ซึ่งเป็นแนวความคิดที่นำข้อมูลของหน่วยงานทั้งหมดมารวบรวมไว้ที่เดียวกัน เพื่อช่วยลดความซ้ำซ้อนของข้อมูล และทำให้เกิดประสิทธิภาพในการใช้งานสูงสุด

ข้อมูลที่จัดเก็บอยู่นั้นอาจเป็นแฟ้มข้อมูลเพียงแฟ้มเดียว หรือหลายแฟ้ม หรืออยู่ในรูปของฐานข้อมูลซึ่งจะเป็นการรวบรวมแฟ้มข้อมูลตั้งแต่หนึ่งแฟ้มขึ้นไป ที่มีความสัมพันธ์เกี่ยวข้องกันเก็บไว้ในที่เดียวกันในหน่วยเก็บข้อมูลสำรองเช่น จานแม่เหล็กหรือดิสค์ เพื่อให้บุคคลากรจากหลายหน่วยงานสามารถใช้ข้อมูลในฐานข้อมูลนี้ร่วมกันได้

๕.๒.๓ นิยามแฟ้มข้อมูล

แฟ้มข้อมูล (File) เป็นการจัดเก็บและรวบรวมข้อมูลประเภทเดียวกันไว้ด้วยกันเพื่อให้เกิดความสะดวกในการจัดเก็บและเรียกค้น ตามวัตถุประสงค์การใช้งานของหน่วยงาน

การจัดเก็บข้อมูลของหน่วยงานไว้แต่ละหน่วยงานหรือแต่ละแผนก เช่น งานบุคคลก็จะมีแฟ้มเกี่ยวกับบุคลากรขององค์กร งานวิชาการก็จะมีแฟ้มเกี่ยวข้องกับวิชาการที่หน่วยงานเผยแพร่หรือวิจัย เป็นต้น และจะมีโปรแกรมที่เขียนขึ้นมาเพื่อเรียกค้นข้อมูลของหน่วยงานตนเองเพื่อการประมวลผล

หน่วยงานต่างๆ มีการจัดเก็บข้อมูลไว้ในรูปแบบแฟ้มข้อมูล จะมีผลที่เกิดขึ้นคือ ความซ้ำซ้อนของข้อมูล (Data Redundancy) เช่น ทะเบียนรายชื่อบุคลากรขององค์กรก็จะมีปรากฎอยู่เกือบทุกหน่วยงานซึ่งมีแฟ้มบุคลากรเป็นของตนเอง ทำให้เกิดความซ้ำซ้อน ส่งผลให้เกิดความสิ้นเปลืองเนื้อที่ในการจัดเก็บข้อมูลเหล่านี้ และยังส่งผลให้การแก้ไขหรือปรับปรุงข้อมูลบุคลากรเป็นไปโดยลำบาก ทำให้แต่ละหน่วยงานจึงอาจมีข้อมูลที่ขัดแย้งกันได้ในอนาคต จึงทำให้เกิดแนวความคิดในการนำแฟ้มข้อมูลของแต่ละหน่วยงานมารวมไว้ในที่เดียวกัน หรือเรียกว่าระบบการประมวลผลฐานข้อมูล (Database)

รูปที่ 5.2 ระบบการประมวลผลแฟ้มข้อมูล

ในการประมวลผลแฟ้มข้อมูลซึ่งในการทำงานจะทำที่เครื่องของผู้ที่ดูแลฐานข้อมูลนั้นจะมีข้อดีคือ

1.ทำให้การประมวลผลข้อมูลทำได้อย่างรวดเร็วไม่ต้องไปพึ่งพาฐานข้อมูลจากส่วนกลาง หรือไม่ต้องรอข้อมูลจากส่วนกลาง

2. ค่าลงทุนในการจัดซื้ออุปกรณ์ก็จะต่ำ และไม่จำเป็นต้องใช้คอมพิวเตอร์ที่มีสมรรถนะสูงก็สามารถประมวลผลข้อมูลได้ และในปัจจุบันเครื่องคอมพิวเตอร์มีสมรรถนะสูงขึ้นและราคาถูกลงซึ่งทำให้สามารถทำงานได้ง่าย

3. โปรแกรมประยุกต์แต่ละโปรแกรมสามารถควบคุมการใช้ข้อมูลในแฟ้มข้อมูลของตนเองได้ โดยไม่ต้องไปพึ่งพาโปรแกรมจากส่วนกลาง ทำให้การทำงานเร็วขึ้น

แต่ไม่ใช่ว่าในการประมวลผลแฟ้มข้อมูลจะมีข้อดีเสมอไป ข้อเสียที่เกิดขึ้นสำหรับระบบการประมวลผลแฟ้มข้อมูลคือ

1. มีความซ้ำซ้อนของข้อมูล (Redundancy) การเก็บรวบรวมข้อมูลประเภทเดียวกันไว้ในการทำงาน เช่นมีการรวบรวมข้อมูลที่ซ้ำซ้อนกัน จากรูปที่ 5.2 มีการเก็บรวบรวมข้อมูลอาคารเรียน และห้องเรียนซ้ำซ้อนกัน ทำให้เสียเนื้อที่ในอุปกรณ์สำรองข้อมูลไปเก็บข้อมูลที่สามารถใช้งานร่วมกันได้ไว้ในคอมพิวเตอร์ทั้ง 2 เครื่อง บางครั้งในการลงทุนเพื่อเก็บข้อมูลก็ทำให้ลงทุนในงบประมาณที่ซ้ำซ้อนได้เพื่อจัดเก็บข้อมูลประเภทเดียวกัน เนื่องจากไม่ทราบว่าอีกหน่วยงานหนึ่งนั้นมีฐานข้อมูลใดบ้าง

2. ความขัดแย้งของข้อมูล (Inconsistency) เมื่อมีการจัดเก็บข้อมูลแยกหน่วยงานกัน ในเรื่องเดียวกันนั้นย่อมมีโอกาสที่ฐานข้อมูลเกิดความขัดแย้งกันได้ เช่น การเปลี่ยนแปลงชื่ออาคารเรียน หรือการเปลี่ยนแปลงชื่อห้องหรือหมายเลขห้อง แม้กระทั่งการให้รหัส (Code) ของห้องเรียนหรืออาคารเรียน ไม่มีมาตราฐาน ทำให้ไม่สามารถนำข้อมูลมาใช้ร่วมกันได้ หรืออาจจะยุ่งยากหากจะเปลี่ยนแปลงระบบให้ใช้งานฐานข้อมูลร่วมกันได้

3. ความยุ่งยากในการประมวลผลข้อมูลในแฟ้มข้อมูลหลายแฟ้มข้อมูล ในการสร้างผลรายงานของรหัสของแผนที่อาคารเรียนหรือห้องเรียน ต้องมีการเขียนโปรแกรมประยุกต์เช่นโปรแกรมการใช้ที่ดิน ม.ธ. เพื่อทำการดึงฐานข้อมูลจากแฟ้มข้อมูลอาคารเรียน แฟ้มข้อมูลการใช้ที่ดิน แฟ้มข้อมูลห้องเรียน

4. ไม่มีผู้ควบคุมหรือรับผิดชอบระบบทั้งหมด เนื่องจากผู้ใช้เครื่องคอมพิวเตอร์เครื่องใดก็ต้องดูแลเครื่องรับผิดชอบเครื่องที่ตนเองใช้งาน จะไม่มีการใช้ข้อมูลหรือทรัพยากรร่วมกันแต่อย่างใด

5. ความขึ้นต่อกัน (Dependency) ระหว่างโปรแกรมประยุกต์และโครงสร้างของแฟ้มข้อมูล เนื่องจากการจัดเก็บข้อมูลในระบบการประมวลผลแฟ้มข้อมูลนั้นจะมีโครงสร้างของแฟ้มข้อมูลในรูปแบบของโปรแกรมประยุกต์ที่เครื่องคอมพิวเตอร์ชุดนั้นใช้งาน เช่น ถ้ามีการเขียนโปรแกรมประยุกต์ด้วยการสร้างฐานข้อมูลจาก Microsoft Access โครงสร้างหรือแฟ้มข้อมูลที่จะใช้ ตัวอย่างเช่นชื่อเขตข้อมูล (Field) ต่างๆ ขนาดของเขตข้อมูล หรือชนิดของเขตข้อมูลไม่ตรงกันกับอีกระบบหนึ่ง ทำให้เกิดปัญหาขึ้นได้ในอนาคตที่จะต้องลงทุนในการใช้ข้อมูลร่วมกันในอนาคต ซึ่งเหมือนกับต้องสร้างฐานข้อมูลอีกระบบหนึ่งใหม่หากจะมีการปรับเข้าสู่การประมวลผลฐานข้อมูล

๕.๒.๔ นิยามฐานข้อมูล

การประมวลผลรูปแบบใหม่ได้พัฒนาขึ้นมาเพื่อช่วยลดข้อเสียของการประมวลผลในระบบแฟ้มข้อมูล ซึ่งเรียกว่า การประมวลผลฐานข้อมูล

ฐานข้อมูล (Database) เป็นวิธีการที่จะเก็บข้อมูลที่มีความสัมพันธ์กันไว้ในที่เดียวกันและรวบรวมข้อมูลที่ไม่ซ้ำซ้อนและสามารถใช้ข้อมูลร่วมกันได้อย่างเป็นระบบ ให้สะดวกต่อการเรียกใช้ สามารถแก้ไขได้ง่าย สำหรับผู้ใช้จำนวนมาก และสามารถป้องกันไม่ให้ผู้ไม่มีสิทธิ์ใช้เข้าถึงข้อมูลได้

ในระบบการประมวลผลฐานข้อมูลนั้นมีองค์ประกอบที่เรียกว่า ระบบการจัดการฐานข้อมูล หรือ Database Management System (DBMS) เข้ามาช่วยในการลดข้อบกพร่องของการประมวลผลแฟ้มข้อมูล ช่วยลดความซ้ำซ้อนของข้อมูลและสามารถปรับปรุงฐานข้อมูลให้ทันสมัย ทันสถานการณ์ และมีความถูกต้อง ซึ่งวัตถุประสงค์ที่สำคัญในการจัดทำระบบสารสนเทศหรือฐานข้อมูลนั้น เพื่อสร้าง วิเคราะห์และทำให้ผู้ใช้ที่เหมาะสมได้รับข้อมูลและสารสนเทศที่หลากหลาย จุดเริ่มต้นก็คือการสร้างข้อมูลหรือการหา (Finding) ข้อมูลมาให้ได้ เมื่อได้ข้อมูลมาแล้ว มีขั้นตอนการดำเนินการตามมาดังนี้

1. การจัดเก็บ (Storing) จำเป็นต้องระบุวิธีการต่างๆ ในการจัดเก็บข้อมูล โดยอาศัยเกณฑ์ต่างๆ ที่จำเป็นสำหรับการวิเคราะห์ การเข้าถึง และผู้ที่มีศักยภาพเป็นผู้ใช้

2. การแปลงผัน (Converting) การวิเคราะห์ รูปแบบต่างๆ ที่ใช้งานได้

3. การส่ง (Converying) ปกติแล้วข้อมูลไม่ได้มีประโยชน์แค่ในที่จัดเก็บต้นแหล่งเท่านั้น แต่ต้องส่งถ่ายไปยังผู้ใช้ (คนหนึ่ง หรือหลายคน)

4. การทำซ้ำ (Reproducing) อาจจำเป็นต้องทำซ้ำหลายฉบับ (Copies) ในรูปแบบต่างๆ

5. การจำแนกประเภท (Classifying) การตัดสินใจกำหนดหัวเรื่อง (Headings) ที่ถูกต้องเพื่อจัดเก็บข้อมูลเป็นเรื่องที่สำคัญยิ่ง

6. การสังเคราะห์ (Synthesizing) ต้องใช้ข้อมูลจากหลายแหล่งเพื่อให้มีสารสนเทศพอเพียงสำหรับการตัดสินใจ

7. การจัดกระทำ (Manipulating) ข้อมูลอาจมีความหมายมากขึ้นโดยการจัดกระทำเชิงสถิติ

8. การค้นคืน (Retrieving) การที่ผู้ใช้ที่เหมาะสมสามารถเข้าถึงข้อมูลเมื่อต้องการ เป็นเรื่องสำคัญ

9. การพิจารณาทบทวน (Reviewing) ข้อมูลอะไรที่จำเป็นต้องมีไว้ และมีไว้เป็นเวลานานแค่ไหน? ระบบจัดเก็บและสมรรถภาพในการจัดกระทำสามารถรับมือกับข้อมูลเชิงประวัติศาสตร์จำนวนมากได้หรือไม่ หรือข้อมูลบางอย่างไม่จำเป็นควรทำลาย?

10. การทำลาย (Destroying) การพิจารณาทบทวนว่าข้อมูลใดจำเป็นหรือข้อมูลใดใช้อยู่เป็นประจำอาจบ่งบอกได้ว่าควรขจัดข้อมูลใดออกไป

๕.๒.๕ ระบบการประมวลผลฐานข้อมูล

ในระบบการประมวลผลฐานข้อมูลนี้แฟ้มข้อมูลต่างๆ ที่มีความเกี่ยวข้องกันหรือมีความสัมพันธ์กันจะถูกเก็บอยู่รวมกันในที่ที่เดียว ซึ่งจะช่วยลดความซ้ำซ้อนของข้อมูล ทำให้ข้อมูลมีความถูกต้องและทันสมัยอยู่ตลอด นอกจากนี้โปรแกรมประยุกต์ที่เขียนขึ้นก็จะไม่ขึ้นกับโครงสร้างของแฟ้มข้อมูลอีกด้วย ซึ่งระบบการจัดการฐานข้อมูลนี้จะทำหน้าที่ควบคุมดูแล และเรียกค้นฐานข้อมูลเพื่ออำนวยความสะดวกให้กับผู้ใช้งานให้สามารถใช้ฐานข้อมูลได้อย่างง่าย ระบบการจัดการฐานข้อมูล (DBMS) เป็นระบบการจัดเก็บบันทึกข้อมูลโดยใช้คอมพิวเตอร์ ซึ่งผู้ที่เลือกใช้ระบบมีจุดมุ่งหมายเพื่อทำการบันทึกและรักษาข้อมูล (information) ฐานข้อมูลมีทั้งการรูปแบบการใช้ร่วมกัน (integrated) หรือแบ่งข้อมูลให้ใช้ (shared) ฐานข้อมูลที่หลายๆ หน่วยงานนำมารวมกัน หรือกล่าวได้ว่าเป็นแฟ้มข้อมูลที่แตกต่างกัน คือ ไม่มีการซ้ำซ้อนของข้อมูลที่มีอยู่ในฐานข้อมูลทั้งหมด (การแบ่งข้อมูลใช้ร่วมกันในเวลาเดียวกัน คือ ผู้ใช้หลายๆคนสามารถเข้าสู่ฐานข้อมูลในเวลาเดียวกัน) แต่จะลดการซ้ำซ้อนของข้อมูลที่มีอยู่ทำให้ไม่เปลืองเนื้อที่ในการจัดเก็บ และนอกจากนี้ DBMS จะช่วยในการสร้าง เรียกค้น หรือสืบค้นฐานข้อมูล และปรับปรุงฐานข้อมูล โดยการทำงานนี้จะต้องผ่าน DBMS ทำให้การสร้างฐานข้อมูลหรือการปรับปรุงข้อมูลนั้นมีความสะดวกมากขึ้น โดยผู้ป้อนข้อมูลหรือสร้างฐานข้อมูลนั้นไม่ต้องสนใจรูปแบบการจัดเก็บข้อมูลทางกายภาพ ผู้ป้อนข้อมูลสามารถใช้ผ่าน DBMS ในการบริหารและจัดการฐานข้อมูลได้โดยตรง เช่น การเพิ่ม การลบ การเปลี่ยนแปลงข้อมูลเหล่านั้น

รูปที่ 5.3 ระบบการประมวลผลฐานข้อมูล

DBMS จะช่วยในการสร้าง เรียกใช้ข้อมูล และปรับปรุงฐานข้อมูล โดยจะทำหน้าที่เสมือนตัวกลาง ระหว่างผู้ใช้ และฐานข้อมูลให้สามารถติดต่อกันได้

ให้สังเกตข้อแตกต่างระหว่างระบบการประมวลผลแฟ้มข้อมูลในรูป 5.2 และระบบการประมวลผลฐานข้อมูลในรูป 5.3 จะเห็นว่าแฟ้มข้อมูลต่างๆ ในรูป 5.2 โปรแกรมประยุกต์ที่สร้างขึ้นในระบบการประมวลผลแฟ้มข้อมูล จะมีการอ่านหรือเขียนข้อมูลโดยตรง ในขณะที่โปรแกรมประยุกต์ที่สร้างในระบบการประมวลผลฐานข้อมูลนั้น จะต้องออกคำสั่งผ่าน DBMS ก่อน DBMS จึงจะทำหน้าที่อ่านข้อมูลที่ต้องการแล้วส่งต่อให้กับโปรแกรมประยุกต์อีกทีหนึ่ง

๕.๒.๕.๑ ข้อดีของการประมวลผลข้อมูลในฐานข้อมูล

1. ข้อมูลมีการเก็บอยู่รวมกันและสามารถใช้ข้อมูลร่วมกันได้ ในระบบฐานข้อมูล ข้อมูลทั้งหมดจะถูกเก็บอยู่ในที่เดียวกัน ที่เรียกว่า ฐานข้อมูล โปรแกรมประยุกต์สามารถออกคำสั่งผ่าน DBMS ให้ทำการอ่านข้อมูลจากหลายตารางได้ เช่น จากรูป 5.3

2. ลดความซ้ำซ้อนของข้อมูล ในการประมวลผลฐานข้อมูล ข้อมูลจะมีความซ้ำซ้อนกันน้อยที่สุด เนื่องจากข้อมูลจะถูกเก็บอยู่เพียงที่เดียวในฐานข้อมูล เช่น ข้อมูลขอบเขตการปกครองระดับจังหวัด ข้อมูลระดับอำเภอ ข้อมูลระดับตำบล ซึ่งจะเป็นการประหยัดเนื้อที่การใช้งานหน่วยเก็บข้อมูลสำรอง นอกจากนี้ถ้ามีการเปลี่ยนแปลงหรือปรับปรุงข้อมูลใด ก็จะทำกับข้อมูลเพียงที่เดียวเท่านั้น ดังนั้นจึงเป็นการลดความซ้ำซ้อนของข้อมูลลง ข้อมูลจะมีความถูกต้อง ไม่มีความขัดแย้งของข้อมูลเกิดขึ้น

3. สามารถหลีกเลี่ยงความขัดแย้งกันของข้อมูลที่อาจเกิดขึ้นได้ สืบเนื่องมาจากผลของข้อ 2 คือการลดความซ้ำซ้อนของข้อมูล จะทำให้สามารถลดความขัดแย้งของข้อมูลที่อาจเกิดขึ้นได้ด้วย ตัวอย่างเช่น ฐานข้อมูลระบบทะเบียนราษฎร์ระดับตำบล จังหวัดนครศรีธรรมราช ชื่อของประชาชน จะถูกเก็บอยู่ในตารางรายชื่อประชาชนในระดับหมู่บ้าน เพียงแห่งเดียว ดังนั้นถ้าจะมีการเปลี่ยนแปลงชื่อสกุลประชาชน เช่น การตาย หรือย้ายถิ่น ก็สามารถแก้ไขในตารางรายชื่อประชาชนระดับหมู่บ้านเพียงแห่งเดียว

4. การควบคุมความคงสภาพของข้อมูล ความคงสภาพ (Integrity) หมายถึงความถูกต้อง ความคล้องจอง ความสมเหตุสมผล หรือความเชื่อถือได้ของข้อมูล ซึ่งนอกจากลักษณะของข้อมูลที่ต้องมีความซ้ำซ้อนน้อยที่สุดแล้ว ความคงสภาพของข้อมูลก็มีความสำคัญไม่ยิ่งหย่อนไปกว่ากัน กล่าวคือ ข้อมูลภายในฐานข้อมูลนั้นควรจะต้องมีความถูกต้อง สมเหตุสมผล เช่น อายุของประชากรในระดับหมู่บ้าน ในฐานข้อมูลไม่ควรจะเกิน 200 ปี (ในความเป็นจริงไม่ถึง 150 ปี) ระบบฐานข้อมูลที่ดีต้องมีการป้องกันการบันทึกข้อมูลที่ไม่สมเหตุสมผลนื้ โดย DBMS เป็นตัวควบคุมไม่ให้มีการบันทึกข้อมูลที่ไม่ถูกต้องลงไปเก็บในฐานข้อมูล อีกตัวอย่างหนึ่งของความคงสภาพเช่น ประชาชนคนใดเสียชีวิต ในตารางรายชื่อจะต้องลบรายชื่อบุคคลนั้นออก และจำเป็นจะต้องลบข้อมูลของบุคคลนั้นออกจากตารางทะเบียนราษฎร์ระดับหมู่บ้าน เพื่อทำให้ฐานข้อมูลมีความคงสภาพของข้อมูลเกิดขึ้น

5. การจัดการข้อมูลในฐานข้อมูลจะทำได้ง่าย การจัดการกับข้อมูลไม่ว่าจะเป็นการเรียกใช้ข้อมูล การเพิ่มข้อมูล การแก้ไขข้อมูล หรือการลบข้อมูลของตารางใดภายในฐานข้อมูล จะสามารถทำได้ง่ายโดยการออกคำสั่งผ่านไปยัง DBMS ซึ่ง DBMS จะเป็นตัวจัดการข้อมูลภายในฐานข้อมูลให้เอง

6. ความเป็นอิสระระหว่างโปรแกรมประยุกต์และข้อมูล โปรแกรมประยุกต์ที่เขียนขึ้นจะไม่ขึ้นกับโครงสร้างของตารางข้อมูลที่เปลี่ยนแปลงไป เนื่องจากโครงสร้างของตารางต่างๆ และตัวข้อมูลในแต่ละตารางจะถูกเก็บอยู่ในฐานข้อมูลทั้งหมด โปรแกรมประยุกต์ไม่จำเป็นต้องเก็บโครงสร้างของตารางที่จะใช้ไว้ ซึ่งต่างกับระบบการประมวลผลแฟ้มข้อมูล ดังนั้นการเปลี่ยนแปลงโครงสร้างของตาราง เช่น การเปลี่ยนแปลงขนาดของเขตข้อมูลในตารางใดภายในฐานข้อมูล ก็ไม่จำเป็นต้องไปทำการแก้ไขโปรแกรมประยุกต์ที่มีการเรียกใช้เขตข้อมูลนั้น

7. การมีผู้ควบคุมระบบเพียงคนเดียว ผู้ควบคุมระบบฐานข้อมูลจะเรียกว่า DBA (Database Administrator) ซึ่งจะเป็นผู้ควบคุมและบริหารจัดการระบบฐานข้อมูลทั้งหมด โดยสามารถจัดการกับโครงสร้างฐานข้อมูลได้ เพื่อป้องกันผู้ที่ไม่มีส่วนเกี่ยวข้องกับการใช้งานฐานข้อมูลเข้าไปก่อความเสียหายให้กับระบบฐานข้อมูลได้

๕.๒.๕.๒ ข้อเสียของการประมวลผลข้อมูลในฐานข้อมูล

1. การใช้งานฐานข้อมูลจะเสียค่าใช้จ่ายค่อนข้างสูง เนื่องจาก DBMS มีราคาค่อนข้างแพง นอกจากนี้การใช้ฐานข้อมูล จะต้องใช้เครื่องคอมพิวเตอร์ที่มีประสิทธิภาพค่อนข้างสูง เช่นต้องมีความเร็วสูง และหน่วยเก็บข้อมูลสำรองความจุสูง เป็นต้น

2. การสูญเสียข้อมูลที่อาจเกิดขึ้นได้ เนื่องจากข้อมูลต่างๆ ในฐานข้อมูลจะถูกเก็บอยู่ในที่ที่เดียวกัน ถ้าดิสค์ที่เก็บฐานข้อมูลนั้นเกิดมีปัญหา อาจทำให้ต้องสูญเสียข้อมูลทั้งหมดในฐานข้อมูลได้ ในขณะที่ระบบแฟ้มข้อมูล จะสามารถเก็บแฟ้มข้อมูลต่างๆ แยกกันอยู่ในดิสค์หลายๆ ตัวได้ ถ้าดิสค์ตัวใดมีปัญหา ตัวอื่นก็ยังคงทำงานได้อยู่ ดังนั้นวิธีการป้องกันโดยต้องมีการสำรองข้อมูลทั้งหมดจากดิสค์ขึ้นเก็บไว้ในเทปแม่เหล็กทุกสิ้นเดือน หรือสัปดาห์ และเก็บไว้ในที่ที่ปลอดภัย

3. ความซับซ้อน ฐานข้อมูลจะมีการจัดเก็บซับซ้อนกว่าในรูปแบบแฟ้มข้อมูล ซึ่งระบบที่มีความซับซ้อนมากเท่าใด โอกาสที่จะเกิดความผิดพลาดของข้อมูลมีมากขึ้นเท่านั้น

ระบบการประมวลผลฐานข้อมูลเป็นระบบที่สามารถแก้ไขข้อบกพร่องของระบบการประมวลผลแบบแฟ้มข้อมูลได้ ดังนั้นในปัจจุบันนี้มีหลายหน่วยงานได้หันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก บางหน่วยงานถึงกับมีการเปลี่ยนแปลงระบบการทำงานจากระบบเดิมคือระบบการประมวลผลแฟ้มข้อมูลมาเป็นระบบการประมวลผลฐานข้อมูล

๕.๒.๖ องค์ประกอบทางด้านข้อมูล

เป็นองค์ประกอบที่สำคัญอีกองค์ประกอบหนึ่งที่จำเป็นต้องมีในระบบฐานข้อมูล ตัวอย่างของข้อมูล เช่น รหัสของจังหวัดที่เก็บอยู่ในจังหวัด ซึ่งประกอบด้วยเขตข้อมูลรหัสจังหวัด อำเภอ ตำบล และระดับหมู่บ้าน เป็นต้น ข้อมูลที่เก็บอยู่ในฐานข้อมูลควรมีคุณสมบัติดังต่อไปนี้

1) มีความถูกต้อง ทันสมัย สมเหตุสมผล เช่น ถ้ามีการเก็บข้อมูลเพศของประชาชนในพื้นที่ ควรมีข้อมูลเพศชายเป็น 1 (Male) และข้อมูลเพศหญิงเป็น 0 (Female) เป็นต้น

2) มีความซ้ำซ้อนของข้อมูลน้อยที่สุด เนื่องจากข้อมูลในฐานข้อมูลสามารถประกอบด้วยตารางตั้งแต่หนึ่งตารางขึ้นไปที่มีความสัมพันธ์กัน ข้อมูลในแต่ละตารางจะต้องมีความซ้ำซ้อนของข้อมูลน้อยที่สุด หรือไม่มีเลย

3) มีการแบ่งกันใช้งานข้อมูล ข้อมูลภายในฐานข้อมูลควรมีลักษณะที่สามารถให้ผู้ใช้งานหลายคนใช้ข้อมูลนั้นร่วมกันได้ เป็นการแบ่งกันใช้ข้อมูล (Sharing) กล่าวคือผู้ใช้งานฐานข้อมูลแต่ละคน จะสามารถดึงข้อมูลชิ้นเดียวกันขึ้นมาดูได้พร้อมกัน แต่ถ้าจะทำการแก้ไขข้อมูล จะมีเพียงคนเดียวเท่านั้นที่จะสามารถทำได้ เป็นต้น

จากนิยามของฐานข้อมูลที่ว่า ฐานข้อมูลหมายถึงการเก็บรวบรวมข้อมูลที่มีความสัมพันธ์กันไว้ในที่ที่เดียวกัน จะมีโครงสร้างของข้อมูลพื้นฐานที่มีอยู่ในแฟ้มข้อมูลและระบบฐานข้อมูลดังนี้

ข้อมูลพื้นฐานที่เล็กที่สุดภายในแฟ้มข้อมูลคือ (Bit : Binary Digit) บิท ซึ่งเป็นหน่วยข้อมูลพื้นฐานที่เก็บอยู่ในหน่วยความจำภายในคอมพิวเตอร์ บิทนี้จะแทนด้วยตัวเลข 1 ตัว ได้แก่ 0 หรือ 1 อย่างใดอย่างหนึ่ง เรียกตัวเลข 1 หรือ 0 นี้ว่าเป็น 1 บิท

ข้อมูลซึ่งได้แก่ตัวอักษร (Character) แต่ละตัวเช่น A,B,C…,Z,0,1,….9 และสัญลักษณ์พิเศษอื่นๆ เช่น $,&,+,-,*,/ ฯลฯ เมื่อจะถูกนำไปเก็บไว้ในคอมพิวเตอร์ จะต้องถูกแปลงอยู่ในรูปของบิทหลายบิทที่มาประกอบกัน โดยตัวอักษร 1 ตัว จะแทนด้วย บิท 7 หรือ 8 บิท ฉะนั้นตัวอักษร 1 ตัวที่เห็นจะเรียกได้อีกอย่างว่า ไบท์ (Byte) ตัวอย่างเช่น ตัวอักษร A เมื่อเก็บอยู่ในคอมพิวเตอร์จะเก็บเป็น 1000001 เป็นต้น

ตัวอักษรแต่ละตัวจะถูกนำมาประกอบกันเป็นกลุ่มคำซึ่งมีความหมาย เช่น ชื่อ-สกุล เป็นต้น กลุ่มตัวเลขที่ประกอบกันเป็นรหัสประจำตัว จะเรียกข้อมูลกลุ่มของตัวอักษรที่รวมกันขึ้นมานี้ว่า เขตข้อมูลหรือฟิลด์ (Field) เช่น เขตข้อมูลรหัสอำเภอ เขตข้อมูลรหัสตำบล เป็นต้น

เมื่อนำเขตข้อมูลหลายเขตข้อมูลมารวมกันจะเรียกว่าเป็น ระเบียนหรือเรคอร์ด (Record) เช่นระเบียนนักศึกษา ประกอบด้วยเขตข้อมูลรหัสนักศึกษา ชื่อนักศึกษา รหัสคณะ และรหัสสาขา เป็นต้น

ระเบียนแต่ละระเบียนของข้อมูลชนิดเดียวกันจะสามารถนำมารวมกันเป็น แฟ้มข้อมูลหรือไฟล์ (File)

รูปที่ 5.4 โครงสร้างแฟ้มข้อมูลในฐานข้อมูล

ปัจจุบันนี้หลายหน่วยงานหันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก บางหน่วยงานถึงกับมีการเปลี่ยนแปลงการทำงานจากระบบเดิมคือระบบการประมวลผลแฟ้มข้อมูลมาเป็นระบบการประมวลผลฐานข้อมูล

จากคำนิยามของฐานข้อมูลหลายคนอาจคิดว่าถ้านำแฟ้มข้อมูลหลายแฟ้มข้อมูลมารวมกันไว้ในที่ที่เดียวกันก็จะกลายมาเป็นฐานข้อมูลได้ ซึ่งข้อความนี้ยังไม่ถูกต้องนัก เนื่องจากฐานข้อมูลจะเป็นยิ่งกว่าการเก็บรวบรวมแฟ้มข้อมูลหลายแฟ้มเข้าด้วยกัน แต่ฐานข้อมูลยังต้องมีการเก็บคำอธิบายเกี่ยวกับโครงสร้างของฐานข้อมูลที่เรียกว่า พจนานุกรมข้อมูล (Data Dictionary) หรืออาจเรียกอีกอย่างว่า เมตะดาต้า (Meta-Datda)

๕.๓ พจนานุกรมข้อมูล (Data Dictionary)

DBMS หลายตัวจะมีการรวมพจนานุกรมข้อมูลเป็นส่วนหนึ่งของ DBMS ซึ่งพจนานุกรมข้อมูลนี้จะเป็นองค์ประกอบทางซอฟท์แวร์ ทำหน้าที่เก็บรายละเอียดเกี่ยวกับข้อมูลภายในฐานข้อมูล เช่น โครงสร้างของแต่ละตาราง ใครเป็นผู้สร้าง สร้างเมื่อใด และแต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง คุณลักษณะของแต่ละเขตข้อมูลเป็นอย่างไร และมีตารางใดที่มีความสัมพันธ์กันบ้าง มีเขตข้อมูลใดเป็นคีย์บ้าง เป็นต้น

ถ้าเปรียบเทียบฐานข้อมูลเหมือนกันห้องสมุดของมหาวิทยาลัยที่มีการเก็บหนังสือเล่มต่างๆ หนังสือเหล่านั้นจะเปรียบเสมือนกับข้อมูลที่เก็บอยู่ภายในฐานข้อมูล และในห้องสมุดจะต้องมีการทำบัญชีรายชื่อหนังสือต่างๆที่เก็บไว้ เพื่อใช้บอกรายละเอียดเกี่ยวกับหนังสือแต่ละเล่มว่าใครเป็นผู้แต่ง เก็บอยู่ที่ใดในห้องสมุด บัญชีรายชื่อหนังสือนี้ก็เปรียบได้กับพจนานุกรมข้อมูล ซึ่งมีหน้าที่อธิบายลักษณะของข้อมูลที่เก็บอยู่ในฐานข้อมูลรวมทั้งความสัมพันธ์ของข้อมูล เช่น ระหว่างระเบียนของแฟ้มข้อมูลหนึ่งและแฟ้มข้อมูลอื่นๆ ซึ่งพจนานุกรมข้อมูลนี้จะถูกเก็บและถูกเรียกใช้งานในระหว่างที่มีการประมวลผลฐานข้อมูล

บทที่ 5 : 5.1 บทนำ : GIS และ ฐานข้อมูล

บทที่ 5 ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

5.1บทนำ : GIS และ ฐานข้อมูล บทที่ ๕

ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์

ระบบสารสนเทศทางภูมิศาสตร์นั้นมีข้อมูลอยู่ 2 รูปแบบ คือ Spatial data และ Non-spatial data ซึ่งได้เรียนรู้มาในบทแรกที่เกี่ยวข้องกับการนำเข้าข้อมูลประเภท Spatial data มาแล้ว ในส่วนต่อมาที่ต้องเกี่ยวข้องกันคือ Non-spatial data หรือข้อมูลเชิงคุณลักษณะ ที่จะต้องสร้างขึ้นเพิ่มเติม หรือค้นหามาจากแหล่งข้อมูลต่างๆ เพื่อจัดทำฐานข้อมูลระบบสารสนเทศทางภูมิศาสตร์ให้สมบูรณ์ขึ้น

๕.๑ บทนำ : GIS และ ฐานข้อมูล

ระบบสารสนเทศทางภูมิศาสตร์นั้นจะมีรากฐานที่สำคัญมากที่สุดคือ ฐานข้อมูล (Database) เพราะฉะนั้นในการเรียนรู้และทำความเข้าใจเทคโนโลยีระบบสารสนเทศทางภูมิศาสตร์ ถ้าเราไม่มีความรู้พื้นฐานเกี่ยวกับฐานข้อมูลเลยเราจะไม่สามารถที่จะเข้าใจและเรียนรู้ได้อย่างบรรลุถึงศาสตร์ของระบบสารสนเทศทางภูมิศาสตร์

ข้อมูลในระบบสารสนเทศทางภูมิศาสตร์จะเก็บอยู่ในรูปแบบฐานข้อมูล ซึ่งจะต้องอาศัยความรู้เฉพาะอย่างในการจัดการข้อมูลเหล่านั้นอย่างเป็นระบบ เช่น ลักษณะโครงสร้างทั่วไปของฐานข้อมูลมาตรฐาน ว่าในปัจจุบันนี้ในการจัดเก็บข้อมูลเหล่านั้นจะเก็บอยู่ในรูปแบบใด

ปัจจุบันนี้ระบบการจัดการฐานข้อมูล (Database Management System — DBMS) ที่มีอยู่ทั่วไปก็สามารถสร้างระบบสารสนเทศทางภูมิศาสตร์ขึ้นมาได้

� จัดซื้อ หรือลงทุนซื้อ DBMS ซึ่งเป็นค่าลงทุนหลักที่สำคัญของระบบซอฟท์แวร์

� DBMS จะมีความสามารถหลายอย่าง ซึ่งสามารถที่จะทำงานร่วมกับ GIS

ระบบการจัดการฐานข้อมูล (DBMS) หลายๆระบบ ทำให้เกิดข้อสมมติฐานที่เกี่ยวข้องกับข้อมูลที่จัดเก็บไว้ในระบบ

� ทำให้เกิดการใช้ประโยชน์ระบบการจัดการฐานข้อมูล (DBMS) ว่าเป็นสิ่งจำเป็นอย่างยิ่ง ต่อการนำมาจัดเก็บหรือนำเข้าข้อมูลดิบ (data) ที่มีอยู่ได้อย่างง่าย

� เป็นชนิดของระบบฐานข้อมูลที่เหมาะสมต่อระบบ GIS มากกว่าระบบอื่นๆ เพราะข้อมูลที่ใช้สามารถนำเข้าเชื่อมโยงกับข้อมูลเชิงพื้นที่ได้ดีกว่าระบบอื่นๆ

ผู้ใช้หลายคนมักจะคาดหวังว่า GIS เป็นทั้งเครื่องมือและฐานข้อมูล (a tool and a database) และมีความพยายามที่จะพัฒนาระบบสารสนเทศภูมิศาสตร์เพื่อให้ได้ตามวัตถุประสงค์ของหน่วยงาน ดังนั้นในบทนี้จึงกล่าวถึงฐานข้อมูลที่เป็นพื้นฐานที่สำคัญของระบบสารสนเทศทางภูมิศาสตร์

บทที่ 4 : 4.3การนำเข้าข้อมูลเชิงคุณลักษณะ

4.3การนำเข้าข้อมูลเชิงคุณลักษณะ บทที่ ๔

โครงสร้างและการนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS Structure and Data Input)

๔.๓ การนำเข้าข้อมูลเชิงคุณลักษณะ

ข้อมูลเชิงคุณลักษณะ หรือลักษณะประจำที่เกี่ยวข้องที่ไม่อิงพื้นที่ (Attribute Data) ได้แก่ คุณสมบัติของเอนติตี้ทางพื้นที่ซึ่งจำเป็นต้องมีการจัดการใน GIS เช่น การดิจิไทซ์เส้นถนน เส้นถนนแต่ละประเภทอยู่ในรูปข้อมูลทางพื้นที่ของ GIS ซึ่งแสดงด้วยสี สัญลักษณ์ หรือตำแหน่งบนแผนที่ ข้อมูลเกี่ยวกับประเภทของถนน อาจรวมในสัญลักษณ์แผนที่ซึ่งมีอยู่ตามปกติอยู่แล้ว เมื่อผู้ใช้งานต้องการบันทึกข้อมูลเกี่ยวกับความกว้างของถนน หรือความหนาของชั้นซีเมนต์ ชนิดของซีเมนต์ วิธีการสร้าง วันที่สร้าง ตำแหน่งของสี่แยกหรือไฟแดง เป็นต้น เนื่องจากข้อมูลเหล่านี้มีเอนติตี้ทางพื้นที่ร่วมกัน เราจึงสามารถเก็บแยกและประมวลผลข้อมูลเหล่านี้ต่างหากได้ โดยไม่รวมกับข้อมูลเชิงพื้นที่ หากเป็นข้อมูลประเภทขอบเขตการปกครองอาจจะใส่ข้อมูลเรื่องประชากรชาย หญิง และรายได้เฉลี่ย เป็นต้น ดังรูปที่ 4.8

รูปที่ 4.8 การนำเข้าข้อมูลเชิงคุณลักษณะ

๔.๒.๓ การเชื่อมข้อมูลพื้นที่กับข้อมูลที่ไม่อิงพื้นที่

เราสามารถกำหนดเครื่องหมายประจำตัวให้แก่เอนติตี้กราฟิกโดยตรง ในการสร้างรูปหลายเหลี่ยม (polygon) จะต้องสร้างรูปหลายเหลี่ยมขึ้นก่อน จากนั้นจึงจะให้เครื่องหมายประจำตัวแก่รูปหลายเหลี่ยมเหล่านั้นโดยการดิจิไทซ์ข้อมูลเข้า

เมื่อนำเข้าข้อมูลทางพื้นที่และให้เครื่องหมายประจำเรียบร้อยแล้ว ควรมีการทวนสอบคุณภาพของข้อมูลด้วย โดยเฉพาะรหัสที่จะกำหนดเป็นตัวเชื่อมโยงระหว่างข้อมูลเชิงพื้นที่กับข้อมูลลักษณะ

ในการเชื่อมต่อข้อมูลนั้นสามารถสร้างตารางคำอธิบายเสริมขึ้นมาได้เป็นจำนวนมาก ในส่วนนี้จะต้องศึกษาทฤษฎีของการออกแบบและสร้างฐานข้อมูล (Database Design) เพื่อให้การสร้างฐานข้อมูลเป็นไปอย่างมีประสิทธิภาพมากขึ้น

การเชื่อมต่อข้อมูลเชิงพื้นที่เข้ากับข้อมูลเชิงคุณลักษณะนั้นจะสามารถทำได้โดยการเชื่อมต่อเพียงชั่วคราว หรือการทำให้เป็นการเชื่อมต่อแบบถาวรได้ โดยกระบวนการทางระบบสารสนเทศภูมิศาสตร์ ซึ่งจะต้องคำนึงถึงขนาดของข้อมูลที่จะมีขนาดใหญ่เพิ่มขึ้นไปด้วย

ฐานข้อมูลใหม่ในตารางใหม่ที่ได้นั้นสามารถนำไปใช้ในการสอบถามค้นหา หรือวิเคราะห์ในขั้นต่อไปได้อย่างมีประสิทธิภาพมากขึ้น หากฐานข้อมูลนั้นมีความถูกต้องจากการเก็บรวบรวมอย่างมีประสิทธิภาพ

รูปที่ 4.9 การเชื่อมข้อมูลเชิงพื้นที่ร่วมกับข้อมูลเชิงคุณลักษณะ

บทที่ 4 : 4.2 การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

4.2 การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์ บทที่ ๔

โครงสร้างและการนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

(GIS Structure and Data Input)

๔.๒ การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์

การนำเข้าข้อมูล หมายถึง การกำหนดรหัสให้แก่ข้อมูล แล้วบันทึกข้อมูลเหล่านั้นลงในฐานข้อมูล การสร้างข้อมูลตัวเลขที่ปราศจากที่ผิด (errors) เป็นงานสำคัญและซับซ้อนที่สุด

การนำเข้าข้อมูลในระบบสารสนเทศภูมิศาสตร์อาจนำเข้าได้ดังกระบวนการดังต่อไปนี้

1) การนำเข้าข้อมูลทางพื้นที่ (Spatial Data) (การดิจิไทซ์)

2) การนำเข้าข้อมูลลักษณะประจำที่เกี่ยวข้องที่ไม่อิงพื้นที่ (Attribute Data)

3) การเชื่อมโยงข้อมูลทางพื้นที่กับข้อมูลลักษณะประจำที่ไม่อิงพื้นที่

ในแต่ละขั้นตอนจะต้องมีการตรวจสอบข้อมูลเพื่อให้แน่ใจว่าฐานข้อมูลที่ได้ให้มีจุดที่ผิดพลาดน้อยที่สุด

๔.๒.๑ การนำเข้าข้อมูลทางพื้นที่

วิธีการนำเข้าข้อมูลทางพื้นที่ใน GIS มีหลายวิธี ซึ่งขึ้นอยู่กับอุปกรณ์ของหน่วยงานนั้นๆ หรืองบประมาณที่สามารถจัดซื้อ ลักษณะของการใช้งาน และชนิดของข้อมูลที่จะนำเข้าด้วย

ชนิดของข้อมูล ได้แก่ แผนที่ที่มีอยู่แล้ว เอกสารจากการสำรวจภาคสนาม เอกสารที่เขียนด้วยมือ ภาพถ่ายทางอากาศ และภาพถ่ายด้วยระบบการรับรู้ระยะไกล (Remotely Sensed Imagery) ข้อมูลจากการสำรวจภาคสนาม เช่น กระบวนการศึกษาชุมชนอย่างรวดเร็ว (Rural Rapid Appraisal -RRA)

(1) การนำเข้าข้อมูลสู่ระบบเวกเตอร์ด้วยมือ

ข้อมูลพื้นฐานของระบบนี้คือ จุด เส้น และพื้นที่ ค่าพิกัดของข้อมูลที่ได้จากกริดอ้างอิงที่มีอยู่ในแผนที่ หรือได้จากการอ้างอิงจากกริดที่นำมาซ้อนบนแผนที่ ข้อมูลเหล่านี้อาจจะพิมพ์เข้าเครื่องเพื่อเก็บในแฟ้มข้อมูลธรรมดา หรือนำเข้าสู่โปรแกรมก็ได้

(2) การนำเข้าข้อมูลสู่ระบบกริดด้วยมือ

สำหรับระบบกริดนั้น ทั้งจุด เส้น และพื้นที่ ล้วนแสดงด้วยช่องกริด

(2.1) เลือกขนาดของช่องกริด (ราสเตอร์) แล้ววางแผ่นกริดโปร่งใสตามขนาดที่เลือกซ้อนบนแผนที่

(2.2) กรอกค่าลักษณะประจำของแผนที่หนึ่งค่าต่อช่องกริดหนึ่งช่อง หรือใช้สีสัญลักษณ์แทน

(2.3) พิมพ์เข้าแฟ้มข้อความในคอมพิวเตอร์

(3) การนำเข้าด้วยการดิจิไทซ์

การเขียนรหัสและพิมพ์รหัสนำเข้าแฟ้มคอมพิวเตอร์จะต้องใช้เวลาและค่าใช้จ่ายสูง เราสามารถใช้เครื่องอ่านพิกัดในการกำหนดรหัส (X,Y) ให้แก่จุด เส้น และพื้นที่ หรือช่องกริดได้อย่างรวดเร็วขึ้น สำหรับเครื่องอ่านพิกัดที่นิยมใช้กันมากคือ Digitizer ซึ่งเครื่องที่ใช้สำหรับการทำแผนที่หรืองานกราฟิกคุณภาพสูงชนิดที่นิยมกันในปัจจุบัน ได้แก่ แบบที่ใช้ลวดเส้นเล็กๆ สานตัดกันในแนวฉากเป็นกริด หรือชนิดที่ใช้เฟสคลื่นไฟฟ้า มีขนาดตั้งแต่ 11×11 นิ้ว ถึงขนาด 40×60 นิ้ว ทั้งแบบวางบนโต๊ะหรือมีขาตั้งในตัว ทั้งที่มีและไม่มีแสงส่องจากใต้โต๊ะ

คอมพิวเตอร์จะติดต่อกับเครื่องอ่านพิกัดได้ด้วยคำสั่งทางเมนูกราฟฟิก ค่าพิกัดของจุดที่อยู่บนกระดานเครื่องอ่านพิกัดจะถูกส่งไปยังคอมพิวเตอร์ทางปากกาแม่เหล็กที่ลากด้วยมือ ซึ่งเป็นอุปกรณ์ง่ายๆ ที่เรียกว่า “เมาส์” (Mouse) หรือ “พัค” (Puck) สำหรับการทำแผนที่ซึ่งต้องการความถูกต้องสูง ในเมาส์จะมีขดลวดฝังอยู่ในกล่องพลาสติกซึ่งมีช่องพร้อมกับกากบาทซึ่งออกแบบเพื่อให้มีความถูกต้องแม่นยำสูงขึ้น พิกัดของจุดจะถูกดิจิไทซ์ด้วยการวางเส้นกากบาทเหนือจุดที่ต้องการแล้วกดปุ่มบนเมาส์

รูปที่ 4.5 เครื่องวาดพิกัด Digitizer

เครื่องอ่านพิกัดใช้ในการนำเข้าข้อมูลในรูปแบบ จุด เส้น และพื้นที่หลายเหลี่ยม โดยอาศัยการทำงานร่วมกับโปรแกรมประยุกต์ด้าน GIS ส่วนการแปลงเป็นฐานข้อมูลเวกเตอร์หรือกริด (ราสเตอร์) ทำด้วยโปรแกรมหลังการดิจิไทซ์

(4) การแปลงเวกเตอร์ให้เป็นกริด การแปลงข้อมูลเวกเตอร์ให้เป็นราสเตอร์ทำให้มีการสูญเสียข้อมูลโดยไม่สามารถหลีกเลี่ยงได้ เพราะจุดภาพที่ใกล้เส้นของมักคลาดเคลื่อนหรือมีรหัสผิดไป การสูญเสียความถูกต้องแปรผันตามขนาดของช่องกริด คือช่องกริดยิ่งเล็กมากเท่าไร ความผิดพลาดยิ่งลดลง ดังรูปที่ 5.6

เครื่องอ่านพิกัดที่มีความละเอียดสูง 0.001 นิ้ว (0.0254 มม.) มีค่าเบี่ยงเบนไม่ควรจะเกิน + 0.07-0.15 มม. ความผิดพลาดเกิดจากความเหนื่อยล้าจากการทำงาน ไม่ควรทำงานกับเครื่องอ่านพิกัดเกิน 4 ชั่วโมงต่อวัน ถ้าต้องการงานที่มีคุณภาพสม่ำเสมอ

เมื่อแผนที่ถูกดิจิไทซ์แล้ว สามารถบันทึกเก็บไว้ในเทปแม่เหล็กเพื่อการใช้ประโยชน์ต่อไป ขณะที่การทำแผนที่ด้วยคอมพิวเตอร์มีความสำคัญมากขึ้น ได้มีการแปลงแผนที่ภูมิประเทศมาตรฐาน และแผนที่ดิน ธรณีวิทยา การใช้ที่ดิน ฯลฯ เป็นข้อมูลเชิงตัวเลขมากขึ้น การดิจิไทซ์ก็ยังคงจะต้องกระทำในการทำแผนที่นั้นๆ ให้ทันสมัยยิ่งขึ้น

แต่การดิจิไทซ์เป็นงานที่ใช้เวลา และพลังงาน การทำแผนที่ฉบับหนึ่งๆ ให้มีความถูกต้อง อาจใช้เวลาเท่าๆ กับการเขียนใหม่ด้วยมือ อัตราความเร็วเฉลี่ยของการดิจิไทซ์ประมาณ 10 ซม. ต่อนาที การดิจิไทซ์แผนที่ดินมาตรส่วน 1:50,000 ขนาด 60×40 ซม. ต้องใช้เวลาประมาณ 20-40 คน-ชั่วโมง

เมื่อได้มีการนำเข้าข้อมูลแผนที่เข้าสู่ระบบ Vector แล้วเราสามารถแปลงไปเป็น Raster ได้โดยมีรูปแบบของทฤษฎีในการแปลงไปสู่ระบบราสเตอร์ คือ
1. จากรูป 5.7 a ให้พิจารณาว่า “อยู่หรือไม่อยู่บนเส้น presence/absence” ์ เช่นการแปลงเส้นแม่น้ำซึ่งอยู่ในรูปแบบเวกเตอร์ ให้ไปอยู่ในรูปแบบราสเตอร์ โดยพิจารณาว่าเส้นลากผ่านที่กริดหรือเซลใด ให้เซลนั้นมีความหมายรหัสเป็น 1 คือแม่น้ำ
2. จากรูปที่ 5.7 b ให้พิจารณาว่า “ผ่านกึ่งกลางกริด centroid-of-cell method” ตัวอย่างเช่น ถ้ามีการแบ่งการใช้ที่ดินเป็น 2 ประเภทคือ 1 เป็นป่าไม้ และ 2 คือทุ่งหญ้า จากรูป ถ้าเราแปลงจากเวกเตอร์ซึ่งเป็นขอบเขตของโซนแบ่งการใช้ที่ดิน 2 ประเภทนั้น โดยอาศัยการพิจารณาว่า เส้นแบ่งเขตลากผ่านกึ่งกลางเซลใดมากกว่ากัน หรือขอบเขตโซนกินเนื้อที่ของกึ่งกลางเซลการใช้ที่ดินประเภทใดให้ยึดหรือจำแนกเป็นรหัสการใช้ที่ดินประเภทนั้นโดยไม่สนใจว่ารูปแบบการใช้ที่ดินใดมีเนื้อที่มากกว่ากัน แต่อาศัยจุดศูนย์กลางเซลหรือกริดเป็นตัวแบ่ง
3. รูปที่ 5.7 c ให้พิจารณาว่า “ที่มีมากที่สุด dominant type method” ตัวอย่างเช่น ให้เส้นแบ่งเขตการใช้ที่ดินเป็นตัวแบ่ง และตัวแบ่งนั้นกินเนื้อที่เขตการใช้ที่ดินประเภทใดมากกว่ากัน ให้ยึดเป็นการใช้ที่ดินประเภทที่มากนั้นเป็นหลัก
4. รูปที่ 5.7 d ให้พิจารณาว่า “คิดตามเปอร์เซ็นต์ที่ผู้ใช้สนใจหรือตั้งเงื่อนไข persent occurrence method” โดยให้พิจารณายึดผู้ใช้ซึ่งเป็นผู้ตั้งเงื่อนไขความสนใจของประเภทการใช้ที่ดินนั้น และถ้าประเภทการใช้ที่ดินนั้นอยู่เต็ม pixel ให้เป็น 100% โดยถ้ามีการผสมกันให้ยึดการใช้ที่ดินที่สนใจเป็นหลัก ส่วนที่ไม่สนใจให้ค่าเป็น 0% นั่นเอง

รูปที่ 4.7 กระบวนการในการนำเข้าข้อมูลประเภทราสเตอร์ มี 4 ขั้นตอนในการนำเข้าข้อมูลประเภทราสเตอร์ (a) อยู่หรือไม่อยู่บนเส้น presence/absence (b) ผ่านกึ่งกลางกริด centroid-of-cell method (c) ที่มีมากที่สุด dominant type method (d) คิดตามเปอร์เซ็นต์ที่ผู้ใช้สนใจหรือตั้งเงื่อนไข persent occurrence method

Source : Michael N. Demers, Fundamentals of Geographic Information System, John Wiley & Sons, Inc., 1997, Figure 5.6, Page 143.

ข่าวสารย้อนหลัง
Who's Online
3 visitors online now
2 guests, 1 bots, 0 members
Powered by Visitor Maps