SlideShare una empresa de Scribd logo
1 de 45
Descargar para leer sin conexión
เทคโนโลยีการค้นคืน
    สารสนเทศ
หัวข้อบรรยาย
เทคโนโลยีการค้นคืน
  ดรรชนี/คาค้น
  ระบบจัดเก็บ/ฐานข้อมูล
  ส่วนต่อประสานการค้นคืน/ผู้ใช้ (Retrieval
  Interface)
  หลักการค้นคืน
  กลวิธการค้นคืน
       ี

ตัวอย่างเทคโนโลยีการสืบค้น
เทคโนโลยีการค้นคืน
เทคโนโลยีการค้นคืนสารสนเทศจะเกี่ยวข้องกับ
 – ดรรชนี หรือ คาค้น
 – ระบบจัดเก็บ/ฐานข้อมูลทีใช้
                          ่
    - ระบบจัดเก็บเอกสารฉบับเต็ม / สื่อมัลติมีเดีย
    - ฐานข้อมูลที่พัฒนาขึ้นเอง / ฐานข้อมูลสาเร็จรูป / ฐานข้อมูลออนไลน์/บนเครือข่ายอินเทอร์เน็ต

– ส่วนต่อประสานการค้นคืน/ผู้ใช้
         –   การค้นคืนด้วยการใช้คาสั่ง
         –   เมนูทางเลือก
         –   การปรับแต่งโดยตรง
         –   การเติมคา

– หลักการของการค้นคืน
         –   ภาษาสอบถาม
         –   ภาษาธรรมชาติ
         –   ภาษาสืบค้นอุบัติใหม่ เช่น TAG
         –   โครงสร้างของข้อคาถาม

– กลวิธีการค้นคืน/กลยุทธ์การค้นคืน
        - การใช้บูเลียน               - การใช้คาที่อยู่ใกล้เคียงกัน
        - การใช้พิสัย                 - การระบุเขตข้อมูล
        - การตัดคา
ดรรชนี หรือ คาค้น
ในระยะแรกของการค้นคืนสารสนเทศ มีการใช้ชื่อผู้แต่ง
(Author) ชื่อเรื่อง (Title) และหัวเรื่อง (Subject Headings)
เป็นคาค้น
   เรียกเป็นดรรชนีผู้แต่ง (Author Index) ดรรชนีชื่อเรื่อง
   (Title Index) และดรรชนีหัวเรื่อง (Subject Index)

ต่อมาด้วยความก้าวหน้าของเทคโนโลยีจึงมีการกาหนดคา
สาคัญ (Keywords) เป็นคาค้น เรียกว่า ดรรชนีคาสาคัญ
(Keyword Index)

พัฒนามาใช้ Taxonomy        Thesaurus      Ontology

ในปัจจุบันมีการให้ความสาคัญกับผู้ใช้มากขึ้น
คาค้นที่ผู้ใช้กาหนดหรือมีส่วนร่วมจึงเกิดขึ้น ในลักษณะที่
เรียกว่า Tag / Folksonomy
http://www.digitized-thailand.org/
http://library.tcdc.or.th/
ดรรชนี หรือ คาค้น                          (ต่อ)

การทาดรรชนีมี 2 วิธี คือ
   1. การดึงคาจากเอกสารโดยตรง (Extraction Method)
       ใช้คน หรือเครื่องจักรทาก็ได้ กาหนดเป็นศัพท์ไม่ควบคุม (Uncontrolled
       Vocabulary) โดยกาหนดคาค้นจาก Title Abstract Content ได้
       พัฒนาให้เป็นวลี (Phrase)

   2. การกาหนดคาจากเนื้อหาเอกสาร (Assignment Method)
       ใช้คน หรือเครื่องจักรทาก็ได้ กาหนดเป็นศัพท์ควบคุม (Controlled
       Vocabulary) โดยกาหนดคาค้นจากเนื้อหาของเอกสารนั้นๆ ได้พัฒนา
       เป็น Thesaurus Taxonomy Ontology
ระบบจัดเก็บ/ฐานข้อมูล
ระบบจัดเก็บ/ฐานข้อมูลที่ใช้
  เทคโนโลยีที่ใช้ในการจัดเก็บ
  ซอฟต์แวร์
  วิธีการต่อประสานกับผู้ใช้
ผู้ใช้จาเป็นต้องทาความเข้าใจก่อนเลือกใช้ระบบ/
ฐานข้อมูลเพื่อให้เกิดประสิทธิภาพและประสิทธิผล
ความหมายฐานข้อมูล
• มาจากศัพท์ภาษาอังกฤษว่า database
• หมายถึง (Rothwell อ้างถึงใน เดชา นันทพิชัย, 2546: 28)

     แหล่งสะสมข้อเท็จจริงต่างๆ โดยรวบรวมข้อมูลที่มี
     ความสัมพันธ์กันไว้ด้วยกัน และมีโปรแกรมการจัดการ
     ฐานข้อมูล (Database Management System- DBMS)
     มาช่วยในการจัดเก็บ จัดเรียง และสืบค้นสารสนเทศ
     รวมถึงปรับปรุงข้อมูลให้ทันสมัยอยู่เสมอ
ความหมายฐานข้อมูล                                (ต่อ)

• Databases are searchable collections of records.
• The Libraries' databases allow you to search for
     many different types of materials (articles in
     journals, images, primary sources,
     newspaper articles, books, and more)
     important for your research.

         (http://libraries.claremont.edu/help/glossary.asp)
ประเภทฐานข้อมูล

1. ฐานข้อมูลอ้างอิง (Reference Databases)
   บางครั้งเรียกว่า ฐานข้อมูลบรรณานุกรม
   (Bibliographic Databases)

2   . ฐานข้อมูลต้นแหล่ง (Source Databases)
       Non-bibliographic Databases Factual
       Databases บางครั้งเรียกว่า ธนาคารข้อมูล
       (Databank)
ประเภทฐานข้อมูล                           (ต่อ)

• หรือจาแนกออกตามสาขาวิชาเป็น
  1. ฐานข้อมูลมนุษยศาสตร์
  2. ฐานข้อมูลสังคมศาสตร์
  3. ฐานข้อมูลวิทยาศาสตร์ และเทคโนโลยี

• นอกจากนั้นอาจจาแนกเป็น

  1. ฐานข้อมูลซีดีรอม (CD-ROM Database)
  2. ฐานข้อมูลสาเร็จรูป (Package Database)
  3. ที่พัฒนาขึ้นเอง (In-house Database)
  4. ฐานข้อมูลออนไลน์ (Online Database)
ประเภทฐานข้อมูล (ต่อ)
1. ฐานข้อมูลซีดีรอม (CD-ROM Database)
       = ฐานข้อมูลสาเร็จรูปบันทึกในรูปของซีดีรอม เน้นข้อมูลตาม
 สาขาวิชา เช่น AGRICOLA MEDLINE ได้รับความนิยมในยุคแรก
 ของการคืนค้นด้วยคอมพิวเตอร์
 ข้อด้อย: 1. การสมัครเป็นสมาชิกแพง (ในยุคนั้น) 2. เปลี่ยน
 ฮาร์ดแวร์เมื่อเทคโนโลยีเปลี่ยน
ประเภทฐานข้อมูล                             (ต่อ)
2. ฐานข้อมูลสาเร็จรูป (Package Database) เป็นระบบ
   ฐานข้อมูลสาเร็จรูปทีผู้พฒนาพัฒนามาเพื่อจาหน่ายให้กับ
                       ่   ั
   หน่วยงาน (เช่น HORIZON, VTLS, INNOPAC)
3. ฐานข้อมูลที่พฒนาขึ้นเอง (In-house Database)
                ั
   เป็นระบบฐานข้อมูลที่หน่วยงานออกแบบพัฒนาเพือรองรับงาน
                                             ่
   ต่างๆ ที่ต้องการ
4. ฐานข้อมูลออนไลน์ (Online Database) ฐานข้อมูล
  เพื่อการค้นให้บริการออนไลน์ เน้นฐานข้อมูลตามสาขาวิชา เช่น
  ERIC ScienceDirect ฯลฯ โดยมักจะต้องมีการบอกรับเป็นสมาชิก
  คิดค่าใช้จ่าย (จานวนครังที่ใช้ จานวนผู้ใช้ จานวน จานวน
                           ้
  คอมพิวเตอร์ทเชื่อมโยงกับฐานข้อมูล) จุดด้อยคือ 1. ค่าใช้จ่ายสูง
                 ี่
  2. ใช้ค่อนข้างยาก เพราะต้องเรียนรู้การใช้คาสั่งการค้นคืนของแต่
  ละฐานที่แตกต่างกัน 3. ต้องเชื่อมต่ออินเทอร์เน็ต 4. มักจากัดการ
  ใช้ตามพื้นที่ อย่างไรก็ดีในปัจจุบันมีฐานข้อมูลออนไลน์แบบเปิดถูก
  พัฒนาเพื่อทดแทนปัญหาข้างต้น
เทคโนโลยีการค้นคืน
มีประเด็นที่ควรพิจารณาเกี่ยวกับการค้นคืน ได้แก่

1. ส่วนต่อประสานการค้นคืน (Retrieval Interface)
2. หลักของการค้นคืน
3. กลวิธีการค้นคืน (Search Strategy)
เทคโนโลยีการค้นคืน                              (ต่อ)

1. ส่วนต่อประสานการค้นคืน (Retrieval Interface)
   หมายถึงวิธการ ดังนี้
             ี

   1) การค้นคืนด้วยการใช้คาสั่ง (Command)

   2) เมนูทางเลือก (Menu Selection)

   3) การเติมคา (Form Fill-in)

   4) การใช้ภาษาธรรมชาติ (Natural Language)

   5) การปรับแต่งโดยตรง (Direct Manipulation)
เทคโนโลยีการค้นคืน                            (ต่อ)

1) การค้นคืนด้วยการใช้คาสั่ง (Command)
      เป็นการสั่งให้คอมพิวเตอร์ทางานตามคาสั่ง
       โดยพิมพ์คาสั่งในการค้นคืนลงไป
       เช่น    begin/b
              select/s
              type/t
             logoff             เป็นต้น
1. Find references to adolescent pregnancy
  ?b207




                 (set/format/records)        ?logoff
เทคโนโลยีการค้นคืน                              (ต่อ)

 2) เมนูทางเลือก (Menu Selection)
       - เป็นการเลือกรายการทางานตามเมนูรายการเลือก
       - อาจเลือกเป็นข้อความสั้นๆ รูปภาพ ไอคอน
       - โดยการพิมพ์รหัสบางตัวเป็น ตัวเลข ตัวอักษร หรือโดย
               การใช้ตัวชี้
เทคโนโลยีการค้นคืน                                (ต่อ)
3) การเติมคา (Form Fill-in)

   เป็นการกรอกข้อความที่จาเป็นลงบนแบบฟอร์มที่ปรากฏบนจอภาพ
เทคโนโลยีการค้นคืน                                       (ต่อ)

4) การปรับแต่งโดยตรง (Direct Manipulation)

   ใช้เทคนิค GUI (Graphic User Interface)

   เช่น การใช้วินโดว์ส ไอคอน   เมนู ตัวชี้   hypertext
   hypermedia

   ดูตัวอย่างที่ http://www.google.com/ig
        (iGoogle สามารถปรับแต่งหน้าจอการสืบค้นด้วยตนเอง)
เทคโนโลยีการค้นคืน                            (ต่อ)


5) การใช้ภาษาธรรมชาติ (Natural Language) ผ่านการใช้
  เสียงพูด  โดยไม่ได้ป้อนคา
เทคโนโลยีการค้นคืน                           (ต่อ)
2. หลักของการค้นคืน

   2.1 ภาษาสอบถาม (Query Language)
        2.1.1 ข้อคาถามที่ใช้คาสาคัญ (Keyword-based
                     Query)
        2.1.2 การจับคู่รปแบบ (Pattern Matching)
                        ู

   2.2 ภาษาธรรมชาติ (Natural Language)

   2.3 ภาษาสืบค้นอุบัติใหม่ (New Technology/
              Emerging Language)

   2.4 โครงสร้างของคาถาม
เทคโนโลยีการค้นคืน                             (ต่อ)
2. หลักของการค้นคืน (ต่อ)
   2.1 ภาษาสอบถาม (Query Language)
        2.1.1 ข้อคาถามที่ใช้คาสาคัญ (Keyword-based
                    Query)
               = ใช้คา (Word) เป็นตัวค้น ได้แก่ คาเดี่ยว
                      (Single-word)           วลี (Phrase)
                      คาที่อยู่ใกล้เคียงกัน (Proximity)
                      การใช้ Boolean Logic          เช่น
                      วิทยานิพนธ์ AND สารสนเทศศึกษา

        2.1.2 การจับคู่รปแบบ (Pattern Matching)
                        ู
              = ใช้คาถาม เปรียบเทียบกับ คา ที่ตรงกัน ที่อยู่ใน
                     เอกสาร ได้แก่ คานาหน้า (Prefix)
                      คาต่อท้าย (Suffix)   พิสัย (Range)
                      การลาดับอักขระ (Sequence of Character)
                      สายอักขระย่อย (Substring)       เป็นต้น
เทคโนโลยีการค้นคืน                                             (ต่อ)
2. หลักของการค้นคืน (ต่อ)

     2.2 ภาษาธรรมชาติ (Natural Language)
            เป็นการติดต่อกับระบบด้วยภาษาที่ใช้ในชีวิตประจาวัน
            เช่น “ช่วยหาเบอร์โทรของคุณสมชายได้ไหมครับ”
ระบบจะสามารถวิเคราะห์ได้ว่า ผู้ใช้ต้องการสืบค้นเบอร์โทรศัพท์ของบุคคลชื่อ
สมชาย
                   อยากทราบราคาทองคาวันนี้
                   (35+7)*3 ได้เท่าไหร่
เทคโนโลยีการค้นคืน                               (ต่อ)
2. หลักของการค้นคืน (ต่อ)

   2.3 ภาษาสืบค้นอุบัติใหม่ (New Technology/
        Emerging Language)
        เช่น   การสืบค้นโดยใช้ TAG (ป้ายกากับ)
               การสืบค้นโดยระบุสี
               การสืบค้นโดยใช้การวาดภาพ
               การสืบค้นแล้วให้ผลการสืบค้นในรูปแบบ
                      Knowledge
http://library.tcdc.or.th/
http://www.wolframalpha.com
เทคโนโลยีการค้นคืน                                   (ต่อ)
2. หลักของการค้นคืน (ต่อ)
   2.4 โครงสร้างของคาถาม         มี 3 ลักษณะ
        2.4.1 โครงสร้างทีมรปแบบทีแน่นอน (Form-like
                         ่ ี ู   ่
              Fixed Structure)
              เป็นการเติมคา ผลการค้นคืนต้องได้ตามคาถามที่
                     ป้อน จะไม่ยืดหยุ่น

        2.4.2 โครงสร้าง Hypertext
              เป็นการเชื่อมโยงคาถามจากเอกสารชุดหนึ่งไปยัง
                     ชุดอื่นๆ ที่เกี่ยวข้อง ผลการค้นคืนจะยืดหยุ่น
                     ได้ผลลัพธ์มาก

        2.4.3 โครงสร้างลาดับชัน (Hierarchical
                              ้
              Structure)
              เป็นโครงสร้างที่อยู่ระหว่างกลางของโครงสร้างที่ไม่
                     ยืดหยุ่น และโครงสร้างที่ยืดหยุ่น
เทคโนโลยีค้นคืน                                   (ต่อ)
3. กลวิธีการค้นคืน (Search Strategy)
    หรือ Search Tips ที่จะช่วยให้สามารถค้นคืนได้เฉพาะเจาะจง
และเข้าเรื่องได้ดีขึ้น อาจใช้สัญลักษณ์แตกต่างกันไปตามแต่ละ
ฐานข้อมูลและซอฟต์แวร์ที่ใช้       มีดังนี้

     3.1 การใช้บเลียน (Boolean Logic)
                ู
             AND (+)       OR (,)    ANDNOT/ NOT (-)

    3.2 การใช้คาที่อยู่ใกล้เคียงกัน หรือระบุระยะห่างระหว่าง
คาค้น (Adjacency/ Proximity)
            คือ การระบุตาแหน่งของคาค้น 2 คาว่าต้องปรากฏตาแหน่งที่
อยู่ในเอกสารติดกัน หรือใกล้เคียงกัน โดยมีคาอื่นอยู่คั่นกลางได้ตั้งแต่ 1 คา
ขึ้นไป รูปแบบการใช้ขึ้นอยู่กับฐานข้อมูล      เช่น
                              information same technology
                              information ADJ technology
                              cost n1 living
เทคโนโลยีการค้นคืน                                       (ต่อ)
3. กลวิธีการค้นคืน (Search Strategy) (ต่อ)
   3.3 การใช้พิสัย (Range Search)
         ใช้กับเงื่อนไขที่เป็นตัวเลขโดยกาหนดพิสัย หรือช่วงของ
                   ตัวเลขได้ เช่น     2553-2554          เป็นต้น

   3.4 การระบุเขตข้อมูล (Field Search/ Limiting Search)
         เป็นการค้นหาคาที่ปรากฏอยู่ในเขตข้อมูลที่กาหนด เช่น
                AU:cohen               URL:rose
   3.5 การตัดคา (Truncation/ Word Stemming)
         การค้นโดยใช้รากคา เช่น ค้นคาว่า comp* ก็จะได้ทุกคาที่
                ขึ้นต้นด้วย comp ที่ปรากฏอยู่ในเอกสาร เช่น
                computer computation ฯลฯ
ตัวอย่างเทคโนโลยีการสืบค้น
http://www.digitized-thailand.org/index.php?option=com_content&view=article&id=43&Itemid=105&lang=th



    เทคโนโลยีสืบค้นสารสนเทศ หรือ Search
    Technology เป็นการวิจัยและพัฒนาที่ได้รวมเอาเทคนิค
    หลากหลายด้านมาประกอบกันเพื่อให้การสืบค้นมีประสิทธิภาพและ
    ตอบสนองต่อความต้องการของผู้ใช้มากที่สุด โดยเทคโนโลยีที่
    พัฒนาขึ้นสามารถรองรับการสืบค้นเอกสารทั่วไปแบบเต็มเนื้อหา
    (Full-Text Search)      การสืบค้นเชิงความหมายโดยผ่าน
    การสร้างองค์ความรู้แบบออนโทโลยี (Ontology) ซึ่งเป็นการ
    จัดระบบความสัมพันธ์ของหน่วยภาษา    การสืบค้นในรูปแบบ
    ภาษาธรรมชาติโดยใช้ AIML (Artificial Intelligence
    Markup Language) การสืบค้นแบบพ้องเสียง
    (Soundex)       การสืบค้นแบบพ้องความหมาย (Synonym
    Search)     นอกจากนียังนาเอาเทคโนโลยีเว็บ 2.0 มาประยุกต์ใช้
                         ้
    คือ การกากับข้อมูลเชิงสังคม (Social Tagging)
ตัวอย่างเทคโนโลยีการสืบค้น                  (ต่อ)


บนพืนฐานของการวิจยและพัฒนา ทีมวิจัยได้นา
     ้            ั
เทคโนโลยีการสืบค้นสารสนเทศมาประยุกต์ใช้เพือพัฒนา
                                           ่
เป็นระบบต้นแบบสาหรับการให้บริการสืบค้นข้อมูล อาทิ
ระบบสรรสาร (Sansarn) และระบบผู้ช่วยออนไลน์
อับดุล (ABDUL – Artificial BuDdy U Love) ซึ่ง
เป็นระบบถามตอบอัตโนมัติผ่านโปรแกรม Windows Live
Messenger (MSN)
ตัวอย่างเทคโนโลยีการสืบค้น                      (ต่อ)




รูปที่ 1 โครงสร้างทางสถาปัตยกรรมของเทคโนโลยีสืบค้นสารสนเทศ
ตัวอย่างเทคโนโลยีการสืบค้น                   (ต่อ)



โครงสร้างทางสถาปัตยกรรมของเทคโนโลยีสืบค้น
สารสนเทศ ประกอบด้วย 4 ส่วนหลัก
1.   การเก็บรวบรวมสารสนเทศ
2.   การประมวลผลภาษาและการวิเคราะห์เชิงความหมาย
3.   การเข้าถึงสารสนเทศ
4.   การสร้างทรัพยากรทางภาษา
ตัวอย่างเทคโนโลยีการสืบค้น                           (ต่อ)



1. การเก็บรวบรวมสารสนเทศ
     การเก็บรวบรวบสารสนเทศจะเริ่มจากการเก็บข้อมูล (Data
Collecting) ทีอยู่ในหลากหลายแหล่ง ไม่ว่าจะเป็นข้อมูลทีอยู่
               ่                                      ่
บนอินเทอร์เน็ตหรือบนระบบฐานข้อมูล รวมทั้งสารสนเทศใน
รูปแบบต่างๆ เช่น หน้าเว็บ ไฟล์เอกสาร และฐานข้อมูล รวมทั้งการ
สกัดข้อความจากเอกสาร (Document Parsing) ในรูปแบบต่างๆ
เช่น HTML PDF หรือ Open Office เป็นต้น
ตัวอย่างเทคโนโลยีการสืบค้น                                  (ต่อ)

2. การประมวลผลภาษาและการวิเคราะห์เชิง
ความหมาย
    นาข้อมูลต่างๆ เข้าสูการประมวลผลทางภาษาและวิเคราะห์เชิง
                        ่
ความหมาย โดยเริ่มจาก
         - การตัดคาจากข้อความ (Tokenization) โดยใช้โปรแกรม
ตัดคาเล็กซ์โต (LexTo) มาใช้ตัดแบ่งข้อความออกเป็นคาเพื่อนาไป
สร้างดัชนีหรือประมวลผลต่อไป
         - การสืบค้นแบบพ้องเสียงและการแก้ไขคาค้นคืนทีสะกด    ่
ผิด (Soundex and Word Approximation) เป็นการช่วยเหลือผู้ใช้ใน
การสะกดคาหรือในกรณีที่พิมพ์ผิด เช่น ผู้ใช้สามารถพิมพ์ “พาติเคิ่น
บอด” เพื่อให้ระบบแนะนาคาที่ออกเสียงเหมือนคือ “พาร์ตเคิลบอร์ด -
                                                        ิ
particle board” หรือ “เสือจันทะบูน” ระบบจะสามารถหาคาที่สะกดได้
                          ่
ถูกต้องคือ “เสื่อจันทะบูร” หรือในกรณีที่สะกดผิด เช่น “กรดาษสา” ระบบ
สามารถหาคาที่สะกดได้ถกต้องคือ “กระดาษสา”
                            ู
ตัวอย่างเทคโนโลยีการสืบค้น                                  (ต่อ)

2. การประมวลผลภาษาและการวิเคราะห์เชิง
ความหมาย    (ต่อ)

       - การวิเคราะห์รปแบบข้อความ (Pattern Analysis) เป็นการ
                      ู
รองรับการสืบค้นในรูปแบบภาษาธรรมชาติ โดยมีการเปรียบเทียบ
รูปแบบข้อความการร้องขอข้อมูลจากผู้ใช้ เช่น “ช่วยหาเบอร์โทรของคุณ
สมชายได้ไหมครับ” ระบบจะสามารถวิเคราะห์ได้วา ผูใช้ตองการสืบค้น
                                              ่ ้   ้
เบอร์โทรศัพท์ของบุคคลชื่อสมชาย
         - การอนุมานเชิงความหมาย (Semantic Inference) เป็นการ
รองรับการสืบค้นในรูปแบบเชิงความหมาย โดยการใช้ออนโทโลยีที่
สร้างขึ้นมา เช่น ในกรณีที่เป็นข้อมูลเฉพาะของบุคคล ผู้ใช้สามารถถามว่า
“เรียนจบโทจากประเทศไหน” ระบบจะทาการค้นหาในออนโทโลยีเกี่ยวกับ
สถานศึกษาระดับปริญญาโทของบุคคลที่ถาม และเมือได้ชื่อสถานศึกษา
                                                ่
แล้ว ระบบจะทาการค้นคืนต่อว่าอยู่ในประเทศใด จากนันจึงส่งคาตอบเป็น
                                                  ้
ชื่อประเทศให้กับผู้ใช้
ตัวอย่างเทคโนโลยีการสืบค้น                              (ต่อ)

3. การเข้าถึงสารสนเทศ
     การวิจัยและพัฒนาในส่วนนี้ จะครอบคลุม
          - การสร้างฐานดัชนีและการค้นคืน (Indexing &
Retrieval) เพื่อรองรับการค้นคืนแบบเต็มเนือหา (Full-Text
                                         ้
Search) โดยข้อความในเอกสารทุกส่วนที่ผ่านการตัดคาแล้วจะ
นามาสร้างเป็นฐานดัชนี เพื่อให้การสืบค้นทาได้อย่างรวดเร็ว ในด้าน
ประสิทธิภาพของการทางานนั้น เทคโนโลยีที่พัฒนาขึ้นจะมีความเร็ว
ในการสร้างดัชนีประมาณ 1 นาทีต่อข้อความขนาด 100 MB ส่วน
การค้นคืนใช้เวลาน้อยกว่า 1 วินาทีต่อการสืบค้น 1 ครั้ง
         - การประมวลคิวรี (Query Processing) เป็นการ
ประมวลผลข้อความที่ผู้ใช้พิมพ์เข้ามา เช่น ถ้าเป็นข้อความร้องขอ
ระบบจะส่งไปวิเคราะห์รูปแบบข้อความร้องขอ ถ้าเป็นวลี ระบบจะทา
การตัดคาและนาไปค้นคืนจากฐานดัชนี
ตัวอย่างเทคโนโลยีการสืบค้น                                            (ต่อ)

4. การสร้างทรัพยากรทางภาษา
      การสร้างทรัพยากรภาษา เป็นส่วนสาคัญที่ทาให้ระบบการสืบค้นสารสนเทศ
มีความสมบูรณ์และมีประสิทธิภาพ พัฒนาแบ่งเป็น
          - การสร้างรูปแบบ AIML (AIML Pattern Construction) เพื่อ
รองรับการสืบค้นในรูปแบบภาษาธรรมชาติ รวมทั้งใช้สนทนาโต้ตอบระหว่างระบบ
เอเจนท์กับผู้ใช้ เช่น เมื่อผู้ใช้ทักทายว่า “สวัสดีครับ คุณชื่ออะไรครับ” ระบบจะ
ค้นหารูปแบบข้อความที่ตรงกัน จากนั้นคืนข้อความกับไปที่ผู้ใช้ว่า “ผมชื่ออับดุล
ครับ”
           - การกากับข้อมูลเชิงสังคม (Social Tagging) เป็นการให้ผู้ใช้ระบบ
มีส่วนร่วมในการระบุคาสาคัญให้กับสารสนเทศ ไม่ว่าจะเป็นข้อมูล FAQ หรือ
รูปภาพ ทาให้การสืบค้นมีความครอบคลุมและตรงใจกับผู้ใช้มากยิ่งขึ้น
           - การสร้างคาพ้องความหมาย (Synonym Construction) เป็นการ
ระบุคาที่พ้องความหมายให้กับคาสาคัญที่ใช้สืบค้น เหมาะกับข้อมูลที่เป็นโดเมน
เฉพาะด้าน เช่น ในกรณีที่เป็นข้อมูลการออกแบบ สาหรับคาว่า “อาคารพาณิชย์”
สามารถเพิ่มคาพ้องความหมายเป็นคาว่า “ตึกแถว” วิธีนี้จะช่วยให้การสืบค้นมี
ความครอบคลุมสูงขึ้น
บรรณานุกรม
ลัดดา โกรดิ. 2545. “เทคโนโลยีที่ใช้ในการจัดเก็บและการค้นคืนสารสนเทศ.”
       ใน ประมวลสาระชุดวิชาการจัดเก็บและการค้นคืนสารสนเทศ
       (Information Storage and Retrieval), หน่วยที่ 1-4, หน้า 63-106.
       นนทบุรี: สาขาวิชาศิลปศาสตร์ มหาวิทยาลัยสุโขทัยธรรมาธิราช.

โครงการดิจิไทย. 2553. TOOLS : Search Engine เทคโนโลยีการสืบค้น
       [ออนไลน์]. เข้าถึงจาก 2 มิถุนายน 2554, from
       http://digitized-thailand.org/index.php?option=com_content&
       view=article&id=43&Itemid=105&lang=th

http://libraries.claremont.edu/help/glossary.asp

Más contenido relacionado

La actualidad más candente

เอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกาย
เอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกายเอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกาย
เอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกายKan Pan
 
Operating System Chapter 3
Operating System Chapter 3Operating System Chapter 3
Operating System Chapter 3Nuth Otanasap
 
Chapter 10 internet system and information system structures
Chapter 10 internet system and information system structuresChapter 10 internet system and information system structures
Chapter 10 internet system and information system structuresTeetut Tresirichod
 
ตัวอย่างบทคัดย่อเล่มโปรเจ็ค
ตัวอย่างบทคัดย่อเล่มโปรเจ็คตัวอย่างบทคัดย่อเล่มโปรเจ็ค
ตัวอย่างบทคัดย่อเล่มโปรเจ็คtumetr1
 
ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)
ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)
ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)anda simil
 
ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์
ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์
ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์Supaporn Khiewwan
 
ความรู้ทั่วไปเกี่ยวกับห้องสมุด
ความรู้ทั่วไปเกี่ยวกับห้องสมุดความรู้ทั่วไปเกี่ยวกับห้องสมุด
ความรู้ทั่วไปเกี่ยวกับห้องสมุดพัน พัน
 
ใบงานที่ 2
ใบงานที่ 2ใบงานที่ 2
ใบงานที่ 2Fon Edu Com-sci
 
สรุปอินเตอร์เน็ตและการสืบค้นข้อมูล
สรุปอินเตอร์เน็ตและการสืบค้นข้อมูลสรุปอินเตอร์เน็ตและการสืบค้นข้อมูล
สรุปอินเตอร์เน็ตและการสืบค้นข้อมูลHappy Sara
 
ตัวอย่างการเขียนโครงการหลัก
ตัวอย่างการเขียนโครงการหลักตัวอย่างการเขียนโครงการหลัก
ตัวอย่างการเขียนโครงการหลักAlongkorn WP
 
ข้อสอบปลายภาค50ข้อ โปรแกรมword
ข้อสอบปลายภาค50ข้อ โปรแกรมwordข้อสอบปลายภาค50ข้อ โปรแกรมword
ข้อสอบปลายภาค50ข้อ โปรแกรมwordpeter dontoom
 
เฉลยแบบฝึกหัดหนังสืออ้างอิง
เฉลยแบบฝึกหัดหนังสืออ้างอิงเฉลยแบบฝึกหัดหนังสืออ้างอิง
เฉลยแบบฝึกหัดหนังสืออ้างอิงSupaporn Khiewwan
 
Powerpointองค์ประกอบของระบบคอมพิวเตอร์
Powerpointองค์ประกอบของระบบคอมพิวเตอร์Powerpointองค์ประกอบของระบบคอมพิวเตอร์
Powerpointองค์ประกอบของระบบคอมพิวเตอร์Nitiwat First
 
หน่วยที่ 1-เทคโนโลยีรอบตัว
หน่วยที่ 1-เทคโนโลยีรอบตัวหน่วยที่ 1-เทคโนโลยีรอบตัว
หน่วยที่ 1-เทคโนโลยีรอบตัวJanchai Pokmoonphon
 
รายงานอินเทอร์เน็ต
รายงานอินเทอร์เน็ตรายงานอินเทอร์เน็ต
รายงานอินเทอร์เน็ตSarocha Makranit
 
หน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษาหน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษาSrion Janeprapapong
 
เฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docx
เฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docxเฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docx
เฉลยแบบฝึกวิเคราะห์หมวดหมู่.DocxSupaporn Khiewwan
 
รายงาน สังคมออนไลน์
รายงาน สังคมออนไลน์รายงาน สังคมออนไลน์
รายงาน สังคมออนไลน์Pimpimol Hueghok
 

La actualidad más candente (20)

เอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกาย
เอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกายเอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกาย
เอกสารประกอบการเรียน เรื่อง อาหาร สารอาหาร และการเจริญเติบโตของร่างกาย
 
Operating System Chapter 3
Operating System Chapter 3Operating System Chapter 3
Operating System Chapter 3
 
น 13 พฤติกรรมสารสนเทศ.2
น 13 พฤติกรรมสารสนเทศ.2น 13 พฤติกรรมสารสนเทศ.2
น 13 พฤติกรรมสารสนเทศ.2
 
Chapter 10 internet system and information system structures
Chapter 10 internet system and information system structuresChapter 10 internet system and information system structures
Chapter 10 internet system and information system structures
 
ตัวอย่างบทคัดย่อเล่มโปรเจ็ค
ตัวอย่างบทคัดย่อเล่มโปรเจ็คตัวอย่างบทคัดย่อเล่มโปรเจ็ค
ตัวอย่างบทคัดย่อเล่มโปรเจ็ค
 
ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)
ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)
ระบบสารสนเทศเพื่อการตัดสินใจ (Decision Support System)
 
ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์
ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์
ส่วนประกอบหนังสือวารสารและหนังสือพิมพ์
 
ความรู้ทั่วไปเกี่ยวกับห้องสมุด
ความรู้ทั่วไปเกี่ยวกับห้องสมุดความรู้ทั่วไปเกี่ยวกับห้องสมุด
ความรู้ทั่วไปเกี่ยวกับห้องสมุด
 
ใบงานที่ 2
ใบงานที่ 2ใบงานที่ 2
ใบงานที่ 2
 
สรุปอินเตอร์เน็ตและการสืบค้นข้อมูล
สรุปอินเตอร์เน็ตและการสืบค้นข้อมูลสรุปอินเตอร์เน็ตและการสืบค้นข้อมูล
สรุปอินเตอร์เน็ตและการสืบค้นข้อมูล
 
ตัวอย่างการเขียนโครงการหลัก
ตัวอย่างการเขียนโครงการหลักตัวอย่างการเขียนโครงการหลัก
ตัวอย่างการเขียนโครงการหลัก
 
ข้อสอบปลายภาค50ข้อ โปรแกรมword
ข้อสอบปลายภาค50ข้อ โปรแกรมwordข้อสอบปลายภาค50ข้อ โปรแกรมword
ข้อสอบปลายภาค50ข้อ โปรแกรมword
 
เฉลยแบบฝึกหัดหนังสืออ้างอิง
เฉลยแบบฝึกหัดหนังสืออ้างอิงเฉลยแบบฝึกหัดหนังสืออ้างอิง
เฉลยแบบฝึกหัดหนังสืออ้างอิง
 
Powerpointองค์ประกอบของระบบคอมพิวเตอร์
Powerpointองค์ประกอบของระบบคอมพิวเตอร์Powerpointองค์ประกอบของระบบคอมพิวเตอร์
Powerpointองค์ประกอบของระบบคอมพิวเตอร์
 
หน่วยที่ 1-เทคโนโลยีรอบตัว
หน่วยที่ 1-เทคโนโลยีรอบตัวหน่วยที่ 1-เทคโนโลยีรอบตัว
หน่วยที่ 1-เทคโนโลยีรอบตัว
 
รายงานอินเทอร์เน็ต
รายงานอินเทอร์เน็ตรายงานอินเทอร์เน็ต
รายงานอินเทอร์เน็ต
 
หน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษาหน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 2 การรู้สารสนเทศกับการศึกษาระดับอุดมศึกษา
 
ย่อยอาหาร
ย่อยอาหารย่อยอาหาร
ย่อยอาหาร
 
เฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docx
เฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docxเฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docx
เฉลยแบบฝึกวิเคราะห์หมวดหมู่.Docx
 
รายงาน สังคมออนไลน์
รายงาน สังคมออนไลน์รายงาน สังคมออนไลน์
รายงาน สังคมออนไลน์
 

Similar a เทคโนโลยีการค้นคืนสารสนเทศ

บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศบทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศSrion Janeprapapong
 
บทที่ 7 เครื่องมือการเข้าถึงสารสนเทศ
บทที่ 7 เครื่องมือการเข้าถึงสารสนเทศบทที่ 7 เครื่องมือการเข้าถึงสารสนเทศ
บทที่ 7 เครื่องมือการเข้าถึงสารสนเทศBeauso English
 
วิธีการสืบค้นและเทคนิคการค้นคืน
วิธีการสืบค้นและเทคนิคการค้นคืนวิธีการสืบค้นและเทคนิคการค้นคืน
วิธีการสืบค้นและเทคนิคการค้นคืนSrion Janeprapapong
 
บทที่ 3 ฐานข้อมูลและการค้นคืน
บทที่ 3 ฐานข้อมูลและการค้นคืนบทที่ 3 ฐานข้อมูลและการค้นคืน
บทที่ 3 ฐานข้อมูลและการค้นคืนSrion Janeprapapong
 
Database
DatabaseDatabase
Databasepaween
 
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูลความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูลIsareeya Keatwuttikan
 
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูลบทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูลniwat50
 
[Thai] Bibliography database
[Thai] Bibliography database[Thai] Bibliography database
[Thai] Bibliography databaseJoy sarinubia
 
Chapter4 lecture
Chapter4 lectureChapter4 lecture
Chapter4 lecturesupimon1956
 
Video on Demand System for Medical Applications
Video on Demand System for Medical ApplicationsVideo on Demand System for Medical Applications
Video on Demand System for Medical ApplicationsRachabodin Suwannakanthi
 
เกณฑ์การประเมินค่า Reference resources
เกณฑ์การประเมินค่า Reference resourcesเกณฑ์การประเมินค่า Reference resources
เกณฑ์การประเมินค่า Reference resourcesSrion Janeprapapong
 

Similar a เทคโนโลยีการค้นคืนสารสนเทศ (20)

บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศบทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
 
บทที่ 7 เครื่องมือการเข้าถึงสารสนเทศ
บทที่ 7 เครื่องมือการเข้าถึงสารสนเทศบทที่ 7 เครื่องมือการเข้าถึงสารสนเทศ
บทที่ 7 เครื่องมือการเข้าถึงสารสนเทศ
 
วิธีการสืบค้นและเทคนิคการค้นคืน
วิธีการสืบค้นและเทคนิคการค้นคืนวิธีการสืบค้นและเทคนิคการค้นคืน
วิธีการสืบค้นและเทคนิคการค้นคืน
 
บทที่ 3 ฐานข้อมูลและการค้นคืน
บทที่ 3 ฐานข้อมูลและการค้นคืนบทที่ 3 ฐานข้อมูลและการค้นคืน
บทที่ 3 ฐานข้อมูลและการค้นคืน
 
Lesson 1
Lesson 1Lesson 1
Lesson 1
 
Database
DatabaseDatabase
Database
 
4
44
4
 
บท1
บท1บท1
บท1
 
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูลความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
 
บท1
บท1บท1
บท1
 
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูลบทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
 
บทที่1
บทที่1บทที่1
บทที่1
 
[Thai] Bibliography database
[Thai] Bibliography database[Thai] Bibliography database
[Thai] Bibliography database
 
Chapter4 lecture
Chapter4 lectureChapter4 lecture
Chapter4 lecture
 
Semantic web and library
Semantic web and librarySemantic web and library
Semantic web and library
 
Video on Demand System for Medical Applications
Video on Demand System for Medical ApplicationsVideo on Demand System for Medical Applications
Video on Demand System for Medical Applications
 
20080314 Greenstone
20080314 Greenstone20080314 Greenstone
20080314 Greenstone
 
Technology for Digital Library
Technology for Digital LibraryTechnology for Digital Library
Technology for Digital Library
 
Unit6
Unit6Unit6
Unit6
 
เกณฑ์การประเมินค่า Reference resources
เกณฑ์การประเมินค่า Reference resourcesเกณฑ์การประเมินค่า Reference resources
เกณฑ์การประเมินค่า Reference resources
 

Más de Srion Janeprapapong

ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...
ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...
ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...Srion Janeprapapong
 
การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์ เพื่อให้บริ...
การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์   เพื่อให้บริ...การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์   เพื่อให้บริ...
การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์ เพื่อให้บริ...Srion Janeprapapong
 
หน่วยที่ 4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศ
หน่วยที่  4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศหน่วยที่  4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศ
หน่วยที่ 4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศSrion Janeprapapong
 
เอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศ
เอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศเอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศ
เอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศSrion Janeprapapong
 
หน่วยที่ 3 การวิเคราะห์ความต้องการสารสนเทศ
หน่วยที่ 3  การวิเคราะห์ความต้องการสารสนเทศหน่วยที่ 3  การวิเคราะห์ความต้องการสารสนเทศ
หน่วยที่ 3 การวิเคราะห์ความต้องการสารสนเทศSrion Janeprapapong
 
รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556
รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556
รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556Srion Janeprapapong
 
หน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษาหน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษาSrion Janeprapapong
 
การวิเคราะห์และสังเคราะห์สารสนเทศ
การวิเคราะห์และสังเคราะห์สารสนเทศ การวิเคราะห์และสังเคราะห์สารสนเทศ
การวิเคราะห์และสังเคราะห์สารสนเทศ Srion Janeprapapong
 
เกณฑ์การประเมินค่าสารสนเทศเว็บ
เกณฑ์การประเมินค่าสารสนเทศเว็บเกณฑ์การประเมินค่าสารสนเทศเว็บ
เกณฑ์การประเมินค่าสารสนเทศเว็บSrion Janeprapapong
 
บทที่ 2 ทักษะการรู้สารสนเทศ
บทที่ 2 ทักษะการรู้สารสนเทศบทที่ 2 ทักษะการรู้สารสนเทศ
บทที่ 2 ทักษะการรู้สารสนเทศSrion Janeprapapong
 
บทที่ 1 สารสนเทศกับการเรียนรู้
บทที่ 1 สารสนเทศกับการเรียนรู้บทที่ 1 สารสนเทศกับการเรียนรู้
บทที่ 1 สารสนเทศกับการเรียนรู้Srion Janeprapapong
 
การค้นหาสารสนเทศจาก WWW
การค้นหาสารสนเทศจาก WWWการค้นหาสารสนเทศจาก WWW
การค้นหาสารสนเทศจาก WWWSrion Janeprapapong
 
ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)
ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)
ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)Srion Janeprapapong
 
การสำรวจและรวบรวม Internet Reference Resources
การสำรวจและรวบรวม Internet Reference Resourcesการสำรวจและรวบรวม Internet Reference Resources
การสำรวจและรวบรวม Internet Reference ResourcesSrion Janeprapapong
 
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)Srion Janeprapapong
 
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1  บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)บทที่ 1  บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)Srion Janeprapapong
 
สารานุกรม (Encyclopedias)
สารานุกรม  (Encyclopedias)สารานุกรม  (Encyclopedias)
สารานุกรม (Encyclopedias)Srion Janeprapapong
 
การค้นหาสารสนเทศจาก WWW (ต่อ)
การค้นหาสารสนเทศจาก WWW (ต่อ)การค้นหาสารสนเทศจาก WWW (ต่อ)
การค้นหาสารสนเทศจาก WWW (ต่อ)Srion Janeprapapong
 

Más de Srion Janeprapapong (20)

ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...
ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...
ความสัมพันธ์ระหว่างหลักสูตรสาขาวิชาสารสนเทศศึกษากระบวนการการทำงานในห้องสมุด ห...
 
การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์ เพื่อให้บริ...
การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์   เพื่อให้บริ...การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์   เพื่อให้บริ...
การสำรวจและรวบรวม Reference Resources ที่เป็นสื่ออิเล็กทรอนิกส์ เพื่อให้บริ...
 
หน่วยที่ 4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศ
หน่วยที่  4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศหน่วยที่  4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศ
หน่วยที่ 4 การเลือกแหล่งสารสนเทศและทรัพยากรสารสนเทศ
 
เอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศ
เอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศเอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศ
เอกสารประกอบการสอนหน่วยที่ 3 วิเคราะห์ความต้องการสารสนเทศ
 
หน่วยที่ 3 การวิเคราะห์ความต้องการสารสนเทศ
หน่วยที่ 3  การวิเคราะห์ความต้องการสารสนเทศหน่วยที่ 3  การวิเคราะห์ความต้องการสารสนเทศ
หน่วยที่ 3 การวิเคราะห์ความต้องการสารสนเทศ
 
รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556
รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556
รายงานการดำเนินงานวิชาทักษะการรู้สารสนเทศ (มคอ.5) ภาคปลาย ปีการศึกษา 2556
 
หน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษาหน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษา
หน่วยที่ 1 สารสนเทศกับการศึกษาระดับอุดมศึกษา
 
การวิเคราะห์และสังเคราะห์สารสนเทศ
การวิเคราะห์และสังเคราะห์สารสนเทศ การวิเคราะห์และสังเคราะห์สารสนเทศ
การวิเคราะห์และสังเคราะห์สารสนเทศ
 
เกณฑ์การประเมินค่าสารสนเทศเว็บ
เกณฑ์การประเมินค่าสารสนเทศเว็บเกณฑ์การประเมินค่าสารสนเทศเว็บ
เกณฑ์การประเมินค่าสารสนเทศเว็บ
 
บทที่ 2 ทักษะการรู้สารสนเทศ
บทที่ 2 ทักษะการรู้สารสนเทศบทที่ 2 ทักษะการรู้สารสนเทศ
บทที่ 2 ทักษะการรู้สารสนเทศ
 
บทที่ 1 สารสนเทศกับการเรียนรู้
บทที่ 1 สารสนเทศกับการเรียนรู้บทที่ 1 สารสนเทศกับการเรียนรู้
บทที่ 1 สารสนเทศกับการเรียนรู้
 
การค้นหาสารสนเทศจาก WWW
การค้นหาสารสนเทศจาก WWWการค้นหาสารสนเทศจาก WWW
การค้นหาสารสนเทศจาก WWW
 
ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)
ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)
ทรัพยากรสารสนเทศประเภทอ้างอิงที่ให้คำตอบทันที (Ready-Reference Resources)
 
การสำรวจและรวบรวม Internet Reference Resources
การสำรวจและรวบรวม Internet Reference Resourcesการสำรวจและรวบรวม Internet Reference Resources
การสำรวจและรวบรวม Internet Reference Resources
 
สารานุกรม
สารานุกรมสารานุกรม
สารานุกรม
 
พจนานุกรม
พจนานุกรมพจนานุกรม
พจนานุกรม
 
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
 
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1  บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)บทที่ 1  บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
บทที่ 1 บทนำ (การจัดเก็บและค้นคืนสารสนเทศ)
 
สารานุกรม (Encyclopedias)
สารานุกรม  (Encyclopedias)สารานุกรม  (Encyclopedias)
สารานุกรม (Encyclopedias)
 
การค้นหาสารสนเทศจาก WWW (ต่อ)
การค้นหาสารสนเทศจาก WWW (ต่อ)การค้นหาสารสนเทศจาก WWW (ต่อ)
การค้นหาสารสนเทศจาก WWW (ต่อ)
 

เทคโนโลยีการค้นคืนสารสนเทศ

  • 2. หัวข้อบรรยาย เทคโนโลยีการค้นคืน ดรรชนี/คาค้น ระบบจัดเก็บ/ฐานข้อมูล ส่วนต่อประสานการค้นคืน/ผู้ใช้ (Retrieval Interface) หลักการค้นคืน กลวิธการค้นคืน ี ตัวอย่างเทคโนโลยีการสืบค้น
  • 3. เทคโนโลยีการค้นคืน เทคโนโลยีการค้นคืนสารสนเทศจะเกี่ยวข้องกับ – ดรรชนี หรือ คาค้น – ระบบจัดเก็บ/ฐานข้อมูลทีใช้ ่ - ระบบจัดเก็บเอกสารฉบับเต็ม / สื่อมัลติมีเดีย - ฐานข้อมูลที่พัฒนาขึ้นเอง / ฐานข้อมูลสาเร็จรูป / ฐานข้อมูลออนไลน์/บนเครือข่ายอินเทอร์เน็ต – ส่วนต่อประสานการค้นคืน/ผู้ใช้ – การค้นคืนด้วยการใช้คาสั่ง – เมนูทางเลือก – การปรับแต่งโดยตรง – การเติมคา – หลักการของการค้นคืน – ภาษาสอบถาม – ภาษาธรรมชาติ – ภาษาสืบค้นอุบัติใหม่ เช่น TAG – โครงสร้างของข้อคาถาม – กลวิธีการค้นคืน/กลยุทธ์การค้นคืน - การใช้บูเลียน - การใช้คาที่อยู่ใกล้เคียงกัน - การใช้พิสัย - การระบุเขตข้อมูล - การตัดคา
  • 4. ดรรชนี หรือ คาค้น ในระยะแรกของการค้นคืนสารสนเทศ มีการใช้ชื่อผู้แต่ง (Author) ชื่อเรื่อง (Title) และหัวเรื่อง (Subject Headings) เป็นคาค้น เรียกเป็นดรรชนีผู้แต่ง (Author Index) ดรรชนีชื่อเรื่อง (Title Index) และดรรชนีหัวเรื่อง (Subject Index) ต่อมาด้วยความก้าวหน้าของเทคโนโลยีจึงมีการกาหนดคา สาคัญ (Keywords) เป็นคาค้น เรียกว่า ดรรชนีคาสาคัญ (Keyword Index) พัฒนามาใช้ Taxonomy Thesaurus Ontology ในปัจจุบันมีการให้ความสาคัญกับผู้ใช้มากขึ้น คาค้นที่ผู้ใช้กาหนดหรือมีส่วนร่วมจึงเกิดขึ้น ในลักษณะที่ เรียกว่า Tag / Folksonomy
  • 7. ดรรชนี หรือ คาค้น (ต่อ) การทาดรรชนีมี 2 วิธี คือ 1. การดึงคาจากเอกสารโดยตรง (Extraction Method) ใช้คน หรือเครื่องจักรทาก็ได้ กาหนดเป็นศัพท์ไม่ควบคุม (Uncontrolled Vocabulary) โดยกาหนดคาค้นจาก Title Abstract Content ได้ พัฒนาให้เป็นวลี (Phrase) 2. การกาหนดคาจากเนื้อหาเอกสาร (Assignment Method) ใช้คน หรือเครื่องจักรทาก็ได้ กาหนดเป็นศัพท์ควบคุม (Controlled Vocabulary) โดยกาหนดคาค้นจากเนื้อหาของเอกสารนั้นๆ ได้พัฒนา เป็น Thesaurus Taxonomy Ontology
  • 8. ระบบจัดเก็บ/ฐานข้อมูล ระบบจัดเก็บ/ฐานข้อมูลที่ใช้ เทคโนโลยีที่ใช้ในการจัดเก็บ ซอฟต์แวร์ วิธีการต่อประสานกับผู้ใช้ ผู้ใช้จาเป็นต้องทาความเข้าใจก่อนเลือกใช้ระบบ/ ฐานข้อมูลเพื่อให้เกิดประสิทธิภาพและประสิทธิผล
  • 9. ความหมายฐานข้อมูล • มาจากศัพท์ภาษาอังกฤษว่า database • หมายถึง (Rothwell อ้างถึงใน เดชา นันทพิชัย, 2546: 28) แหล่งสะสมข้อเท็จจริงต่างๆ โดยรวบรวมข้อมูลที่มี ความสัมพันธ์กันไว้ด้วยกัน และมีโปรแกรมการจัดการ ฐานข้อมูล (Database Management System- DBMS) มาช่วยในการจัดเก็บ จัดเรียง และสืบค้นสารสนเทศ รวมถึงปรับปรุงข้อมูลให้ทันสมัยอยู่เสมอ
  • 10. ความหมายฐานข้อมูล (ต่อ) • Databases are searchable collections of records. • The Libraries' databases allow you to search for many different types of materials (articles in journals, images, primary sources, newspaper articles, books, and more) important for your research. (http://libraries.claremont.edu/help/glossary.asp)
  • 11. ประเภทฐานข้อมูล 1. ฐานข้อมูลอ้างอิง (Reference Databases) บางครั้งเรียกว่า ฐานข้อมูลบรรณานุกรม (Bibliographic Databases) 2 . ฐานข้อมูลต้นแหล่ง (Source Databases) Non-bibliographic Databases Factual Databases บางครั้งเรียกว่า ธนาคารข้อมูล (Databank)
  • 12. ประเภทฐานข้อมูล (ต่อ) • หรือจาแนกออกตามสาขาวิชาเป็น 1. ฐานข้อมูลมนุษยศาสตร์ 2. ฐานข้อมูลสังคมศาสตร์ 3. ฐานข้อมูลวิทยาศาสตร์ และเทคโนโลยี • นอกจากนั้นอาจจาแนกเป็น 1. ฐานข้อมูลซีดีรอม (CD-ROM Database) 2. ฐานข้อมูลสาเร็จรูป (Package Database) 3. ที่พัฒนาขึ้นเอง (In-house Database) 4. ฐานข้อมูลออนไลน์ (Online Database)
  • 13. ประเภทฐานข้อมูล (ต่อ) 1. ฐานข้อมูลซีดีรอม (CD-ROM Database) = ฐานข้อมูลสาเร็จรูปบันทึกในรูปของซีดีรอม เน้นข้อมูลตาม สาขาวิชา เช่น AGRICOLA MEDLINE ได้รับความนิยมในยุคแรก ของการคืนค้นด้วยคอมพิวเตอร์ ข้อด้อย: 1. การสมัครเป็นสมาชิกแพง (ในยุคนั้น) 2. เปลี่ยน ฮาร์ดแวร์เมื่อเทคโนโลยีเปลี่ยน
  • 14. ประเภทฐานข้อมูล (ต่อ) 2. ฐานข้อมูลสาเร็จรูป (Package Database) เป็นระบบ ฐานข้อมูลสาเร็จรูปทีผู้พฒนาพัฒนามาเพื่อจาหน่ายให้กับ ่ ั หน่วยงาน (เช่น HORIZON, VTLS, INNOPAC) 3. ฐานข้อมูลที่พฒนาขึ้นเอง (In-house Database) ั เป็นระบบฐานข้อมูลที่หน่วยงานออกแบบพัฒนาเพือรองรับงาน ่ ต่างๆ ที่ต้องการ 4. ฐานข้อมูลออนไลน์ (Online Database) ฐานข้อมูล เพื่อการค้นให้บริการออนไลน์ เน้นฐานข้อมูลตามสาขาวิชา เช่น ERIC ScienceDirect ฯลฯ โดยมักจะต้องมีการบอกรับเป็นสมาชิก คิดค่าใช้จ่าย (จานวนครังที่ใช้ จานวนผู้ใช้ จานวน จานวน ้ คอมพิวเตอร์ทเชื่อมโยงกับฐานข้อมูล) จุดด้อยคือ 1. ค่าใช้จ่ายสูง ี่ 2. ใช้ค่อนข้างยาก เพราะต้องเรียนรู้การใช้คาสั่งการค้นคืนของแต่ ละฐานที่แตกต่างกัน 3. ต้องเชื่อมต่ออินเทอร์เน็ต 4. มักจากัดการ ใช้ตามพื้นที่ อย่างไรก็ดีในปัจจุบันมีฐานข้อมูลออนไลน์แบบเปิดถูก พัฒนาเพื่อทดแทนปัญหาข้างต้น
  • 16. เทคโนโลยีการค้นคืน (ต่อ) 1. ส่วนต่อประสานการค้นคืน (Retrieval Interface) หมายถึงวิธการ ดังนี้ ี 1) การค้นคืนด้วยการใช้คาสั่ง (Command) 2) เมนูทางเลือก (Menu Selection) 3) การเติมคา (Form Fill-in) 4) การใช้ภาษาธรรมชาติ (Natural Language) 5) การปรับแต่งโดยตรง (Direct Manipulation)
  • 17. เทคโนโลยีการค้นคืน (ต่อ) 1) การค้นคืนด้วยการใช้คาสั่ง (Command) เป็นการสั่งให้คอมพิวเตอร์ทางานตามคาสั่ง โดยพิมพ์คาสั่งในการค้นคืนลงไป เช่น begin/b select/s type/t logoff เป็นต้น
  • 18. 1. Find references to adolescent pregnancy ?b207 (set/format/records) ?logoff
  • 19. เทคโนโลยีการค้นคืน (ต่อ) 2) เมนูทางเลือก (Menu Selection) - เป็นการเลือกรายการทางานตามเมนูรายการเลือก - อาจเลือกเป็นข้อความสั้นๆ รูปภาพ ไอคอน - โดยการพิมพ์รหัสบางตัวเป็น ตัวเลข ตัวอักษร หรือโดย การใช้ตัวชี้
  • 20.
  • 21.
  • 22. เทคโนโลยีการค้นคืน (ต่อ) 3) การเติมคา (Form Fill-in) เป็นการกรอกข้อความที่จาเป็นลงบนแบบฟอร์มที่ปรากฏบนจอภาพ
  • 23. เทคโนโลยีการค้นคืน (ต่อ) 4) การปรับแต่งโดยตรง (Direct Manipulation) ใช้เทคนิค GUI (Graphic User Interface) เช่น การใช้วินโดว์ส ไอคอน เมนู ตัวชี้ hypertext hypermedia ดูตัวอย่างที่ http://www.google.com/ig (iGoogle สามารถปรับแต่งหน้าจอการสืบค้นด้วยตนเอง)
  • 24.
  • 25. เทคโนโลยีการค้นคืน (ต่อ) 5) การใช้ภาษาธรรมชาติ (Natural Language) ผ่านการใช้ เสียงพูด โดยไม่ได้ป้อนคา
  • 26. เทคโนโลยีการค้นคืน (ต่อ) 2. หลักของการค้นคืน 2.1 ภาษาสอบถาม (Query Language) 2.1.1 ข้อคาถามที่ใช้คาสาคัญ (Keyword-based Query) 2.1.2 การจับคู่รปแบบ (Pattern Matching) ู 2.2 ภาษาธรรมชาติ (Natural Language) 2.3 ภาษาสืบค้นอุบัติใหม่ (New Technology/ Emerging Language) 2.4 โครงสร้างของคาถาม
  • 27. เทคโนโลยีการค้นคืน (ต่อ) 2. หลักของการค้นคืน (ต่อ) 2.1 ภาษาสอบถาม (Query Language) 2.1.1 ข้อคาถามที่ใช้คาสาคัญ (Keyword-based Query) = ใช้คา (Word) เป็นตัวค้น ได้แก่ คาเดี่ยว (Single-word) วลี (Phrase) คาที่อยู่ใกล้เคียงกัน (Proximity) การใช้ Boolean Logic เช่น วิทยานิพนธ์ AND สารสนเทศศึกษา 2.1.2 การจับคู่รปแบบ (Pattern Matching) ู = ใช้คาถาม เปรียบเทียบกับ คา ที่ตรงกัน ที่อยู่ใน เอกสาร ได้แก่ คานาหน้า (Prefix) คาต่อท้าย (Suffix) พิสัย (Range) การลาดับอักขระ (Sequence of Character) สายอักขระย่อย (Substring) เป็นต้น
  • 28. เทคโนโลยีการค้นคืน (ต่อ) 2. หลักของการค้นคืน (ต่อ) 2.2 ภาษาธรรมชาติ (Natural Language) เป็นการติดต่อกับระบบด้วยภาษาที่ใช้ในชีวิตประจาวัน เช่น “ช่วยหาเบอร์โทรของคุณสมชายได้ไหมครับ” ระบบจะสามารถวิเคราะห์ได้ว่า ผู้ใช้ต้องการสืบค้นเบอร์โทรศัพท์ของบุคคลชื่อ สมชาย อยากทราบราคาทองคาวันนี้ (35+7)*3 ได้เท่าไหร่
  • 29. เทคโนโลยีการค้นคืน (ต่อ) 2. หลักของการค้นคืน (ต่อ) 2.3 ภาษาสืบค้นอุบัติใหม่ (New Technology/ Emerging Language) เช่น การสืบค้นโดยใช้ TAG (ป้ายกากับ) การสืบค้นโดยระบุสี การสืบค้นโดยใช้การวาดภาพ การสืบค้นแล้วให้ผลการสืบค้นในรูปแบบ Knowledge
  • 32.
  • 33. เทคโนโลยีการค้นคืน (ต่อ) 2. หลักของการค้นคืน (ต่อ) 2.4 โครงสร้างของคาถาม มี 3 ลักษณะ 2.4.1 โครงสร้างทีมรปแบบทีแน่นอน (Form-like ่ ี ู ่ Fixed Structure) เป็นการเติมคา ผลการค้นคืนต้องได้ตามคาถามที่ ป้อน จะไม่ยืดหยุ่น 2.4.2 โครงสร้าง Hypertext เป็นการเชื่อมโยงคาถามจากเอกสารชุดหนึ่งไปยัง ชุดอื่นๆ ที่เกี่ยวข้อง ผลการค้นคืนจะยืดหยุ่น ได้ผลลัพธ์มาก 2.4.3 โครงสร้างลาดับชัน (Hierarchical ้ Structure) เป็นโครงสร้างที่อยู่ระหว่างกลางของโครงสร้างที่ไม่ ยืดหยุ่น และโครงสร้างที่ยืดหยุ่น
  • 34. เทคโนโลยีค้นคืน (ต่อ) 3. กลวิธีการค้นคืน (Search Strategy) หรือ Search Tips ที่จะช่วยให้สามารถค้นคืนได้เฉพาะเจาะจง และเข้าเรื่องได้ดีขึ้น อาจใช้สัญลักษณ์แตกต่างกันไปตามแต่ละ ฐานข้อมูลและซอฟต์แวร์ที่ใช้ มีดังนี้ 3.1 การใช้บเลียน (Boolean Logic) ู AND (+) OR (,) ANDNOT/ NOT (-) 3.2 การใช้คาที่อยู่ใกล้เคียงกัน หรือระบุระยะห่างระหว่าง คาค้น (Adjacency/ Proximity) คือ การระบุตาแหน่งของคาค้น 2 คาว่าต้องปรากฏตาแหน่งที่ อยู่ในเอกสารติดกัน หรือใกล้เคียงกัน โดยมีคาอื่นอยู่คั่นกลางได้ตั้งแต่ 1 คา ขึ้นไป รูปแบบการใช้ขึ้นอยู่กับฐานข้อมูล เช่น information same technology information ADJ technology cost n1 living
  • 35. เทคโนโลยีการค้นคืน (ต่อ) 3. กลวิธีการค้นคืน (Search Strategy) (ต่อ) 3.3 การใช้พิสัย (Range Search) ใช้กับเงื่อนไขที่เป็นตัวเลขโดยกาหนดพิสัย หรือช่วงของ ตัวเลขได้ เช่น 2553-2554 เป็นต้น 3.4 การระบุเขตข้อมูล (Field Search/ Limiting Search) เป็นการค้นหาคาที่ปรากฏอยู่ในเขตข้อมูลที่กาหนด เช่น AU:cohen URL:rose 3.5 การตัดคา (Truncation/ Word Stemming) การค้นโดยใช้รากคา เช่น ค้นคาว่า comp* ก็จะได้ทุกคาที่ ขึ้นต้นด้วย comp ที่ปรากฏอยู่ในเอกสาร เช่น computer computation ฯลฯ
  • 36. ตัวอย่างเทคโนโลยีการสืบค้น http://www.digitized-thailand.org/index.php?option=com_content&view=article&id=43&Itemid=105&lang=th เทคโนโลยีสืบค้นสารสนเทศ หรือ Search Technology เป็นการวิจัยและพัฒนาที่ได้รวมเอาเทคนิค หลากหลายด้านมาประกอบกันเพื่อให้การสืบค้นมีประสิทธิภาพและ ตอบสนองต่อความต้องการของผู้ใช้มากที่สุด โดยเทคโนโลยีที่ พัฒนาขึ้นสามารถรองรับการสืบค้นเอกสารทั่วไปแบบเต็มเนื้อหา (Full-Text Search) การสืบค้นเชิงความหมายโดยผ่าน การสร้างองค์ความรู้แบบออนโทโลยี (Ontology) ซึ่งเป็นการ จัดระบบความสัมพันธ์ของหน่วยภาษา การสืบค้นในรูปแบบ ภาษาธรรมชาติโดยใช้ AIML (Artificial Intelligence Markup Language) การสืบค้นแบบพ้องเสียง (Soundex) การสืบค้นแบบพ้องความหมาย (Synonym Search) นอกจากนียังนาเอาเทคโนโลยีเว็บ 2.0 มาประยุกต์ใช้ ้ คือ การกากับข้อมูลเชิงสังคม (Social Tagging)
  • 37. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) บนพืนฐานของการวิจยและพัฒนา ทีมวิจัยได้นา ้ ั เทคโนโลยีการสืบค้นสารสนเทศมาประยุกต์ใช้เพือพัฒนา ่ เป็นระบบต้นแบบสาหรับการให้บริการสืบค้นข้อมูล อาทิ ระบบสรรสาร (Sansarn) และระบบผู้ช่วยออนไลน์ อับดุล (ABDUL – Artificial BuDdy U Love) ซึ่ง เป็นระบบถามตอบอัตโนมัติผ่านโปรแกรม Windows Live Messenger (MSN)
  • 38. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) รูปที่ 1 โครงสร้างทางสถาปัตยกรรมของเทคโนโลยีสืบค้นสารสนเทศ
  • 39. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) โครงสร้างทางสถาปัตยกรรมของเทคโนโลยีสืบค้น สารสนเทศ ประกอบด้วย 4 ส่วนหลัก 1. การเก็บรวบรวมสารสนเทศ 2. การประมวลผลภาษาและการวิเคราะห์เชิงความหมาย 3. การเข้าถึงสารสนเทศ 4. การสร้างทรัพยากรทางภาษา
  • 40. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) 1. การเก็บรวบรวมสารสนเทศ การเก็บรวบรวบสารสนเทศจะเริ่มจากการเก็บข้อมูล (Data Collecting) ทีอยู่ในหลากหลายแหล่ง ไม่ว่าจะเป็นข้อมูลทีอยู่ ่ ่ บนอินเทอร์เน็ตหรือบนระบบฐานข้อมูล รวมทั้งสารสนเทศใน รูปแบบต่างๆ เช่น หน้าเว็บ ไฟล์เอกสาร และฐานข้อมูล รวมทั้งการ สกัดข้อความจากเอกสาร (Document Parsing) ในรูปแบบต่างๆ เช่น HTML PDF หรือ Open Office เป็นต้น
  • 41. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) 2. การประมวลผลภาษาและการวิเคราะห์เชิง ความหมาย นาข้อมูลต่างๆ เข้าสูการประมวลผลทางภาษาและวิเคราะห์เชิง ่ ความหมาย โดยเริ่มจาก - การตัดคาจากข้อความ (Tokenization) โดยใช้โปรแกรม ตัดคาเล็กซ์โต (LexTo) มาใช้ตัดแบ่งข้อความออกเป็นคาเพื่อนาไป สร้างดัชนีหรือประมวลผลต่อไป - การสืบค้นแบบพ้องเสียงและการแก้ไขคาค้นคืนทีสะกด ่ ผิด (Soundex and Word Approximation) เป็นการช่วยเหลือผู้ใช้ใน การสะกดคาหรือในกรณีที่พิมพ์ผิด เช่น ผู้ใช้สามารถพิมพ์ “พาติเคิ่น บอด” เพื่อให้ระบบแนะนาคาที่ออกเสียงเหมือนคือ “พาร์ตเคิลบอร์ด - ิ particle board” หรือ “เสือจันทะบูน” ระบบจะสามารถหาคาที่สะกดได้ ่ ถูกต้องคือ “เสื่อจันทะบูร” หรือในกรณีที่สะกดผิด เช่น “กรดาษสา” ระบบ สามารถหาคาที่สะกดได้ถกต้องคือ “กระดาษสา” ู
  • 42. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) 2. การประมวลผลภาษาและการวิเคราะห์เชิง ความหมาย (ต่อ) - การวิเคราะห์รปแบบข้อความ (Pattern Analysis) เป็นการ ู รองรับการสืบค้นในรูปแบบภาษาธรรมชาติ โดยมีการเปรียบเทียบ รูปแบบข้อความการร้องขอข้อมูลจากผู้ใช้ เช่น “ช่วยหาเบอร์โทรของคุณ สมชายได้ไหมครับ” ระบบจะสามารถวิเคราะห์ได้วา ผูใช้ตองการสืบค้น ่ ้ ้ เบอร์โทรศัพท์ของบุคคลชื่อสมชาย - การอนุมานเชิงความหมาย (Semantic Inference) เป็นการ รองรับการสืบค้นในรูปแบบเชิงความหมาย โดยการใช้ออนโทโลยีที่ สร้างขึ้นมา เช่น ในกรณีที่เป็นข้อมูลเฉพาะของบุคคล ผู้ใช้สามารถถามว่า “เรียนจบโทจากประเทศไหน” ระบบจะทาการค้นหาในออนโทโลยีเกี่ยวกับ สถานศึกษาระดับปริญญาโทของบุคคลที่ถาม และเมือได้ชื่อสถานศึกษา ่ แล้ว ระบบจะทาการค้นคืนต่อว่าอยู่ในประเทศใด จากนันจึงส่งคาตอบเป็น ้ ชื่อประเทศให้กับผู้ใช้
  • 43. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) 3. การเข้าถึงสารสนเทศ การวิจัยและพัฒนาในส่วนนี้ จะครอบคลุม - การสร้างฐานดัชนีและการค้นคืน (Indexing & Retrieval) เพื่อรองรับการค้นคืนแบบเต็มเนือหา (Full-Text ้ Search) โดยข้อความในเอกสารทุกส่วนที่ผ่านการตัดคาแล้วจะ นามาสร้างเป็นฐานดัชนี เพื่อให้การสืบค้นทาได้อย่างรวดเร็ว ในด้าน ประสิทธิภาพของการทางานนั้น เทคโนโลยีที่พัฒนาขึ้นจะมีความเร็ว ในการสร้างดัชนีประมาณ 1 นาทีต่อข้อความขนาด 100 MB ส่วน การค้นคืนใช้เวลาน้อยกว่า 1 วินาทีต่อการสืบค้น 1 ครั้ง - การประมวลคิวรี (Query Processing) เป็นการ ประมวลผลข้อความที่ผู้ใช้พิมพ์เข้ามา เช่น ถ้าเป็นข้อความร้องขอ ระบบจะส่งไปวิเคราะห์รูปแบบข้อความร้องขอ ถ้าเป็นวลี ระบบจะทา การตัดคาและนาไปค้นคืนจากฐานดัชนี
  • 44. ตัวอย่างเทคโนโลยีการสืบค้น (ต่อ) 4. การสร้างทรัพยากรทางภาษา การสร้างทรัพยากรภาษา เป็นส่วนสาคัญที่ทาให้ระบบการสืบค้นสารสนเทศ มีความสมบูรณ์และมีประสิทธิภาพ พัฒนาแบ่งเป็น - การสร้างรูปแบบ AIML (AIML Pattern Construction) เพื่อ รองรับการสืบค้นในรูปแบบภาษาธรรมชาติ รวมทั้งใช้สนทนาโต้ตอบระหว่างระบบ เอเจนท์กับผู้ใช้ เช่น เมื่อผู้ใช้ทักทายว่า “สวัสดีครับ คุณชื่ออะไรครับ” ระบบจะ ค้นหารูปแบบข้อความที่ตรงกัน จากนั้นคืนข้อความกับไปที่ผู้ใช้ว่า “ผมชื่ออับดุล ครับ” - การกากับข้อมูลเชิงสังคม (Social Tagging) เป็นการให้ผู้ใช้ระบบ มีส่วนร่วมในการระบุคาสาคัญให้กับสารสนเทศ ไม่ว่าจะเป็นข้อมูล FAQ หรือ รูปภาพ ทาให้การสืบค้นมีความครอบคลุมและตรงใจกับผู้ใช้มากยิ่งขึ้น - การสร้างคาพ้องความหมาย (Synonym Construction) เป็นการ ระบุคาที่พ้องความหมายให้กับคาสาคัญที่ใช้สืบค้น เหมาะกับข้อมูลที่เป็นโดเมน เฉพาะด้าน เช่น ในกรณีที่เป็นข้อมูลการออกแบบ สาหรับคาว่า “อาคารพาณิชย์” สามารถเพิ่มคาพ้องความหมายเป็นคาว่า “ตึกแถว” วิธีนี้จะช่วยให้การสืบค้นมี ความครอบคลุมสูงขึ้น
  • 45. บรรณานุกรม ลัดดา โกรดิ. 2545. “เทคโนโลยีที่ใช้ในการจัดเก็บและการค้นคืนสารสนเทศ.” ใน ประมวลสาระชุดวิชาการจัดเก็บและการค้นคืนสารสนเทศ (Information Storage and Retrieval), หน่วยที่ 1-4, หน้า 63-106. นนทบุรี: สาขาวิชาศิลปศาสตร์ มหาวิทยาลัยสุโขทัยธรรมาธิราช. โครงการดิจิไทย. 2553. TOOLS : Search Engine เทคโนโลยีการสืบค้น [ออนไลน์]. เข้าถึงจาก 2 มิถุนายน 2554, from http://digitized-thailand.org/index.php?option=com_content& view=article&id=43&Itemid=105&lang=th http://libraries.claremont.edu/help/glossary.asp