หลักการของเครื่องมือค้นหา เครื่องมือค้นหาทางอินเทอร์เน็ต

สารบัญ:

หลักการของเครื่องมือค้นหา เครื่องมือค้นหาทางอินเทอร์เน็ต
หลักการของเครื่องมือค้นหา เครื่องมือค้นหาทางอินเทอร์เน็ต
Anonim

บนอินเทอร์เน็ต ไซต์ต่างๆ ผู้ใช้จะได้รับข้อมูลที่แตกต่างกันจำนวนมาก เครื่องมือค้นหาถูกสร้างขึ้นเพื่อรับข้อมูลที่จำเป็น ค้นหาคำตอบสำหรับคำถาม เมื่อได้ยินวลีนี้ หลายคนก็นึกถึง Google ยานเดกซ์ อย่างไรก็ตาม มีเสิร์ชเอ็นจิ้นอีกมากมายบนอินเทอร์เน็ต

เครื่องมือค้นหาคืออะไร

เสิร์ชเอ็นจิ้นถือเป็นซอฟต์แวร์ที่ประกอบด้วยฐานข้อมูลของเอกสาร ผู้ใช้จะได้รับอินเทอร์เฟซพิเศษที่ช่วยให้พวกเขาสามารถป้อนคำถามที่จำเป็นและรับลิงก์ที่มีข้อมูลที่เกี่ยวข้อง เอกสารที่ใกล้เคียงที่สุดกับสิ่งที่บุคคลใดกำลังมองหามักจะอยู่ที่ด้านบนสุดของผลการค้นหาเสมอ

ผลการค้นหาซึ่งสร้างขึ้นตามคำค้นหาที่ป้อน มักจะมีผลลัพธ์ประเภทต่างๆ อาจมีหน้าเว็บ ไฟล์วิดีโอและไฟล์เสียง รูปภาพ ไฟล์ pdf สินค้าเฉพาะ (หากทำการค้นหาในร้านค้าออนไลน์)

อันดับเสิร์ชเอ็นจิ้นในโลก
อันดับเสิร์ชเอ็นจิ้นในโลก

การจำแนกประเภทของเครื่องมือค้นหา

เครื่องมือค้นหาที่มีอยู่แบ่งออกเป็นหลายประเภท ประการแรก ควรกล่าวถึงเครื่องมือค้นหาแบบเดิม สำหรับเสิร์ชเอ็นจิ้นดังกล่าว หลักการทำงานมุ่งเน้นไปที่การค้นหาข้อมูลในไซต์ที่มีอยู่จำนวนมาก เครื่องมือค้นหายังคงมีอยู่ในแหล่งข้อมูลทางอินเทอร์เน็ตแยกต่างหาก:

  • ในร้านค้าออนไลน์ (เพื่อค้นหาผลิตภัณฑ์ที่เหมาะสม);
  • ในฟอรัมและบล็อก (เพื่อค้นหาโพสต์);
  • บนเว็บไซต์ข้อมูล (เพื่อค้นหาบทความในหัวข้อหรือข่าวที่ต้องการ) ฯลฯ

เครื่องมือค้นหายังแบ่งย่อยตามคุณลักษณะทางภูมิศาสตร์อีกด้วย ในหมวดหมู่นี้มีเสิร์ชเอ็นจิ้น 3 กลุ่ม:

  1. ทั่วโลก. การค้นหาจะดำเนินการทั่วโลก ผู้นำในกลุ่มนี้คือเครื่องมือค้นหาของ Google ก่อนหน้านี้มีเสิร์ชเอ็นจิ้นเช่น Inktomi, AltaVista เป็นต้น
  2. ภูมิภาค. การค้นหาจะดำเนินการตามประเทศหรือกลุ่มประเทศซึ่งรวมกันเป็นหนึ่งภาษา เสิร์ชเอ็นจิ้นระดับภูมิภาคแพร่หลาย ตัวอย่างของพวกเขาในรัสเซียคือ Yandex, Rambler
  3. ท้องถิ่น. การค้นหาดำเนินการในเมืองใดเมืองหนึ่ง ตัวอย่างของเครื่องมือค้นหาดังกล่าวคือ Tomsk.ru.

ส่วนประกอบของเครื่องมือค้นหา

ในเสิร์ชเอ็นจิ้นใดๆ มี 3 องค์ประกอบที่กำหนดหลักการของเครื่องมือค้นหา:

  • หุ่นยนต์ (ตัวสร้างดัชนี แมงมุม โปรแกรมรวบรวมข้อมูล);
  • ฐานข้อมูล;
  • ตัวจัดการคำขอ

หุ่นยนต์เป็นโปรแกรมพิเศษที่มีวัตถุประสงค์เพื่อสร้างฐานข้อมูล ฐานข้อมูลจัดเก็บและ sortsข้อมูลทั้งหมดที่เก็บรวบรวม ตัวจัดการคำขอ เรียกอีกอย่างว่าไคลเอนต์ ทำงานกับคำขอของผู้ใช้ มีการเข้าถึงฐานข้อมูล ไคลเอ็นต์ไม่ได้อยู่บนคอมพิวเตอร์เครื่องเดียวกันเสมอไป ตัวจัดการคำขอสามารถกระจายไปทั่วคอมพิวเตอร์อิเล็กทรอนิกส์ที่ไม่เกี่ยวข้องทางกายภาพหลายเครื่อง

งานเสิร์ชเอ็นจิ้น
งานเสิร์ชเอ็นจิ้น

หลักการของเครื่องมือค้นหา

ระบบที่มีอยู่ทั้งหมดทำงานบนหลักการเดียวกัน ตัวอย่างเช่น ลองพิจารณาการทำงานของเสิร์ชเอ็นจิ้นแบบเดิมที่ออกแบบมาสำหรับอินเทอร์เน็ต การทำงานของหุ่นยนต์คล้ายกับการกระทำของผู้ใช้ทั่วไป โปรแกรมนี้ข้ามไซต์ทั้งหมดเป็นระยะ เพิ่มหน้าใหม่และทรัพยากรอินเทอร์เน็ตลงในฐานข้อมูล กระบวนการนี้เรียกว่าการสร้างดัชนี

เมื่อผู้ใช้บนอินเทอร์เน็ตป้อนข้อความค้นหาในช่องค้นหา ไคลเอนต์เริ่มทำงาน โปรแกรมเข้าถึงฐานข้อมูลที่มีอยู่และสร้างผลลัพธ์ตามคำหลัก เครื่องมือค้นหาให้ลิงก์ไปยังผู้ใช้ในลำดับที่แน่นอน มีการจัดเรียงตามที่ตรงกับคำค้นหา กล่าวคือ คำนึงถึงความเกี่ยวข้อง

เครื่องมือค้นหาทุกเครื่องมีวิธีกำหนดความเกี่ยวข้องของตัวเอง หากผู้ใช้ส่งคำขอเฉพาะไปยังระบบอื่น เขาจะได้รับผลลัพธ์ที่ไม่เหมือนกันทุกประการ อัลกอริทึมสำหรับกำหนดความเกี่ยวข้องจะถูกเก็บเป็นความลับ

เครื่องมือค้นหายอดนิยมในรัสเซีย
เครื่องมือค้นหายอดนิยมในรัสเซีย

รายละเอียดที่เกี่ยวข้อง

ในคำง่ายๆ ความเกี่ยวข้องคือความสอดคล้องของคำหรือการรวมกันของคำที่ป้อนในการค้นหาลิงค์เฉพาะใน SERP ความแตกต่างหลายอย่างส่งผลต่อตำแหน่งของเอกสารในรายการ:

  1. การแสดงคำค้นหาในเอกสาร ความแตกต่างนี้ชัดเจน หากเอกสารมีคำที่ผู้ใช้ป้อน แสดงว่าเอกสารนี้ตรงกับเงื่อนไขการค้นหา
  2. ความถี่ของคำ ยิ่งใช้คีย์เวิร์ดในเอกสารบ่อยเท่าไหร่ คีย์เวิร์ดก็จะยิ่งอยู่ในรายการ SERP สูงเท่านั้น อย่างไรก็ตามไม่ง่ายนัก การใช้คำมากเกินไปอาจเป็นสัญญาณของเนื้อหาคุณภาพต่ำสำหรับเครื่องมือค้นหา

อัลกอริธึมสำหรับกำหนดความเกี่ยวข้องค่อนข้างซับซ้อน เมื่อสองสามปีก่อน ลิงก์ที่มีคีย์เวิร์ดที่จำเป็นแต่ไม่ตรงกับคีย์เวิร์ดในเนื้อหา อาจเข้าสู่ผลการค้นหาได้ ปัจจุบันหลักการทำงานของเสิร์ชเอ็นจิ้นมีความซับซ้อน ตอนนี้โรบ็อตสามารถวิเคราะห์ข้อความทั้งหมดได้ เครื่องมือค้นหาคำนึงถึงปัจจัยต่างๆ มากมาย ด้วยเหตุนี้ ปัญหานี้จึงเกิดจากลิงก์ที่เกี่ยวข้องและมีคุณภาพสูงสุด

วิธีสร้างคำขอให้ถูกต้อง

แม้ที่โรงเรียน เราก็ถูกสอนให้ถามคำถามอย่างถูกต้อง ขึ้นอยู่กับชนิดของคำตอบที่เราจะได้รับ อย่างไรก็ตาม กฎนี้ไม่จำเป็นต้องปฏิบัติตามเมื่อใช้เครื่องมือค้นหา สำหรับเสิร์ชเอ็นจิ้นสมัยใหม่ ไม่สำคัญว่าบุคคลจะเขียนคำขอของเขาจำนวนหรือกรณีใด ไม่ว่าจะด้วยวิธีใด ผลลัพธ์จะมีผลลัพธ์เหมือนกัน

เสิร์ชเอ็นจิ้นไม่จำเป็นต้องมีถ้อยคำที่ชัดเจนของคำถาม ผู้ใช้เพียงต้องเลือกคำหลักที่เหมาะสม ขอพิจารณาตัวอย่าง. เราต้องหาข้อความของเพลง "A Day Without You" ซึ่งดำเนินการโดยกลุ่มป๊อปหญิงชื่อดัง "Via-Gra" เมื่อติดต่อกับเสิร์ชเอ็นจิ้น ไม่จำเป็นต้องตั้งชื่อกลุ่ม ระบุว่านี่คือเพลง แค่เขียนว่า "วันที่ไม่มีคุณส่งข้อความ" ก็เพียงพอแล้ว ตัวพิมพ์เล็กไม่จำเป็นต้องมีเครื่องหมายวรรคตอน เครื่องมือค้นหาไม่ได้คำนึงถึงความแตกต่างเหล่านี้

ประโยคคำถามที่ถูกต้อง
ประโยคคำถามที่ถูกต้อง

อันดับเสิร์ชเอ็นจิ้นในโลก

เครื่องมือค้นหาชั้นนำของโลกคือ Google ก่อตั้งขึ้นใน 1998 ระบบนี้เป็นที่นิยมอย่างมากซึ่งได้รับการยืนยันจากข้อมูลวิเคราะห์ Google จัดการคำขอประมาณ 70% ที่ส่งไปยังอินเทอร์เน็ต ฐานข้อมูลของเสิร์ชเอ็นจิ้นมีขนาดใหญ่มาก มีการจัดทำดัชนีเอกสารต่างๆ มากกว่า 60 ล้านล้านฉบับ Google ดึงดูดผู้ใช้ด้วยอินเทอร์เฟซที่เรียบง่าย หน้าหลักมีโลโก้และแถบค้นหา คุณลักษณะนี้ทำให้เราสามารถเรียก Google ว่าเป็นหนึ่งในเครื่องมือค้นหาที่เรียบง่ายที่สุด

Bing เป็นเครื่องมือค้นหายอดนิยมอันดับสอง ปรากฏในปีเดียวกับ Google ผู้สร้างเสิร์ชเอ็นจิ้นนี้คือบริษัทข้ามชาติที่มีชื่อเสียงอย่าง Microsoft ตำแหน่งที่ต่ำกว่าในการจัดอันดับถูกครอบครองโดย Baidu, Yahoo!, AOL, Excite, Ask.

หลักการเสิร์ชเอ็นจิ้น
หลักการเสิร์ชเอ็นจิ้น

อะไรดังในรัสเซีย

ยานเดกซ์เป็นเสิร์ชเอ็นจิ้นยอดนิยมในรัสเซีย บริการนี้ปรากฏในปี 1997 ในตอนแรก บริษัท รัสเซีย CompTek International เข้ามามีส่วนร่วม ไม่นาน บริษัท Yandex ก็ปรากฏตัวขึ้นซึ่งยังคงมีส่วนร่วมในเครื่องมือค้นหา เครื่องมือค้นหาสำหรับปีของการดำรงอยู่ได้รับความนิยมอย่างมาก สามารถค้นหาได้หลายภาษา - รัสเซีย, เบลารุส, ยูเครน, ตาตาร์, คาซัค, อังกฤษ, เยอรมัน, ฝรั่งเศส, ตุรกี

จากข้อมูลสถิติเป็นที่ทราบกันว่า "Yandex" เป็นที่สนใจของผู้ใช้ Runet มากกว่า 50% ผู้คนมากกว่า 40% ชอบ Google ผู้ใช้ประมาณ 3% เลือกใช้ Mail.ru ซึ่งเป็นพอร์ทัลอินเทอร์เน็ตภาษารัสเซีย

เครื่องมือค้นหาของ Google
เครื่องมือค้นหาของ Google

ป้องกันเครื่องมือค้นหา

เสิร์ชเอนจิ้นทั่วไปที่เราคุ้นเคยไม่เหมาะกับเด็กทุกประการ ผู้ใช้อินเทอร์เน็ตรุ่นเยาว์อาจบังเอิญพบสื่อสำหรับผู้ใหญ่ ข้อมูลที่อาจเป็นอันตรายต่อจิตใจ ด้วยเหตุนี้ จึงมีการสร้างเครื่องมือค้นหาที่ปลอดภัยเป็นพิเศษ ฐานข้อมูลของพวกเขามีเฉพาะเนื้อหาที่ปลอดภัยสำหรับเด็ก

ตัวอย่างหนึ่งของเครื่องมือค้นหาดังกล่าวคือ Sputnik. Children บริการนี้ค่อนข้างเด็ก มันถูกสร้างขึ้นโดย Rostelecom ในปี 2014 หน้าหลักของเครื่องมือค้นหาได้รับการออกแบบมาอย่างสดใสและน่าสนใจ นำเสนอการ์ตูนหลากหลายทั้งในและต่างประเทศสำหรับเด็กทุกวัย นอกจากนี้ ในหน้าหลักยังมีลิงค์ข้อมูลที่เกี่ยวข้องกับหัวข้อต่างๆ - "กีฬา", "ฉันต้องการรู้ทุกอย่าง", "ทำเอง", "เกม", "เทคโนโลยี", "โรงเรียน", "ธรรมชาติ"

อีกตัวอย่างหนึ่งของเสิร์ชเอ็นจิ้นเด็กที่ปลอดภัยคือ Agakids.ru นี่เป็นทรัพยากรที่ปลอดภัยอย่างยิ่ง เครื่องมือค้นหาทำงานอย่างไร หุ่นยนต์ได้รับการกำหนดค่าในลักษณะที่จะข้ามเฉพาะไซต์ที่เกี่ยวข้องกับหัวข้อของเด็กหรือเป็นประโยชน์สำหรับผู้ปกครอง ฐานข้อมูลของเสิร์ชเอ็นจิ้นประกอบด้วยแหล่งข้อมูลต่างๆ เช่น การ์ตูน หนังสือ วรรณกรรมเพื่อการศึกษา เกม สมุดระบายสี ผู้ปกครองที่ใช้ Agakids.ru สามารถค้นหาไซต์เกี่ยวกับการอบรมเลี้ยงดูและสุขภาพของเด็กด้วยตนเอง

เครื่องมือค้นหาที่มีการป้องกันสำหรับเด็ก
เครื่องมือค้นหาที่มีการป้องกันสำหรับเด็ก

โดยสรุปแล้ว ควรสังเกตว่าเสิร์ชเอ็นจิ้นเป็นระบบที่ซับซ้อน พวกเขาประสบปัญหามากมาย เช่น ปัญหาสแปม การพิจารณาความเกี่ยวข้องของเอกสาร การคัดกรองเนื้อหาคุณภาพต่ำ การวิเคราะห์เอกสารที่ไม่มีข้อมูลที่เป็นข้อความ ด้วยเหตุนี้ นักพัฒนาจึงแนะนำแนวทางและอัลกอริทึมใหม่ๆ ที่เป็นความลับทางการค้าในการทำงานของเสิร์ชเอ็นจิ้นทางอินเทอร์เน็ต