เกี่ยวกับอัลกอริธึมยานเดกซ์

สารบัญ:

เกี่ยวกับอัลกอริธึมยานเดกซ์
เกี่ยวกับอัลกอริธึมยานเดกซ์
Anonim

จากความก้าวหน้าทางเทคโนโลยี ทำให้สามารถดำเนินการที่จำเป็นโดยไม่ต้องออกจากบ้าน ตอนนี้คุณสามารถทำงานผ่านเว็บได้ และหลายคนรู้สึกดีในด้านนี้มานานแล้ว วิธีทั่วไปในการสร้างรายได้บนอินเทอร์เน็ตคือการสร้างเว็บไซต์หรือบล็อกของคุณเอง ต้องขอบคุณโฆษณาที่วางอยู่บนทรัพยากร เจ้าของสามารถทำกำไรได้ดี จริง โครงการนี้ใช้ได้เฉพาะเมื่อไซต์หรือบล็อกอยู่ในหน้าแรกของการค้นหาเท่านั้น พูดง่ายๆ ก็คือ ระดับรายได้ของเจ้าของจะขึ้นอยู่กับจำนวนผู้เข้าชมทรัพยากร

และสิ่งแรกที่คุณต้องรู้เมื่อเริ่มกิจกรรมดังกล่าวคือวิธีการทำงานของอัลกอริธึมการค้นหา โดยเฉพาะอย่างยิ่งอัลกอริธึมของ Yandex ซึ่งเป็นเสิร์ชเอ็นจิ้นที่ใหญ่ที่สุดใน Runet

อัลกอริธึมการค้นหาคืออะไร

อัลกอริทึมการค้นหาหรือที่เรียกว่าอัลกอริทึม Yandex เป็นสูตรทางคณิตศาสตร์ชนิดหนึ่งที่ผู้ใช้ไม่ทราบข้อความค้นหา หุ่นยนต์ค้นหาแก้ไขสูตรนี้: แทนที่ค่าต่าง ๆ สำหรับค่าที่ไม่รู้จักและเลือกค่าที่เหมาะสมที่สุด

อัลกอริธึมยานเดกซ์
อัลกอริธึมยานเดกซ์

ถ้าเราทำให้คำจำกัดความง่ายขึ้น เราสามารถแสดงได้ดังนี้: อัลกอริธึมการค้นหาคือโปรแกรมพิเศษที่ใช้ "ปัญหา" ในกรณีของเราคือคำค้นหาและให้ "วิธีแก้ปัญหา" นั่นคือแสดงรายการไซต์ที่มีข้อมูลที่ผู้ใช้ต้องการ

ในการแก้ปัญหา อัลกอริธึมจะตรวจสอบคำหลักทั้งหมดบนหน้า จัดเรียงข้อมูลที่ได้รับ และสร้างผลการค้นหาที่ผู้ใช้ต้องการ ด้วยอัลกอริธึมการค้นหา โรบ็อตสามารถวิเคราะห์เนื้อหาของแต่ละทรัพยากรได้ จากข้อมูลที่ได้รับ ตำแหน่งของเว็บไซต์ในผลการค้นหาจะถูกกำหนด

สิ่งที่ส่งผลต่ออัลกอริธึมการค้นหา

อย่างที่คุณเห็น ผลการค้นหาสำหรับข้อความค้นหาเดียวกันในเครื่องมือค้นหาที่ต่างกันนั้นต่างกัน ดังนั้นอัลกอริทึม Yandex จึงแตกต่างจาก Google อย่างมาก ตัวอย่างเช่น เพื่อความบริสุทธิ์ของการทดสอบ เราจะเปิดแท็บสองแท็บ: เครื่องมือค้นหาหนึ่งจาก Yandex และอีกแท็บจาก Google หากคุณป้อนข้อความค้นหา "วิธีการไปญี่ปุ่นเพื่อพำนักถาวร" ในแถบค้นหา คุณจะเห็นว่าไซต์แรกในผลการค้นหา Yandex อยู่ในอันดับที่สองในผลการค้นหาของ Google

อัลกอริธึมของเครื่องมือค้นหาอยู่ภายใต้ความลับที่เข้มงวด พวกเขาวิเคราะห์พารามิเตอร์ไซต์เดียวกัน แต่ไม่มีใครรู้ว่าสิ่งใดที่พวกเขาให้ความสนใจมากกว่าและสิ่งใดที่พวกเขาให้ความสนใจน้อยกว่า แม้แต่ SEO ก็ถามคำถามนี้

อัลกอริทึมการออกยานเดกซ์
อัลกอริทึมการออกยานเดกซ์

พารามิเตอร์ที่อัลกอริทึมทำงานด้วย

ดังที่ได้กล่าวไปแล้ว อัลกอริธึมการค้นหาของ Yandex ได้รับคำแนะนำจากพารามิเตอร์บางอย่าง โดยทั่วไปสามารถแบ่งออกเป็นสองกลุ่ม พารามิเตอร์บางตัวมีหน้าที่รับผิดชอบต่อเนื้อหาเชิงความหมายของทรัพยากรซึ่งสามารถกำหนดเงื่อนไขได้เรียกมันว่า "ข้อความ" อื่นๆ ระบุลักษณะทางเทคนิค (การออกแบบ ปลั๊กอิน ฯลฯ) เป็นไปได้ที่จะกำหนดให้เป็น "หน้าที่ทางวิศวกรรม" ตามเงื่อนไข เพื่อความชัดเจน ควรแบ่งพารามิเตอร์ทั้งหมดออกเป็นกลุ่มแล้ววางลงในตาราง

"ข้อความ" "วิศวกรรมและการใช้งาน"
ภาษาของทรัพยากร อายุไซต์ ชื่อโดเมน ที่ตั้ง
ความนิยมของหัวข้อและจำนวนข้อความในแต่ละหน้า จำนวนหน้าและ "น้ำหนัก"
อัตราส่วนของคำหลักต่อข้อความทั้งหมด ความพร้อมใช้งานของโซลูชันสไตล์
จำนวนใบเสนอราคาและระดับความเป็นเอกลักษณ์ของเนื้อหา จำนวนการค้นหาคำหลักหนึ่งๆ และความถี่ของการอัปเดตข้อมูล
ขนาดและประเภทแบบอักษร การมีอยู่ของไฟล์มัลติมีเดีย เฟรม โมดูลแฟลช และเมตาแท็ก
จำนวนลิงก์ในข้อความ รูปแบบของหัวเรื่อง หัวเรื่องย่อย และ COP
คำหลักตรงกับส่วนไดเรกทอรีที่ลงทะเบียนเว็บไซต์ คอมเมนต์ในโค้ด ประเภทเพจ ซ้ำกัน

อันดับ

พารามิเตอร์เหล่านี้มีบทบาทสำคัญในอัลกอริทึมการจัดอันดับ อัลกอริทึมการจัดอันดับเป็นวิธีค้นหามูลค่าของแต่ละหน้า พูดง่ายๆ ก็คือ ถ้าไซต์มีประสิทธิภาพที่ดีในพารามิเตอร์เหล่านี้ทั้งหมด จากนั้นจะสูงขึ้นในผลการค้นหา

อัลกอริธึมการจัดอันดับของ Yandex เปลี่ยนไปทุกปี ชื่อหลักถูกตั้งชื่อตามเมืองต่างๆ ชื่อของแนวคิดการค้นหาใหม่เริ่มต้นด้วยอักษรตัวสุดท้ายของชื่อของอัลกอริทึมก่อนหน้า ดังนั้น เสิร์ชเอ็นจิ้นจึงสร้างอัลกอริธึม:

  • "มากาดาน" (2008)
  • "นาคอดก้า" (2008)
  • "Arzamas" (2009).
  • "Snezhinsk" (2009).
  • "โคนาโคโว" (2010).
  • "Obninsk" (2010).
  • ครัสโนดาร์ (2010).
  • เรคยาวิก (2011).
  • "คาลินินกราด" (2012).
  • "ดับลิน" (2013).
  • "นาชาโลโว่" (2014).
  • "โอเดสซา" (2014).
  • "อัมสเตอร์ดัม" (2015).
  • "Minusinsk" (2015).
  • "คิรอฟ" (2015).

นอกเหนือจากนั้น มีการเปิดตัวอัลกอริธึมการค้นหายานเดกซ์อีกสามตัวในช่วงสองปีที่ผ่านมา และยังมีอัลกอริธึมพิเศษ AGS-17 และ AGS-30 ซึ่งงานหลักคือการมองหาทรัพยากรที่ไม่ตรงตามข้อกำหนด พูดง่ายๆ ก็คือ อัลกอริธึมเหล่านี้จะค้นหาไซต์ที่มีเนื้อหาที่ไม่ซ้ำกันและมีคำหลักจำนวนมาก จากนั้นจึงใช้บทลงโทษกับไซต์เหล่านั้น และตอนนี้เล็กน้อยเกี่ยวกับแต่ละอัลกอริทึม

อัลกอริทึมการจัดอันดับยานเดกซ์
อัลกอริทึมการจัดอันดับยานเดกซ์

อัลกอริทึม 2008-2011

ในสองปี Yandex ได้สร้างอัลกอริธึมการค้นหาสี่แบบที่แตกต่างในเชิงคุณภาพจากรุ่นก่อนๆ ในปี 2008 เป็นครั้งแรกในการจัดอันดับการค้นหา พวกเขาเริ่มคำนึงถึงความเป็นเอกลักษณ์ของเนื้อหา ("มากาดาน") เป็นครั้งแรกที่มีการแนะนำระบบใหม่ที่คำนึงถึงการมีอยู่ของคำหยุด ("Nakhodka")

ในปี 2009 อัลกอริธึมการค้นหา Yandex เริ่มพิจารณาภูมิภาคของผู้ใช้ ตัวแยกประเภทใหม่ของข้อความค้นหาที่ขึ้นกับภูมิศาสตร์และไม่ขึ้นกับภูมิศาสตร์ปรากฏขึ้น สูตรการเลือกคำตอบของภูมิภาค ("Arzamas") ได้รับการปรับปรุงอย่างมาก ปัญหานี้เปลี่ยนไปมาก มี 19 สูตรการจัดอันดับภูมิภาคใหม่ปรากฏขึ้น และเกณฑ์การจัดอันดับที่ไม่ขึ้นกับภูมิศาสตร์ได้รับการอัปเดตแล้ว ("Snezhinsk", "Konakovo")

ในปี 2010 อัลกอริทึมของเครื่องมือค้นหา Yandex ได้พัฒนาสูตรใหม่สำหรับข้อความค้นหาที่ขึ้นกับภูมิศาสตร์และไม่ขึ้นกับภูมิศาสตร์ ("Obninsk", "Krasnodar") ปี 2011 เป็นจุดเริ่มต้นของการสร้างการออกส่วนบุคคล การกำหนดลักษณะภาษาของผู้ใช้อินเทอร์เน็ตเริ่มถูกนำมาพิจารณา

อันดับการค้นหาปี 2555-2557

ในปี 2555 การปรับเปลี่ยนผลการค้นหาในแบบของคุณอย่างมีนัยสำคัญ: พวกเขาเริ่มคำนึงถึงความสนใจของผู้ใช้ในระยะยาว ความเกี่ยวข้องของเว็บไซต์ที่เข้าชมบ่อย (คาลินินกราด) เพิ่มขึ้น ในปี 2013 อัลกอริธึม Yandex ได้ปรับผลการค้นหาตามความสนใจของผู้ใช้รายใดรายหนึ่งอย่างชำนาญแล้วในระหว่างเซสชัน โดยคำนึงถึงความสนใจในระยะสั้น ("Dublin") ในปี 2014 การพิจารณาลิงก์สำหรับคำขอเชิงพาณิชย์จะถูกลบออกเมื่อจัดอันดับคำตอบ ("เริ่มต้น")

อัมสเตอร์ดัม มินูซินสค์ คิรอฟ

ในผลการค้นหา การ์ดที่มีข้อมูลเริ่มปรากฏถัดจากผลลัพธ์เมื่อคุณวางเมาส์เหนือลิงก์ ("อัมสเตอร์ดัม") เป็นครั้งแรกที่งานของอัลกอริทึม Yandex คือการลดอันดับของทรัพยากรที่มีลิงก์ SEO จำนวนมาก การมีโปรไฟล์ลิงก์ที่กว้างขวางได้กลายเป็นสาเหตุหลักของการสูญเสียตำแหน่ง อัลกอริธึม "Minusinsk" ของ "Yandex" เริ่มลบลิงก์ SEO ออกอย่างหนาแน่น หลังจากนั้นไม่นานบัญชีของปัจจัยลิงก์ก็ถูกส่งกลับ แต่เฉพาะในภูมิภาคมอสโกเท่านั้น

ในอัลกอริธึมที่สามของปีนี้ มีการแนะนำการสุ่มคำถามที่เกี่ยวข้อง พูดง่ายๆ เมื่อออกคำค้นหา คุณสามารถจัดเรียงตามวันที่ ความนิยม หรือภูมิภาค ("Kirov")

อัลกอริธึมงานยานเดกซ์
อัลกอริธึมงานยานเดกซ์

วลาดีวอสตอคและปาเลค

อัลกอรึทึม Vladivostok ซึ่งเริ่มทำงานเมื่อต้นปี 2559 เริ่มพิจารณาถึงความสามารถในการปรับตัวของทรัพยากรไปยังอุปกรณ์มือถือ และผลลัพธ์ของผลการค้นหาบนมือถือก็เพิ่มขึ้น

อัลกอริทึม Palekh ซึ่งนำเสนอในเดือนพฤศจิกายน สมควรได้รับความสนใจเป็นพิเศษ สาระสำคัญของมันคือการเปรียบเทียบความหมายของคำถามและหน้าโดยใช้โครงข่ายประสาทเทียม - ปัญญาประดิษฐ์ที่จำลองการทำงานของสมองมนุษย์ ด้วยเหตุนี้ การออกคำขอหายากจึงเพิ่มขึ้น ในขั้นต้น อัลกอริธึมนี้ใช้งานได้เฉพาะกับชื่อหน้า แต่อย่างที่ผู้สร้างพูด เมื่อเวลาผ่านไปมันจะเรียนรู้ที่จะ "เข้าใจ" ตัวข้อความเอง อัลกอริทึมทำงานดังนี้:

  • ระบบนำสถิติมาพิจารณาตรงกับคำขอและชื่อเรื่อง จึงเพิ่มความแม่นยำของผลการค้นหา
  • การทำงานกับข้อความดังกล่าวเรียกว่า "เวกเตอร์ความหมาย" แนวทางในการจัดอันดับการค้นหานี้ช่วยในการค้นหาคำตอบสำหรับข้อความค้นหาที่หายากที่สุด อัลกอริธึมที่เรียนรู้ที่จะเข้าใจข้อความสามารถให้ผลลัพธ์ซึ่งจะไม่มีคำที่คล้ายกันกับข้อความค้นหา แต่ถึงกระนั้นก็จับคู่กันในเนื้อหาอย่างสมบูรณ์

พูดง่ายๆ ว่ายานเดกซ์พยายามสร้างเทคโนโลยีที่ "ฉลาด" ที่ค้นหาคำตอบโดยไม่ได้อิงตามคีย์เวิร์ด แต่พิจารณาจากเนื้อหาของข้อความเอง

อัลกอริทึมการค้นหายานเดกซ์
อัลกอริทึมการค้นหายานเดกซ์

บาเดิน-บาเดน

อัลกอริธึม Yandex ใหม่ซึ่งเปิดตัวในเดือนมีนาคม 2017 ได้กลายเป็นความก้าวหน้าที่แท้จริงในระบบการจัดอันดับการค้นหา ในผลการค้นหา เว็บไซต์ที่มีเนื้อหาที่เป็นประโยชน์ เข้าใจได้ และอ่านง่ายเริ่มปรากฏขึ้นตั้งแต่แรก งานหลักของอัลกอริธึมนี้คือไม่ให้ข้อความที่ตรงกับคำขอแก่ผู้ใช้ แต่เป็นข้อมูลที่จำเป็น

ระหว่างการทำงานของ Baden-Baden แหล่งข้อมูลที่มีข้อมูลที่ได้รับการปรับให้เหมาะสมอีกครั้งและมีคุณภาพต่ำได้ลดลงในผลการค้นหา ผู้เชี่ยวชาญมั่นใจว่าตำแหน่งของร้านค้าออนไลน์จะลดลง เนื่องจากมีคำและคำอธิบายผลิตภัณฑ์ซ้ำกันมากเกินไป ซึ่งแทบจะเหมือนกันหมด แต่นักพัฒนาอัลกอริธึมคำนึงว่ามีหัวข้อเฉพาะที่การทำซ้ำของคำที่เหมือนกันอย่างหลีกเลี่ยงไม่ได้ ดังนั้นข้อความใดบ้างที่จะถูกคว่ำบาตร? จะดีกว่าถ้าดูตัวอย่าง

อัลกอริทึมของเครื่องมือค้นหายานเดกซ์
อัลกอริทึมของเครื่องมือค้นหายานเดกซ์

ข้อความที่ไม่ตรงกับอัลกอริธึมการค้นหา

ก่อนหน้านี้ หุ่นยนต์ค้นหาได้นำทรัพยากรที่มีคำหลักมาสู่ตำแหน่งบนสุด แต่ข้อความในไซต์ดังกล่าวมักจะดูเหมือนชุดข้อความค้นหาที่เจือจางด้วย "น้ำ" ของข้อความคุณภาพต่ำ และตัวอย่างด้านล่างนี้เป็นข้อพิสูจน์ว่า:

Nike เปิดตัวผลิตภัณฑ์กีฬามากมายทุกปี รองเท้าผ้าใบ, รองเท้าผ้าใบ, รองเท้าบูท, ชุด Nike, เสื้อยืด Nike, กางเกงขาสั้น, ชุดวอร์ม Nike, กางเกง, กางเกงวอร์ม Nike, ลูกฟุตบอล - เหล่านี้และผลิตภัณฑ์อื่น ๆ สามารถพบได้ในร้านค้าของ บริษัท คอลเลกชั่นสำหรับผู้หญิง ผู้ชาย และเด็กของ Nike สื่อถึงธีมหลักของแบรนด์ เครื่องแต่งกายของ Nike มีเอกลักษณ์เฉพาะตัวตรงที่สินค้าแต่ละชิ้นถ่ายทอดจิตวิญญาณของแบรนด์ได้”

ข้อความดังกล่าวไม่มีประโยชน์ เป็นเพียงโลงศพที่มีข้อความค้นหาสำคัญ นี่คือจุดที่อัลกอริทึมใหม่ต่อสู้กัน เนื้อหาที่มีคุณภาพต่ำจะสูญเสียตำแหน่งอย่างแน่นอน มีเกณฑ์สามข้อสำหรับเนื้อหาคุณภาพต่ำ:

  • ไม่มีตรรกะในข้อความ
  • คำสำคัญมากมาย
  • มีอยู่ในข้อความของวลีที่ไม่เป็นธรรมชาติซึ่งปรากฏขึ้นเนื่องจากเกิดคำหลักโดยตรง

แน่นอนว่าไม่มีใครยกเลิกการเพิ่มประสิทธิภาพ SEO หลักการพื้นฐานของเครื่องมือค้นหายังคงเหมือนเดิม แต่วิธีการซึ่งมีข้อความค้นหาหลัก 15-20 รายการต่ออักขระ 1,000 ตัวนั้นล้าสมัยไปนานแล้ว อัลกอริทึม "Baden-Baden" เน้นที่คุณภาพของเนื้อหา

อัลกอริทึมยานเดกซ์ใหม่
อัลกอริทึมยานเดกซ์ใหม่

ผลการค้นหา

สถานที่สำคัญในกระบวนการหาข้อมูลคืออัลกอริทึมการปล่อย SERP คือหน้าผลลัพธ์ที่ตรงกับข้อความค้นหาเฉพาะ อัลกอริทึมสำหรับการออก "Yandex" ได้รับการออกแบบมาเพื่อให้สามารถคำนวณความน่าจะเป็นในการค้นหาคำตอบที่เกี่ยวข้องมากที่สุดและสร้างผลลัพธ์ของทรัพยากรสิบประการ ในกรณีที่คำขอซับซ้อน คุณจะพบคำตอบ 15 คำตอบในผลลัพธ์

1. ภาษาของทรัพยากร
2. ความนิยมของหัวข้อและจำนวนข้อความต่อหน้า
3. อัตราส่วนของคำสำคัญต่อจำนวนข้อความทั้งหมด
4. จำนวนคำพูดและระดับความเป็นเอกลักษณ์ของเนื้อหา
5. ขนาดและประเภทแบบอักษร
6. จำนวนลิงก์ในข้อความ
7. จับคู่คำหลักกับส่วนของไดเร็กทอรีที่ลงทะเบียนไซต์

อันที่จริงแล้ว มันทำงานแบบนี้: หากอัลกอริทึม "คุ้นเคย" กับคำขอและมีคำตอบที่เกี่ยวข้องสูงสำหรับสิ่งนั้น ผลลัพธ์ของคำตอบสิบข้อจะถูกสร้างขึ้น ในกรณีที่เสิร์ชเอ็นจิ้นไม่พบคำตอบดังกล่าว 15 ลิงก์จะแสดงในผลการค้นหา

ที่จริงแล้ว ข้อมูลพื้นฐานทั้งหมดเกี่ยวกับวิธีการทำงานของอัลกอริธึมการค้นหา เพื่อให้เว็บไซต์รู้สึกดี มีความจำเป็นต้องกรอกเนื้อหาคุณภาพสูง ข้อมูล และอ่านได้ในผลการค้นหา