จะบันทึกสำเนาของเว็บไซต์ได้อย่างไรและที่ไหนดีที่สุด?

สารบัญ:

จะบันทึกสำเนาของเว็บไซต์ได้อย่างไรและที่ไหนดีที่สุด?
จะบันทึกสำเนาของเว็บไซต์ได้อย่างไรและที่ไหนดีที่สุด?
Anonim

ลองนึกภาพสถานการณ์: คุณกำลังสร้างเว็บไซต์ จ้างเว็บมาสเตอร์หรือทำเองโดยใช้เงินจำนวนมากและใช้เวลาส่วนตัวกับมัน คุณโฮสต์ผลิตผลของคุณและกรอกข้อมูลด้วยความรัก โดยไม่ต้องคำนึงถึงความจำเป็นในการบันทึกสำเนาของเว็บไซต์เพื่อไม่ให้ข้อมูลสูญหาย

วันหนึ่ง คุณไปที่ไซต์ของคุณแต่มันไม่เวิร์ค คุณเริ่มรู้ว่าเกิดอะไรขึ้น และน่าสยดสยอง ศูนย์ข้อมูลถูกไฟไหม้หรือโฮสต์ถูกปิด หรืออาจมีไวรัสเข้ามาทำลายข้อมูลของคุณ การสูญหายของข้อมูลบนเว็บไซต์เปรียบได้กับการสูญหายของข้อมูลบนคอมพิวเตอร์ คุณจะเก็บสำเนาของไซต์ไว้อย่างไร

วิธีบันทึกสำเนาเว็บไซต์ลงในคอมพิวเตอร์
วิธีบันทึกสำเนาเว็บไซต์ลงในคอมพิวเตอร์

มาเล่นนิยามกันก่อนนะครับ กระบวนการเก็บถาวรเว็บไซต์คือการรักษาเวอร์ชันปัจจุบันของหน้าหรือเว็บไซต์ในไฟล์เก็บถาวรเพื่อใช้งานในภายหลัง เพื่อวัตถุประสงค์เหล่านี้ จะใช้ซอฟต์แวร์พิเศษ บริษัทที่ใหญ่ที่สุดในโลกคือ Internet Archive ซึ่งเราจะพูดถึงด้านล่าง

สำหรับไฟล์เก็บถาวรส่วนตัว คุณสามารถใช้เบราว์เซอร์ออฟไลน์ที่ออกแบบมาเป็นพิเศษให้ทำงานแบบออฟไลน์ได้ พวกเขาจะช่วยสร้างสำเนาท้องถิ่นของหน้าเว็บแต่ละหน้าหรือทั้งเว็บไซต์ ซึ่งรวมถึงตัวอย่างเช่น:

  • เบราว์เซอร์ HTTrack ข้ามแพลตฟอร์มที่รองรับภาษาโลก 29 ภาษาและสามารถดาวน์โหลดต่อได้ อัปเดตมิเรอร์ของเว็บไซต์
  • Offline Explorer ที่แชร์ได้ฟรี ซึ่งให้คุณดาวน์โหลดไฟล์หรือเพจได้ไม่เพียงแค่ไฟล์เท่านั้น แต่ยังรวมถึงเว็บไซต์ทั้งหมดจากอินเทอร์เน็ตผ่าน FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent
  • ตัวจัดการดาวน์โหลด ตัวจัดการดาวน์โหลดฟรี. มันทำงานร่วมกับทุกเบราว์เซอร์ มี FTP ในตัว รองรับโปรโตคอล BitTorrent สามารถสร้างไฟล์ทอร์เรนต์ สกัดกั้นลิงก์จากคลิปบอร์ด
  • Teleport Pro แบบปิดสำหรับ Windows โปรแกรมนี้ให้คุณดาวน์โหลดทั้งเว็บไซต์
  • โปรแกรมฟรีแบบไม่โต้ตอบบนคอนโซลสำหรับการดาวน์โหลดไฟล์และเว็บไซต์จาก Internet Wget โปรแกรมรองรับโปรโตคอล HTTPS, HTTP, FTP และยังสามารถทำงานผ่านพร็อกซีเซิร์ฟเวอร์ HTTP ได้อีกด้วย เหมาะสำหรับ Linux
สำเนาของ google site ที่บันทึกไว้
สำเนาของ google site ที่บันทึกไว้

กำลังสร้างข้อมูลสำรองบนโฮสต์

คุณสามารถตั้งค่าการสำรองข้อมูลไซต์บนผู้ให้บริการโฮสต์ของคุณได้ ในการดำเนินการนี้ คุณต้องไปที่แผงการดูแลระบบ ไปที่ส่วนสำหรับสร้างข้อมูลสำรอง แต่ละโฮสติ้งมีแผงการดูแลระบบของตัวเอง และเป็นการยากที่จะบอกว่าส่วนนี้ของคุณโฮสต์ที่ใด หากคุณคิดไม่ออก เขียนถึงฝ่ายสนับสนุนด้านเทคนิค

วิธีเปิดสำเนาของไซต์ที่บันทึกไว้
วิธีเปิดสำเนาของไซต์ที่บันทึกไว้

กำลังสร้างข้อมูลสำรองด้วยปลั๊กอิน

หากเว็บไซต์ของคุณโฮสต์บนแพลตฟอร์ม CMS เช่นWordPress คุณสามารถบันทึกสำเนาของไซต์ของคุณโดยติดตั้งปลั๊กอิน wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) หรือคล้ายกัน ด้วยการกำหนดค่าปลั๊กอินอย่างถูกต้อง คุณจะได้รับการสำรองข้อมูลไซต์ทุกวันหรือทุกสัปดาห์ตามที่คุณต้องการ

วิธีบันทึกสำเนาของเว็บไซต์ลงในคอมพิวเตอร์ของคุณ

คุณสามารถบันทึกไซต์ลงในคอมพิวเตอร์ของคุณโดยใช้ไคลเอนต์ FTP หากคุณใช้โปรแกรม FileZilla ให้สร้างโฟลเดอร์ "สำรองข้อมูล" บนคอมพิวเตอร์ของคุณ (ชื่อโฟลเดอร์จะเป็นอะไรก็ได้) เชื่อมต่อกับเซิร์ฟเวอร์ผ่านไคลเอนต์ FTP และเพียงลากและวางเพื่อสำรองข้อมูลทั้งหมดของไซต์ไปยังโฟลเดอร์ "สำรองข้อมูล"

นอกจากนี้ คุณยังสามารถใช้บริการ Site2ZIP (เก็บถาวรเว็บไซต์) ซึ่งเป็นโปรแกรมสำหรับดาวน์โหลด WinHTTrack WebSite Copier จะดูสำเนาของไซต์ที่บันทึกไว้ได้อย่างไร ในการดำเนินการนี้ ให้เปิดโฟลเดอร์ที่บันทึกไซต์แล้วคลิกไฟล์ index.html

วิธีดูสำเนาของเว็บไซต์ที่บันทึกไว้
วิธีดูสำเนาของเว็บไซต์ที่บันทึกไว้

อินเตอร์เน็ตอาร์ไคฟ์

ในซานฟาร์นซิสโก ในปี 1996 Brewster Cale ได้ก่อตั้ง Internet Archive ที่ไม่แสวงหากำไร มันรวบรวมสำเนาของหน้าเว็บ การบันทึกเสียงและวิดีโอ ไฟล์กราฟิกและโปรแกรมทั้งหมด ที่เก็บถาวรของวัสดุที่รวบรวมจะถูกเก็บไว้ที่นี่เป็นเวลานานมากและทุกคนสามารถเข้าถึงฐานข้อมูลได้ฟรี

หากคุณสงสัยว่าจะเปิดสำเนาของเว็บไซต์ที่บันทึกไว้ได้อย่างไร ให้ไปที่ archive.org/web/ แล้วป้อนที่อยู่ของเว็บไซต์หรือหน้าในช่องที่เหมาะสม ณ สิ้นปี 2555 Internet Archive มีขนาด 10 เพตาไบต์ นั่นคือ 10,000 เทราไบต์! และภายในกลางปี 2016 มียอดสะสมถึง 502 พันล้านเล่มหน้าเว็บ

แคชเว็บไซต์โดยเครื่องมือค้นหา

สำเนาของไซต์ Google ที่บันทึกไว้ไม่มีอะไรมากไปกว่าแคชของหน้าของไซต์ที่สร้างโดยเครื่องมือค้นหา ผู้ใช้ทุกคนสามารถใช้สำเนาของหน้าตามความต้องการได้ตลอดเวลา การจัดเก็บบนเซิร์ฟเวอร์ของเครื่องมือค้นหานั้นใช้ทรัพยากรจำนวนมาก และเงินจำนวนมากถูกจัดสรรสำหรับสิ่งนี้ แต่ความช่วยเหลือดังกล่าวจ่ายเอง เนื่องจากเรายังคงไปที่เครื่องมือค้นหา จริง วิธีนี้เหมาะสำหรับไซต์ที่มีอยู่หรือไซต์ที่เพิ่งถูกลบไปเมื่อเร็วๆ นี้เท่านั้น หากสิ่งนี้เกิดขึ้นนานแล้ว เครื่องมือค้นหาจะลบข้อมูลออก

เสิร์ชเอ็นจิ้นเฉพาะ

นอกเหนือจากข้อเท็จจริงที่ว่าคุณสามารถค้นหาหน้าแคชใน Google หรือ Yandex ได้ด้วยตนเอง คุณสามารถใช้เสิร์ชเอ็นจิ้นเฉพาะ cachedview.com มันมีอะนาล็อก: cachedpages.com.

หากคุณต้องการบันทึกสำเนาของเว็บไซต์หรือหน้าแต่ละหน้า คุณสามารถทำได้ด้วยตัวเองและฟรีที่ archive.is นอกจากนี้ยังมีการค้นหาทั่วโลกสำหรับเวอร์ชันที่ผู้ใช้เคยบันทึกไว้

บันทึกสำเนาของเว็บไซต์
บันทึกสำเนาของเว็บไซต์

การสร้างคลังเว็บในห้องสมุดแห่งชาติ

วันนี้ ห้องสมุดแห่งชาติกำลังเผชิญกับภารกิจในการสร้างเอกสารทางอินเทอร์เน็ตที่เป็นส่วนหนึ่งของมรดกทางวิทยาศาสตร์ วัฒนธรรม และประวัติศาสตร์ของมนุษยชาติ แต่มันเป็นปัญหามาก

ผลการศึกษาพบว่าจำนวนเอกสารทางเว็บบนเว็บเพิ่มขึ้นแบบทวีคูณ และโดยเฉลี่ยแล้วเอกสารจะมีอายุยืนตั้งแต่หนึ่งถึงสี่เดือน เป็นการสะดวกที่สุดในการใช้เว็บไซต์เป็นหน่วยของบัญชีสำหรับเอกสารเก็บถาวรบนเว็บ กระบวนการสร้างกองทุนคือการสร้างสำเนาหรือ "กระจกเงา" ของไซต์ เนื่องจากข้อมูลมีการเปลี่ยนแปลงตลอดเวลา ห้องสมุดจึงต้องสร้างมิเรอร์ของเว็บไซต์เดียวกันเป็นระยะๆ

ดังนั้น ในสวีเดนมีเว็บไซต์ 60,000 เว็บไซต์ ซึ่งมากกว่าสิ่งพิมพ์ทั่วไปถึง 20 เท่า สำเนาเอกสารที่พิมพ์ในห้องสมุดของสวีเดนใช้ชั้นวาง 1.7 กม. ต่อปี ที่เก็บถาวรบนเว็บจะเติมชั้นวาง 25 กม.! ตอนนี้ไฟล์เก็บถาวรของพวกเขามี 138 ล้านไฟล์โดยมีน้ำหนักรวม 4.5 กิกะไบต์

อินเทอร์เน็ตเติบโตทุกวัน มีบริษัทและไซต์มากมายที่ดูแลเก็บสำเนาของหน้าเว็บไว้ในเอกสารสำคัญของบริษัท แต่อย่าพึ่งพวกเขาคนเดียว ทำการสำรองข้อมูลอย่างทันท่วงทีและคุณจะไม่สูญเสียเว็บไซต์ของคุณ