How Google Works

In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext. Google is designed to crawl and index the Web efficiently and produce much more satisfying search results than existing systems.

Sergey Brin and Lawrence Page<br/> The Anatomy of a Large-Scale Hypertextual Web Search Engine<br/> 1998

อาจารย์แนะนำให้อ่าน สนุกมาก!

ถ้าพูดถึงงานวิจัยที่เป็นต้นกำเนิดของกูเกิล คนมักนึกกันถึงแต่ PageRank แต่เอาเข้าจริงแล้ว เปเปอร์ที่สำคัญกว่ามากๆ คืออันนี้ เพราะเป็นการลองสร้างระบบจริงที่ใช้ทดสอบว่า PageRank นั้นเวิร์คแค่ไหน ถ้าอ่านดูแล้วจะเข้าใจว่าทำไมกูเกิลสมควรดัง เพราะ Page กับ Brin ใส่ใจในรายละเอียดของการออกแบบเพื่อรีดประสิทธิภาพมากๆ ทำกันตั้งแต่ระดับบิตของ data structure ไปจนถึง crawler ทำแคช DNS เพื่อจะได้ไม่เสียเวลา lookup

นอกจากนั้น ในเปเปอร์ฉบับนี้ยังแสดงแนวคิดหลายอัน ที่สุดท้ายกลายมาเป็นผลิตภัณฑ์ของกูเกิลในปัจจุบัน ไม่ว่าจะเป็น Google File System หรือ AdWord รวมถึงวิสัยทัศน์ว่าจะ index ทุกข้อความที่มนุษย์โลกเขียนขึ้นมาให้ได้ภายใน 10 ปี !!!

เดี๋ยวอ่านเปเปอร์ MapReduce กับ BigTable ต่อ ของ GFS เคยอ่านจบเมื่อนานมาแล้วแต่ลืมหมด สงสัยต้องอ่านซ้ำ

Comments

Thank you very much.

Add new comment