Isriya Paireepairit / mk / markpeak
A Thai tech geek. Co-founder of Blognone and SIU. Blogging on almost everything.
In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext. Google is designed to crawl and index the Web efficiently and produce much more satisfying search results than existing systems.
Sergey Brin and Lawrence Page<br/> The Anatomy of a Large-Scale Hypertextual Web Search Engine<br/> 1998
อาจารย์แนะนำให้อ่าน สนุกมาก!
ถ้าพูดถึงงานวิจัยที่เป็นต้นกำเนิดของกูเกิล คนมักนึกกันถึงแต่ PageRank แต่เอาเข้าจริงแล้ว เปเปอร์ที่สำคัญกว่ามากๆ คืออันนี้ เพราะเป็นการลองสร้างระบบจริงที่ใช้ทดสอบว่า PageRank นั้นเวิร์คแค่ไหน ถ้าอ่านดูแล้วจะเข้าใจว่าทำไมกูเกิลสมควรดัง เพราะ Page กับ Brin ใส่ใจในรายละเอียดของการออกแบบเพื่อรีดประสิทธิภาพมากๆ ทำกันตั้งแต่ระดับบิตของ data structure ไปจนถึง crawler ทำแคช DNS เพื่อจะได้ไม่เสียเวลา lookup
นอกจากนั้น ในเปเปอร์ฉบับนี้ยังแสดงแนวคิดหลายอัน ที่สุดท้ายกลายมาเป็นผลิตภัณฑ์ของกูเกิลในปัจจุบัน ไม่ว่าจะเป็น Google File System หรือ AdWord รวมถึงวิสัยทัศน์ว่าจะ index ทุกข้อความที่มนุษย์โลกเขียนขึ้นมาให้ได้ภายใน 10 ปี !!!
เดี๋ยวอ่านเปเปอร์ MapReduce กับ BigTable ต่อ ของ GFS เคยอ่านจบเมื่อนานมาแล้วแต่ลืมหมด สงสัยต้องอ่านซ้ำ
Comments
tanakorn
19 April, 2008 - 23:07
Permalink
Thank you very much.
Thank you very much.
Add new comment