Google

MapReduce: Simplified Data Processing on Large Clusters

ต่อจากเปเปอร์ The Anatomy of a Large-Scale Hypertextual Web Search Engine เมื่อวานนี้ ยังอยู่ในช่วงไล่อ่านเปเปอร์ชิ้นสำคัญๆ ของกูเกิล ตั้งใจว่าจะอ่านให้ได้วันละสาม แต่เอาจริงขี้เกียจ เลยได้วันละอันเท่านั้น

MapReduce คืออะไร? ต้องเกริ่นก่อนว่าระบบประมวลผลของกูเกิลนั้นใช้คลัสเตอร์ ซึ่งทำจากพีซีธรรมดาๆ ราคาถูก ปัญหาอยู่ที่ว่าพีซีเหล่านี้ไม่เสถียรนัก (แต่ความเสถียร/ราคานั้นดีกว่าเครื่องเซิร์ฟเวอร์ราคาแพง) กูเกิลจึงต้องมีซอฟต์แวร์ที่ใช้แก้ปัญหาเหล่านี้

ซอฟต์แวร์ที่โด่งดังตัวแรกคือ Google File System ซึ่งเก็บข้อมูลทุกอย่างเป็น 3 สำเนา แยกกันอยู่คนละเครื่อง ส่วน MapReduce นั้นอยู่ในเลเยอร์ที่สูงขึ้นมาอีกหน่อย นั่นคือเป็น ไลบรารีภาษา C++ ที่คอยกระจายงานให้กับโปรแกรมของกูเกิล

How Google Works

In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext. Google is designed to crawl and index the Web efficiently and produce much more satisfying search results than existing systems.

Sergey Brin and Lawrence Page

The Anatomy of a Large-Scale Hypertextual Web Search Engine

1998

อาจารย์แนะนำให้อ่าน สนุกมาก!

My Thought on Google App Engine

บล็อกนี้เป็น followup จากที่คุยกับคุณ Chanwit ณ Manchester ทาง IM นำไอเดียมาพัฒนาต่อเป็นบล็อก (แต่ยังไม่ละเอียดขนาดเป็นบทความได้)

คุณ Chanwit ถามผมว่าคิดยังไงกับ Google App Engine

สารภาพตามตรงว่าตอนที่ตอบคือไม่รู้ ตอบไปมั่วๆ :P ผ่านไปวันสองวันมีเวลาทบทวน ความคิดเริ่มตกตะกอนขึ้นมาอีกนิด

Using Google Calendar on Mozilla Lightning

After my decision of switching University IMP-based email system to Thunderbird, and my current behavior of using Google Calendar for appointment/deadline notification (both academic and non-academic), I'd like to see my schedule from Thunderbird as well.

This is possible via Mozilla Calendar project, which provides both standalone calendar client (Sunbird) and extension for Thunderbird (Lightning). No problem for network syncing since the present world is using iCal format and Google Calendar provides it, definitely.

Sparkline

อ่านของ ichris แล้ว อยากเขียนถึงแต่ตอนนั้นยังไม่ได้ Analytics ใหม่ พอได้แล้วก็มีเหตุหลายอย่างทั้งลืมและขี้เกียจ

Analytics ตัวใหม่มีคนพูดถึงเยอะแล้ว ขอเน้นเฉพาะ Sparkline

Using GPG in Gmail

Privacy is the thing we should care. But trade-off between privacy and convenience prevents many people from signing and encrypting their email. I'm also one of these "lazy" people.

Problem arose when my friend sent encrypted message to my gmail inbox. I can decrypt it easily with Thunderbird and Enigmail, its brilliant extension but I don't want to bother using full-feature email client for only one message (I haven't used POP3/IMAP for a while). I need to find another solution.

หนังสือต้องห้าม

แต่ก่อนไม่เคยสนใจ Google Book Search ทั้งที่เป็นข่าวบ่อยมาก อาจะเป็นเพราะมีแต่หนังสือภาษาอังกฤษเลยดูไกลตัว

ตอนแรกคิดว่าประโยชน์ของมันคือ 1.) เข้าถึงเนื้อหา (ที่อนุญาต) ได้ผ่านเว็บ 2.) ค้นหาสิ่งที่ต้องการได้สะดวก โดยเฉพาะเคสที่ต้องการอ้างคำพูดจากหนัังสือ

แต่พออ่านบล็อก บันทึกนักโทษการเมือง ที่ BioLawCom.de รวมไปถึง รายชื่อหนังสือต้องห้าม ของกระทรวงมหาดไทย ก็เริ่มมีไอเดียพิสดาร