Informatics

Google Data Highlighter

One of few Google products that can make me thrilled in recent years. Read: [Introducing Data Highlighter for event data](http://googlewebmastercentral.blogspot.com/2012/12/introducing-data-highlighter-for-event.html) Let's try this with mock data (you need to be verified site owner on Google Webmaster Central). - SIU New Year Party - 2013 new year celebration & partner thank you party. - 10 January 2013 - starting from 18:00 - Place: SIU Office, 434S Soi Ladprao 24, Ladprao Road, Chatuchak, Bangkok ([Location](http://siu.co.th/contact/))

Big Data กับการเปลี่ยนวิธีทำธุรกิจ

มีมิตรสหายท่านหนึ่งจากภาคการเงินการลงทุน มาคุยกับผมใน Facebook เรื่องความพร้อมของหน่วยงานธุรกิจไทยกับเทคโนโลยี Big Data เมื่อเช้านี้ ผมคิดว่านี่เป็นสัญญาณว่า Big Data น่าจะเริ่มโตพอแล้ว ที่ภาคธุรกิจไทยโดยเฉพาะองค์กรขนาดใหญ่ๆ จะเริ่มหันมาสนใจ และไม่ใช่การขับเคลื่อนจากคนไอที (ที่เห็นความสำคัญของเรื่องพวกนี้อยู่แล้ว) แต่เป็นการผลักดันจากฝ่ายบริหารหรือฝ่ายยุทธศาสตร์องค์กร ที่ไม่ได้ติดตามเรื่องนี้ใกล้ชิดมากนักเท่ากับฝ่ายไอที ในวงการไอทีเราพูดเรื่องนี้กันมาเยอะมากแล้ว ถึงแม้ว่าคำว่า Big Data จะเพิ่งกำเนิดมาได้ไม่นานนัก แต่แนวคิดพื้นฐานอย่างการวิเคราะห์ข้อมูลและสกัดสารสนเทศที่สำคัญมาใช้งาน (busines

Being Adaptive

ผมทำ online content มาก็มาก เห็นพฤติกรรมหรือคุณลักษณะสำคัญอย่างหนึ่งของสื่อออนไลน์ ที่ต่างไปจากสื่อแบบเดิมๆ คือความสามารถในการแก้ไขและแจกจ่ายแบบเรียลไทม์ สื่อตระกูล textual ด้วยกันอย่างหนังสือพิมพ์ นิตยสาร หนังสือเล่ม ถ้ามีข้อมูลอะไรผิด เก่า หรือไม่อัพเดต การแก้ไขจะทำได้ยากมาก เพราะมีต้นทุนในการผลิต (cost of reproduction) และต้นทุนในการแจกจ่าย (cost of distribution) สูงเทียบเท่ากับต้นฉบับการพิมพ์ครั้งแรก ปัจจัยเหล่านี้จึงต้องบีบให้สื่อกระดาษต้องตรวจสอบข้อมูลให้ถูกต้องมากที่สุด เพื่อลดต้นทุนเหล่านี้ให้มากที่สุด แน่นอนว่า content จำนวนมหาศาลมันย่อมต้องมีความผิดพลาดอยู่บ้าง วิธีแก้ปัญหาที่เหลือ

Edward Tufte - The Information Sage

เพิ่งเขียนเรื่อง [Charles Joseph Minard](http://isriya.com/node/3516/charles-joseph-minard) ก็ไปเจอกับบทความของ "สาวกแห่ง Minard" คนสำคัญ และเป็นป๋าแห่ง visual design/infographic สมัยใหม่ เขาคือ [Edward Tufte](http://en.wikipedia.org/wiki/Edward_Tufte) บทความชื่อ [The Information Sage](http://www.washingtonmonthly.com/magazine/mayjune_2011/features/the_information_sage029137.php?page=all) (ขอแปลเป็นไทยว่า "จอมเวทย์ข้อมูล") อยู่ที่ Washington Monthly Tufte เป็นอาจารย์ด้านรัฐศาสตร์มาก่อน ก่อนจะมาสนใจด้าน visual design/visualization ของข้อมูลเชิงสถิติ เขาเขียนหนังสือแนว textbook ด้านนี้รวม 4 เ

Related Stories on Front Page

ช่วงหลังนี้คุยกับ @warong และ @imenn ถึงการออกแบบหน้าแรกของเว็บข่าวเยอะมาก วันนี้เปิด Economist.com ก็พบตัวอย่างที่น่าสนใจ คือจะนำบทความเก่าที่เกี่ยวข้องกับ headline มาแสดงในหน้าแรกด้วย เนื่องจากเป็นบทความเก่าที่เอามาแสดงอีกครั้ง การระบุวันที่ลงก็เลยสมเหตุสมผล เราไม่ค่อยเจอการนำเสนอลักษณะนี้มากนัก แม้ว่าจะเห็น related story บ่อยในรูปของบล็อก แต่ก็มักจะแสดงในหน้า node/item ไม่ได้แสดงบนหน้าแรกแบบนี้ คำถามก็คือ การแสดง relate story แบบนี้เหมาะสมแค่ไหนสำหรับเนื้อหาเชิงสกู๊ป (บทความหลายชิ้นรวมกันเป็นชุด ใต้ธีมเดียวกัน) และเราต้องมีเนื้อหาเก่ามากแค่ไหน ถึงจะทำแบบนี้ได้?

Type of Information in Lifestream

บล็อกตอนนี้จะต่อเนื่องกับ [Notification Console](http://www.isriya.com/node/1604/notification-console), [Race for Social Network Aggregator](http://www.isriya.com/node/1919/race-for-social-network-aggregator) และ [Where is the Comment?](http://www.isriya.com/node/2970/where-is-the-comment) เรื่องคือ ทุกวันนี้เราบริโภคข้อมูลกันมากมาย จากเดิมที่มีแต่เมล ก็มาเป็น IM ตามมาด้วย SMS, RSS แต่จุดเปลี่ยนอยู่ที่การมาถึงของ Facebook/Twitter แค่ตามอ่านอัพเดตทีก็แทบอ้วก อันนี้เป็นเหตุผลหนึ่งที่ทำให้ผมปิด Google Buzz ทิ้งไปแล้ว คอนเซปต์ของ "กระแสข้อมูล" ที่ไหลผ่านเราไปทุกวัน มีคนเรียกมันในชื่อ [Lifestream

Mentions Gathering

สมัยก่อน เครื่องมือในการ fine-tuning ของ Blognone มีสามอย่าง * ดูจาก referrer แล้วตามไปดูเว็บต้นทาง * [Technorati](http://technorati.com/blogs/blognone.com?reactions) * [Google Blog Search](http://blogsearch.google.com/blogsearch?hl=en&ie=UTF-8&q=link:blognone.com&scoring=d) เอาไว้ cross-check กับ Technorati ช่วงหลังๆ มานี้ เครื่องมือเพิ่มมาอีกอันคือ [Twitter Search](http://search.twitter.com/search?q=blognone) ซึ่งผมพบว่ามันมีความเคลื่อนไหวมากกว่าเครื่องมืออื่นๆ มาก (แถมในขณะเดียวกัน ปริมาณบล็อกที่อ้างถึงใน Technorati และ Google Blog Search ลดน้อยลงอย่างมีนัยยะสำคัญ ประมาณว่าคนเ

Microblogging Overload

จาก * [At SXSW, attendees confront Twitter saturation](http://news.cnet.com/8301-17939_109-10196526-2.html) - CNET * [Social Media Overload Allows Web Apps to Shine](http://bits.blogs.nytimes.com/2009/03/15/social-media-overload-allows-web-apps-to-shine/) - NYT คำถามที่น่าสนใจ (และยังตอบไม่ได้ เช่นเคย) * จำนวนข้อความต่อเวลา (เช่น ต่อนาที) ที่ optimum สำหรับการตามอ่านของมนุษย์ ควรจะเป็นเท่าไร * ความกว้าง-แคบ ขอบเขตของข้อความที่ควรใส่ tag ควรเป็นอย่างไร เช่น ซื้อกาแฟที่ #barcamp ควรมีค่าเท่ากับ ประกาศผลิตภัณฑ์ใหม่ที่ #barcamp หรือไม่ * ต่อจากข้อที่แล้ว เรามีวิธีการกรองข้อมูลที่ดีกว่า tag หรือ