Wikipedia Participation Index

ต้นเรื่องมาจากข่าว Firefox 3 ถูกดาวน์โหลดไป 8.3 ล้านครั้งใน 24 ชม. ใน Blognone โดยหลายคนเปิดประเด็นเรื่องว่า เราสามารถเอาตัวเลขจำนวนการดาวน์โหลด Firefox 3 มาเป็นดัชนีชี้วัดความเจริญก้าวหน้า/whatever ของประเทศได้หรือไม่

ประเด็นหนึ่งที่มีน้ำหนักของฝ่ายไม่เห็นด้วยคือ เบราว์เซอร์เป็นเรื่องของรสนิยม ซึ่งอันนี้ผมก็เห็นด้วย

ถ้าเปลี่ยนคำถามใหม่ว่า เป็นอะไรกลางๆ อย่างจำนวนบทความใน Wikipedia แทนล่ะ? ถึงแม้จะวัดความเจริญก้าวหน้าไม่ได้ แต่อย่างน้อย มันน่าจะบอกถึงอัตราการมีส่วนร่วม (participation rate) ในการเขียน Wikipedia ของประชาชนในแต่ละประเทศได้หรือเปล่า

ผมเลยทดลองหาตัวเลขอัตราการมีส่วนร่วมนี้ดู พยายามสร้างวิธีการให้เป็นวิทยาศาสตร์มากที่สุดเท่าที่เป็นไปได้ แต่ก็ยังห่างไกลจากงานวิจัยขนานแท้อยู่หลายขุม

สูตรการคิดคือ (จำนวนบทความใน Wikipedia)/(จำนวนผู้ใช้อินเทอร์เน็ตของประเทศนั้นๆ) จะได้ตัวเลขเฉลี่ยว่าผู้ใช้อินเทอร์เน็ตหนึ่งคนในประเทศนั้น เขียน Wikipedia กี่บทความ

  • จำนวนบทความใน Wikipedia เอามาจาก Wikipedia Statistics ตัวเลขของเดือนกุมภาพันธ์ 2008 - เลือกมาเฉพาะประมาณ 30 ภาษาแรก
  • จำนวนผู้ใช้อินเทอร์เน็ตเอามาจาก Internet World Stats ตัวเลขของวันที่ 31 มีนาคม 2008

ปัญหามีอยู่ว่า Wikipedia นั้นแบ่งตามภาษา แต่ Internet World Stats นั้นแบ่งตามประเทศ เลยต้องคัดบางภาษาที่ใช้ในหลายประเทศออก (เช่น อังกฤษ สเปน โปรตุเกส รัสเซีย) เหลือแต่ภาษาที่ใช้ในประเทศเดียว (เช่น ไทย ญี่ปุ่น เกาหลี สวีเดน โปแลนด์) ส่วนภาษาพวกที่ก้ำกึ่งอย่าง ฝรั่งเศส เยอรมัน ดัทช์ จีน ตัดสินใจนำมาคำนวณด้วยเพื่อดูแนวโน้ม (มีแค่ 4 ภาษานี้)

การคำนวณใช้ spreadsheet ธรรมดา หารกันแล้วเอามาคูณ 1000 ให้เป็นเลขจำนวนเต็มสวยๆ ไม่มีอะไรเป็นพิเศษ

ผลที่ได้เป็นดังกราฟ

Wikipedia Participation Index

แปลผลแบบหยาบๆ

  • ในกราฟจะเห็นการกระจุกตัวของภูมิภาคอย่างชัดเจน นั่นคือ ยุโรปเหนือ กลุ่มที่ติดทะเลบอลติก (สแกนดิเนเวีย และพวกเอสโตเนีย ลิธัวเนีย) ครองแชมป์การมีส่วนร่วมสูงสุด รองลงมาคือกลุ่มบอลข่าน (ฮังการี สโลวีเนีย สโลวาเกีย) จากนั้นถึงค่อยเป็นยุโรปตะวันตก และเอเชีย
  • ตัวเลขจำนวนบทความของภาษาญี่ปุ่นดูเยอะมาก แต่พอหารด้วยจำนวนผู้ใช้อินเทอร์เน็ตแล้ว ไม่ต่างกับไทยนัก
  • โมเดลนี้ใช้ไม่ได้กับประเทศในอเมริกาเหนือ-ใต้ ที่ไม่มีภาษาของตัวเอง รวมถึงประเทศที่แชร์ภาษาร่วมกัน เช่น อารบิก หรือประเทศที่มีหลายภาษาอย่างอินเดีย
  • จุดหักล้างอีกอันคือ ตัวเลขนี้ใช้จำนวนบทความ โดยไม่สนใจว่าบทความนั้นยาวสั้นน้อยมากอย่างไร อาจมีภาษาที่มีบทความเยอะ แต่คุณภาพแย่ก็เป็นได้ ทำให้ความแม่นยำลดน้อยลงไป แต่ผมก็ไม่มีวิธีที่ดีกว่านี้แล้ว
  • คนไทยที่ต่ออินเทอร์เน็ตหนึ่งคน เขียน Wikipedia 0.003735786499802 บทความ

สำหรับคนที่สนใจตัวเลขจริง ดูสเปรดชีทได้จาก Google Docs

Comments

ที่จีนน้อยสุดนี่คงเป็นเพราะประเด็นการบล็อกหรือเปล่าครับ?
ส่วนเกาหลีก็น่าแปลกใจดี.. สงสัยมัวแต่เล่นเกม เหอๆ

ตัวเลขน่าสนใจนะ
มันออกมาคล้าย ๆ ระดับความตื่นตัวทางการเมืองของประเทศเหล่านั้นด้วยมั๊ย ?

อีกเหตุผลนึงที่สามารถสนับสนุน mk ในการตัดภาษาใหญ่ ๆ ออกไป นอกจากว่าภาษานั้นมีใช้ในหลายประเทศคือ ภาษาพวกนั้นก็พูดได้โดยคนที่ไม่ได้ใช้ภาษานั้นเป็นภาษาแม่ด้วย - และก็เป็นไปได้ที่ว่ายิ่งขนาดสารานุกรมใหญ่ ก็ยิ่งดึงดูดให้คนมาอ่านเยอะ = ดึงดูดคนที่มีโอกาสเป็นคนเขียนเยอะ - เช่นคนไทยก็อ่าน/เขียนวิกิพีเดียภาษาอังกฤษ

จีนสร้างสารานุกรมของตัวเอง
http://en.wikipedia.org/wiki/Baidu_Baike
จีนกับเกาหลี สองประเทศนี้มักจะเป็นข้อยกเว้นเสมอ ๆ กับพวกเว็บไซต์ตะวันตก ที่ไม่สามารถขึ้นเป็นอันดับหนึ่งได้ สู้เว็บไซต์ท้องถิ่นไม่ได้

เกี่ยวกับความ "มั่นใจ" ในการนำเสนอความเห็นหรือเปล่าครับ

โดยส่วนตัว ผมไม่ค่อยกล้าใส่อะไรเข้า wikipedia นัก
เพราะกลัวว่าจะให้ข้อมูลที่ผิดพลาด

ทั้งๆ ที่ตามวิธีใช้นั้นคือ ใส่ๆ เข้าไปก่อน ค่อยช่วยกันแก้ที่หลังได้
แต่ผมก็ัยังคงคิดหนักเวลาจะแก้อะไรสักอย่างอยู่ดี

Add new comment