ตั้งแต่วิกิพีเดียตั้งขึ้นได้ไม่กี่ปี ก็มีงานศึกษาวิกิพีเดียทางวิชาการจำนวนมากที่ตีพิมพ์ในวรรณกรรมที่ทบทวนโดยผู้รู้เสมอกัน การวิจัยแบ่งได้ออกเป็นสองหมวดคือ หมวดแรกวิเคราะห์การสร้างและความเชื่อถือได้ของเนื้อหาสารานุกรม หมวดสองตรวจสอบประเด็นทางสังคม เช่นการใช้สอยและการดูแลระบบ งานศึกษาเหล่านี้ทำได้ง่ายเพราะฐานข้อมูลของวิกิพีเดียสามารถดาวน์โหลดได้โดยไม่ต้องขออนุญาต[1]
ในวรรณกรรมทรงอิทธิพลที่ทบทวนโดยผู้รู้เสมอกัน[2] ซึ่งหนังสือพิมพ์รายวันอังกฤษเดอะการ์เดียน ได้กล่าวถึง[3] ทีมนักวิจัยหกท่านจากมหาวิทยาลัยมินนิโซตา (สหรัฐ) ได้วัดความสัมพันธ์ระหว่างจำนวนการแก้ไขกับจำนวนการดูคำที่ผู้เขียนนั้น ๆ เขียน โดยวัดเป็นจำนวนการดูคำที่ผู้เขียนหนึ่ง ๆ เพิ่มขึ้นในบทความ ซึ่งเรียกว่า persistent word views (PWV) ผู้เขียนงานวิชาการอธิบายหลักการนับไว้ว่า "แต่ละครั้งที่ดูบทความ คำแต่ละคำก็ได้ดูด้วย เมื่อดูคำที่เขียนโดยผู้เขียน ก ผู้เขียนก็จะได้รับเครดิตเป็นหนึ่ง PWV (เรียกว่าเป็นคะแนนต่อจากนี้)" จำนวนการดูบทความประมาณจากบันทึกของเว็บเซิร์ฟเวอร์
นักวิจัยวิเคราะห์ 25 ล้านล้านคะแนน (1012) ที่ให้กับผู้ใช้ลงทะเบียนระหว่าง 1 กันยายน 2002 จนถึง 31 ตุลาคม 2006 ที่สุดของระยะนี้ ผู้แก้ไขมากสุดระดับ 1/10 (นับจำนวนแก้ไข) ได้คะแนนร้อยละ 86, ผู้แก้ไขมากสุด 1/100 ได้คะแนนร้อยละ 70 และผู้แก้ไขมากสุด 1/1000 (จำนวน 4,200 คน) ได้คะแนนร้อยละ 44 ซึ่งเท่ากับค่าวัดเกือบครึ่งหนึ่งตามงานศึกษานี้ ผู้แก้ไขมากสุด 10 คนแรก (ตามคะแนนดังว่า) ได้คะแนนเพียงแค่ร้อยละ 2.6 และเพียง 3 คนเท่านั้นที่มีจำนวนการแก้ไขในท๊อป 50 จากข้อมูลนี้ นักวิจัยได้อนุมานความสัมพันธ์ดังต่อไปนี้คือ
การเพิ่มแชร์ของ PWV เพิ่มขึ้นอย่างซูเปอร์ชี้กำลัง (super-exponentially) ตามลำดับจำนวนการแก้ไข กล่าวอีกอย่างก็คือ ผู้แก้ไขอภิชน (คือคนที่แก้ไขมากสุด) มอบคุณประโยชน์ให้ "มากกว่า" ที่ปกติจะได้ตามความสัมพันธ์แบบเลขชี้กำลัง
งานศึกษายังได้วิเคราะห์ผลของบอต[A]ต่อเนื้อหา ตามจำนวนการแก้ไข บอตเป็นเจ้าวิกิพีเดีย ผู้ใช้ 9 คนในท๊อป 10 และ 20 คนในท๊อป 50 เป็นบอต แต่ตามลำดับคะแนน PWV บอต 2 บอตเท่านั้นที่อยู่ในท๊อป 50 โดยไม่มีเลยในท๊อป 10
ตามการเพิ่มอิทธิพลของผู้แก้ไขท๊อป 1/1000 ตามลำดับคะแนน PWV งานศึกษาได้ฟันธงว่า
... ผู้แก้ไขบ่อย ๆ ควบคุมสิ่งที่คนเห็นเมื่อมาเยี่ยมวิกิพีเดียและ ... การควบคุม/ความเป็นเจ้าเช่นนี้ก็กำลังเพิ่มขึ้นเรื่อย ๆ
วรรณกรรมที่ทบทวนโดยผู้รู้เสมอกันให้ข้อสังเกตว่า สังคมวิกิพีเดียมีลำดับชั้นเพราะมีชนชั้น "ผู้ดูแลระบบ/แอดมิน"[A] งานนี้เสนอว่า การจัดลำดับชั้นเช่นนี้อาจมีประโยชน์ในบางเรื่อง แต่ก็ระบุว่าผู้ดูแลระบบและผู้ใช้อื่น ๆ มีอำนาจและสถานะที่ไม่เท่ากันอย่างชัดเจน[4]
เมื่อวิเคราะห์ประวัติการแก้ไขวิกิพีเดียอังกฤษทั้งหมดจนถึงเดือนกรกฎาคม 2006 งานศึกษาเดียวกันระบุว่า อิทธิพลการแก้ไขเนื้อหาของผู้ดูแลระบบได้ลดลงเรื่อย ๆ ตั้งแต่ปี 2003 เมื่อผู้ดูแลระบบแก้ไขเนื้อหาในอัตราร้อยละ 50 เทียบกับปี 2006 ที่ร้อยละ 10 นี่เกิดแม้จำนวนการแก้ไขเฉลี่ยต่อผู้ดูแลระบบจะเพิ่มขึ้นเป็น 5 เท่าในช่วงเวลาเดียวกัน ปรากฏการณ์นี้นักวิจัยได้ตั้งชื่อว่า "rise of the crowd" (กำเนิดชุมนุมชน) การวิเคราะห์ที่วัดจำนวนคำที่เขียนแทนที่จำนวนการแก้ไขก็มีรูปแบบคล้าย ๆ กัน
เพราะผู้ดูแลระบบต่าง ๆ กันมากในเรื่องจำนวนการแก้ไข งานศึกษาจึงแบ่งผู้ใช้ตามจำนวนการแก้ไขด้วย ผลสำหรับ "ผู้แก้ไขอภิชน/อีลิต" คือผู้ใช้ที่แก้ไขมากกว่า 10,000 ครั้ง ใกล้เคียงกับที่พบในผู้ดูแลระบบ ยกเว้นว่า จำนวนคำที่เปลี่ยนโดยผู้ใช้อภิชนยังตามทันจำนวนการเปลี่ยนแปลงของผู้ใช้ใหม่ แม้จำนวนการแก้ใขของผู้ใช้ใหม่ก็ยังเติบโตในสัดส่วนที่เร็วกว่า ผู้ใช้อภิชนได้เครดิตสำหรับการแก้ไขร้อยละ 30 ในปี 2006 งานศึกษาสรุปว่า
แม้อิทธิพลของพวกเขาจะโรยลงในปีที่ผ่านมาไม่นานนี้ ผู้ใช้อภิชนก็ยังปรากฏกว่ามอบงานใหญ่พอดูให้แก่วิกิพีเดีย อนึ่ง การแก้ไขของผู้ใช้อภิชนดูจะมีแก่นสาร คือ พวกเขาไม่เพียงแค่แก้คำผิดหรือเปลี่ยนแบบการอ้างอิง ...
เอกสารงานประชุมทางปรัชญาด้านวิธีการให้เหตุผลปี 2010 ได้ประเมินว่า ความเชื่อถือได้ของวิกิพีเดียมาจากคุณค่าทางญาณวิทยา หรือว่ามาจากคุณค่าเกี่ยวกับความใช้ได้ แล้วสรุปว่า แม้ผู้อ่านอาจไม่สามารถประเมินความรู้และความเชี่ยวชาญ (ซึ่งเป็นคุณค่าทางญาณวิทยา) ของผู้เขียนบทความหนึ่ง ๆ แต่ก็อาจประเมินความหลงใหลของผู้เขียน และวิธีการสื่อสารที่ทำความหลงใหลนั้นให้ปรากฏ ซึ่งเป็นเหตุผลให้เชื่อถือ[5]
รายละเอียดก็คือ ผู้เขียนเอกสารได้อ้างว่า วิกิพีเดียเชื่อถือไม่ได้เพราะความเชี่ยวชาญของเอกบุคคล เพราะความรู้ของคนโดยรวม ๆ หรือแม้แต่เพราะประสบการณ์ที่ทำให้รู้สึกว่าเชื่อถือได้ในอดีต นี่ก็เพราะความนิรนามหรือการใช้นามแฝงป้องกันไม่ให้ประเมินความรู้ของผู้เขียนได้ และวัฒนธรรมต่อต้านผู้เชี่ยวชาญของวิกิพีเดียก็ทำให้เรื่องนี้แก้ไขได้ยาก การแก้ไขวิกิพีเดียโดยมากยังจำกัดอยู่ในวงผู้แก้ไขที่เป็นอภิชน โดยไม่ได้ประมวล "ปัญญาของชุมชน" ซึ่งในบางกรณีก็ทำคุณภาพของบทความให้ตกลงเสียเอง ประสบการณ์ส่วนตัวในอดีตบวกกับงานศึกษาเชิงประสบการณ์ รวมทั้งเหตุการณ์ก่อการโต้แย้งของวิกิพีเดียในอดีต (รวม Seigenthaler biography controversy ) อาจทำให้สรุปได้ว่า วิกิพีเดียโดยทั่วไปเชื่อถือไม่ได้ ดังนั้น ปัจจัยทางญาณวิทยาเหล่านี้จึงไม่เป็นเหตุผลให้ใช้วิกิพีเดีย
ผู้เขียนเอกสารต่อมาจึงเสนอเหตุผลให้เชื่อถือวิกิพีเดียอาศัยคุณค่าเกี่ยวกับความใช้ได้ ซึ่งอาจกล่าวอย่างคร่าว ๆ ว่ามีสองปัจจัย ปัจจัยแรกคือ ขนาดและกิจกรรมมหาศาลในวิกิพีเดียเป็นเครื่องระบุว่า ผู้แก้ไขบทความมุ่งมั่นให้ความรู้แก่ชาวโลก ปัจจัยที่สองคือ การพัฒนานโยบาย แนวปฏิบัติ สถาบัน และเทคโนโลยีที่โปร่งใส นอกเหนือจากกิจกรรมมหาศาลที่มองเห็นได้ ช่วยคลายความเคลือบแคลงใจในเรื่องต่าง ๆ ที่บุคคลอาจมีในการเชื่อวิกิพีเดีย ความเคลือบแคลงที่ยกขึ้นรวมทั้ง นิยามว่าอะไรคือความรู้ การป้องกันการแก้ไขอย่างบิดเบือนของกลุ่มบุคคลที่ไม่มีความมุ่งมั่นเช่นกัน การแก้ไขความเสียหายต่อบทความให้ถูกต้อง การควบคุมและการเพิ่มพูนคุณภาพของบทความ
งานวิจัยของสถาบันอินเทอร์เน็ตของมหาวิทยาลัยออกซฟอร์ดได้แสดงว่า จนถึงปลายปี 2009 บทความวิกิพีเดียที่ติดพิกัด (คือที่ใช้แม่แบบ Coord ) ตลอดทุกภาษา ครอบคลุมสถานที่ประมาณ 500 ล้านแห่งในโลก แต่ก็มีการแจกแจงทางภูมิศาสตร์ที่ไม่เสมอกัน บทความโดยมากเกี่ยวกับทวีปอเมริกาเหนือ ยุโรป และเอเชียตะวันออก โดยไม่ครอบคลุมเขตภูมิศาสตร์ขนาดใหญ่ในประเทศกำลังพัฒนา รวมทั้งแอฟริกาโดยมาก[6]
เนื้อหาที่เป็นถ้อยคำและลำดับชั้นอันเป็นโครงร่างบทความของวิกิพีเดียได้กลายเป็นแหล่งความรู้สำคัญอย่างหนึ่งสำหรับนักวิจัยในการประมวลภาษาธรรมชาติและปัญญาประดิษฐ์ ในปี 2007 นักวิจัยที่สถาบันเทคโนโลยีเทคนิออน-อิสราเอลได้พัฒนาเทคนิคที่เรียกว่า Explicit Semantic Analysis (การวิเคราะห์ความหมายชัดแจ้ง)[7] ซึ่งใช้ความรู้เกี่ยวกับโลกที่ได้จากวิกิพีเดียอังกฤษ ระบบสร้างตัวแทนทางแนวคิดโดยใช้คำและตัวบทโดยอัตโนมัติ ซึ่งสามารถใช้คำนวณความคล้ายคลึงกันระหว่างคำกับคำและตัวบทกับตัวบท
ส่วนนักวิจัยที่แล็บประมวลผลความรู้แพร่หลาย (Ubiquitous Knowledge Processing Lab) ที่มหาวิทยาลัยเทคโนโลยีดาร์มชตัทแห่งประเทศเยอรมนีได้ใช้ความรู้เกี่ยวกับภาษาและโลกที่อยู่ในวิกิพีเดียและวิกิพจนานุกรมเพื่อสร้างฐานความรู้เกี่ยวกับภาษาคล้ายกับทรัพยากรที่ผู้เชี่ยวชาญได้สร้างเช่น WordNet[B][9] ผู้เชี่ยวชาญชาวเยอรมันคู่หนึ่งได้สร้างขั้นตอนวิธีเพื่อระบุความสัมพันธ์ระหว่างคำต่าง ๆ โดยตรวจวิกิพีเดียอังกฤษอาศัยการจัดหมวดหมู่ของบทความ แล้วสรุปว่า วิกิพีเดียได้สร้าง "อนุกรมวิธานที่สามารถแข่งขันกับ WordNet ในงานประมวลผลทางภาษา"[10]
ข้อมูลสุขภาพในวิกิพีเดียอังกฤษเป็นที่นิยมเพราะเสิร์ชเอนจินและเว็บเพจที่แสดงผลของเสิร์ชเอนจินมักแสดงลิงก์ไปยังบทความของวิกิพีเดีย[11] มีการประเมินอย่างเป็นอิสระเรื่องคุณภาพของข้อมูลสุขภาพที่มีในวิกิพีเดีย และตรวจว่าใครเข้าดูข้อมูล มีงานศึกษาในเรื่องจำนวนคนบวกข้อมูลทางประชากรศาสตร์ของบุคคลที่หาข้อมูลทางสุขภาพในวิกิพีเดีย ขอบเขตทางข้อมูลสุขภาพที่มี และคุณภาพของข้อมูล[12]
แม้วิกิพีเดียจะเป็นแหล่งข้อมูลทางสุขภาพที่นิยมมากที่สุดอย่างหนึ่ง[13] แต่ก็มีข้อเสียบ้าง (โดยไม่ได้กล่าวไว้ในที่นี้)
งานศึกษาปี 2007 ของบริษัทฮิตไวส์ (Hitwise)[C] ที่ตีพิมพ์ในนิตยสารไทม์ [14] พบว่า ชายกับหญิงเข้าเยี่ยมวิกิพีเดียเท่า ๆ กัน แต่ผู้แก้ไขร้อยละ 60 เป็นชาย
ส่วนเว็บไซต์ WikiWarMonitor ซึ่งดำเนินการโดยมหาวิทยาลัยอเมริกันและมหาวิทยาลัยอังกฤษ ได้ทุนจากคณะกรรมาธิการยุโรป และมุ่งระงับสงครามแก้ไขในวิกิพีเดีย ได้ตีพิมพ์ผลงานต่อไปนี้
งานศึกษาเชิงพรรณนา[19] ได้วิเคราะห์นโยบายและแนวปฏิบัติ[A]ของวิกิพีเดียอังกฤษจนถึงเดือนกันยายน 2007 แล้วระบุค่าสถิติสำคัญจำนวนหนึ่งเกี่ยวกับ
แม้นโยบายสั้น ๆ เช่น "ปล่อยวางกฎทั้งหมด" ก็มีการอภิปรายและการอธิบายให้ชัดเจนเป็นจำนวนมาก คือ
แม้นโยบาย "ปล่อยวางกฎทั้งหมด" เองจะยาวเพียงแค่ 16 คำ (ในภาษาอังกฤษ) แต่หน้าที่อธิบายว่านโยบายหมายความว่าอะไรก็ยาวถึง 500 คำ และส่งผู้อ่านไปยังเอกสารอื่น ๆ อีก 7 บทความ มีการอภิปรายมากกว่า 8,000 คำโดยหน้าได้เปลี่ยนไปมากกว่า 100 ครั้งในช่วงเวลาน้อยกว่าปี
งานศึกษาได้ให้ตัวอย่างการขยายนโยบายหลักบางอย่างตั้งแต่เริ่มขึ้น คือ[A]
นักวิจัยจากมหาวิทยาลัยวอชิงตันและเอชพีแล็บ (แล็บของบริษัทฮิวเลตต์-แพคการ์ด) ได้ร่วมมือทำงานศึกษาที่ทบทวนโดยผู้รู้เสมอกันในปี 2007[20] ได้ตรวจดูว่านโยบายวิกิพีเดียนำไปใช้อย่างไร และผู้แก้ไขทำงานร่วมกันให้ได้ความเห็นพ้องได้อย่างไร งานศึกษาตรวจตัวอย่างหน้าพูดคุยที่มีความเคลื่อนไหวอยู่ด้วยการวิเคราะห์เชิงปริมาณ ใช้ฐานข้อมูลวิกิพีเดียภาษาอังกฤษเดือนพฤศจิกายน 2006 ได้ตรวจหน้าพูดคุย 250 หน้าที่อยู่ในส่วนหางของกราฟการแจกแจง คือ เป็นหน้าพูดคุยเพียงอัตราร้อยละ 0.3 แต่มีจำนวนการแก้ไขหน้าพูดคุยถึงร้อยละ 28.4 และที่สำคัญยิ่งกว่านั้นก็คือ มีลิงก์ไปยังหน้านโยบายในอัตราร้อยละ 51.1 จากประวัติของหน้าตัวอย่าง งานศึกษาตรวจดูแต่เดือนที่แก้ไขมาก ซึ่งเรียกว่าส่วนวิกฤติ (critical sections) คือเป็นเดือนต่อ ๆ กันที่ทั้งบทความและหน้าพูดคุยกำลังแก้โดยมีจำนวนสำคัญ
งานศึกษานิยามค่าวัดแล้ววัดความแพร่หลายของการอ้างนโยบาย ส่วนวิกฤติหนึ่ง ๆ จัดว่า "หนักด้วยนโยบาย" (policy-laden) ถ้ามีเรื่องนโยบายอย่างน้อยเป็นทวีคูณของค่าเฉลี่ย บทความหนึ่ง ๆ จะมีค่าระบุ 3 อย่าง คือ
ค่าต่าง ๆ ของตัวระบุ 3 อย่างนี้แบ่งบทความออกเป็น 8 หมวดที่ใช้ชักตัวอย่าง งานศึกษาตั้งใจจะวิเคราะห์ส่วนวิกฤติ 9 ส่วนจากหมวดตัวอย่างแต่ละหมวด แต่ก็เลือกส่วนวิกฤติได้แค่ 69 ส่วน (ไม่ใช่ 72 ส่วน) เพราะมีบทความแค่ 6 บทความ (ไม่ใช่ 9 บทความ) ที่เป็นบทความคัดสรรด้วย ก่อการโต้เถียงด้วย และหนักด้วยนโยบายด้วย
งานศึกษาพบว่า นโยบายไม่ได้ประยุกต์ใช้อย่างสม่ำเสมอ เพื่อแสดงตัวอย่างที่เฉพาะ จากสิ่งที่ได้ค้นพบซึ่งกว้างกว่า รายงานได้แสดงตัวอย่าง 2 ตัวอย่างจากหน้าพูดคุยของวิกิพีเดียเพื่อแสดงความแตกต่าง
ค่าเฉลี่ย...ไม่จัดว่าเป็นงานค้นคว้าต้นฉบับดอกหรือ? [ผช3]
มันดูเหมือนจะไม่ใช่เช่นนั้นสำหรับผม มันดูเหมือนว่า งานค้นคว้าต้นฉบับได้ทำโดย[องค์กรของรัฐ] หรือผมจะพลาดอะไรไปสักอย่าง? [ผช4]
ถ้า[องค์กรของรัฐ]ไม่ได้ตีพิมพ์ค่าเฉลี่ย เราคำนวณมันก็จะเป็นงานค้นคว้าต้นฉบับ หรือไม่ใช่? ผมไม่แน่ใจ [ผช3]
ไม่ใช่ ทำไมมันถึงจะเป็น? การประมาณค่านอกช่วงจากข้อมูลที่มีอยู่แล้วไม่ใช่งานค้นคว้าต้นฉบับ [ผช5]
จาก WP:NOR "บทความไม่ควรมีการวิเคราะห์หรือการสังเคราะห์ใหม่ ๆ ซึ่งอาร์กิวเมนต์ แนวคิด ข้อมูล ไอเดีย และข้อความที่มุ่งผลักดันจุดยืน" ถ้ามันมีค่าอะไร ๆ [ผช4]
ความคิดของคุณเป็นงานค้นคว้าต้นฉบับ (WP:OR) ผมสามารถแสดงอย่างสบาย ๆ ซึ่งบทความวิชาการที่กล่าวว่า ลัทธิต่อต้านอำนาจนิยมไม่ใช่หลักของ Panism คุณกำลังสังเคราะห์ไอเดียสารพัดอย่างตรงนี้ตามมุมมองของคุณ [ผช6]
การให้เหตุผลแบบนิรนัยธรรมดา ๆ ไม่ใช่งานค้นคว้าต้นฉบับ Panism ต่อต้านอำนาจนิยมโดยธรรมชาติ ดังนั้น ระบบเศรษฐกิจเชิงอำนาจนิยมจึงไม่สามารถเป็น Panist คุณไม่เห็นด้วยกับอะไร ข้อตั้งหรือข้อสรุป? [ผช7]
งานศึกษาอ้างว่า ความคลุมเครือเช่นนี้ทำให้เล่นอำนาจได้ง่าย ๆ และได้ระบุการเล่นอำนาจ 7 อย่างตามระเบียบวิธีทางสังคมศาสตร์คือ grounded theory รวมทั้ง
เพราะเนื้อที่ไม่พอ งานศึกษาได้แสดงรายละเอียดของการเล่นอำนาจเพียง 4 อย่างแรกที่ทำผ่านการตีความนโยบาย แต่ก็แสดงการใช้อำนาจอีกแบบที่ได้วิเคราะห์ คือ การละเมิดนโยบายแบบโต้ง ๆ ที่ได้ให้อภัยเพราะผลงานของผู้ใช้มีคุณค่าสูงแม้จะไม่เคารพกฎเกณฑ์
งานศึกษาพิจารณาว่านโยบายของวิกิพีเดียคลุมเครือเกี่ยวกับขอบเขตของบทความ มีตัวอย่างที่นำมาแสดงคือ
...ความเห็นพ้องเป็นเรื่องเหลวไหลเพราะความจริงอยู่ข้างผม ผมยังมีการแนะนำของวิกิพีเดียขอให้กล้า การลบเนื้อความเกี่ยวกับโรมันคาทอลิก...
มุมมองของ paleocentrism ไม่เพียงไม่ถูกต้อง แต่ยังละเมิดนโยบายวิกิพีเดีย:มุมมองที่เป็นกลาง... การลบหรือการตอนเนื้อความ[เช่นนี้]ละเมิดนโยบายวิกิพีเดียหลายอย่างคือ มุมมองที่เป็นกลาง ขอให้กล้า... ถ้าพวกคุณต้องการบทความที่มีเพียงแต่ทฤษฎีทางวิทยาศาสตร์ในเรื่อง paleocentrism คุณน่าจะเขียนบทความเอง [ผช12]
พวกผมจริง ๆ ได้เขียนบทความเกี่ยวกับ paleocentrism ที่เป็นเพียงทฤษฎีวิทยาทางศาสตร์เท่านั้นก่อนที่คุณจะมา... เห็นได้ชัดว่าคุณเป็นคนใหม่ [ผช12][E]
... การโต้เถียงตามความเข้าใจของนโยบายมุมมองที่เป็นกลางและขอให้กล้าของคุณค่อนข้างน่าหัวเราะ คล้าย ๆ กับเด็กพึ่งจบมัธยมถกเถียงประเด็นกฎหมายรัฐธรรมนูญ สิ่งเหล่านี้เป็นหลักที่มีความหมายลงตัวแล้ว คนที่อยู่นี่เป็นปี ๆ เข้าใจพวกมันดีกว่าคุณมาก คุณจึงไม่สามารถใช้พวกมันเป็นอาวุธอย่างมีประสิทธิภาพในการโต้เถียงนี้ [ผช13]
วิกิพีเดียไม่ใช่สารานุกรมที่เป็นรูปเล่ม เราไม่จำเป็นต้องอัดประเด็นทุก ๆ อย่างเข้าในบทความหลัก และไม่จำเป็นต้องจัดว่าไม่สมบูรณ์ถ้าไม่อัด... [ผช14]
... หน้าลิงก์ว่าวิกิพีเดียไม่ใช่สารานุกรมที่เป็นรูปเล่มกล่าวเป็นปฐมเลยว่า วิกิพีเดีย "เป็น" สารานุกรม สารานุกรมจริง ๆ เช่น สารานุกรมบริแทนนิกาก็มีส่วนย่อยเกี่ยวกับ paleocentrism รวมทั้งผลทางสังคม ทางการเมือง และทางปรัชญา [ผช12]
ดังที่อธิบายในลิงก์วิกิพีเดียไม่ใช่สารานุกรมที่เป็นรูปเล่ม บทความวิกิพีเดียควรแสดงข้อความย่อเกี่ยวกับเรื่องสำคัญที่เป็นหลักในเรื่องหนึ่ง ๆ สำหรับนักชีววิทยาเช่นคุณเอง เรื่องสำคัญของ paleocentrism อาจไม่ใช่ผลทางสังคม แต่สำหรับสังคมที่เหลือ มันเป็น[ผช12]
... สิ่งที่คุณพูดถึงไม่ใช่ paleocentrism เรื่องหลัก ๆ ของ paleocentrism ก็คือการเกิดการสมดุลเป็นคาบ ๆ, คลื่นเปลี่ยนรูปโลก, airation เหล่านี้เป็นประเด็นจริง ๆ ที่เกี่ยวกับกระบวนการ paleocentrism เอง ประเด็นทางสังคมที่คุณกล่าวถึงเป็น "เรื่องรอบ ๆ" ไม่ใช่ "เรื่องหลัก" เป็นเรื่อง "เกี่ยวกับ" เป็นเรื่อง "ห้อมล้อม" แต่ "ไม่ใช่ paleocentrism" [ผช15]
งานศึกษาตีความคำโต้แย้งที่ดุเดือดเหล่านี้ว่า
การต่อสู้เกี่ยวกับขอบเขตบทความเช่นนี้ก็ยังเกิดแม้ในสิ่งแวดล้อมไฮเปอร์ลิงก์ก็เพราะชื่อบทความเป็นเรื่องสำคัญ เพราะบทความ "paleocentrism" ย่อมเด่นกว่า และคนอ่านก็มีโอกาสเห็นมากกว่าบทความ "ผลทางสังคมของ paleocentrism"
งานศึกษาให้ข้อสังเกตว่า ความเห็นพ้องในวิกิพีเดียไม่มีวันจบ เพราะอาจเปลี่ยนไปเมื่อไรก็ได้ งานศึกษาพบว่า ความไม่ชัดเจนเช่นนี้ก่อการเล่นอำนาจ และทำการต่อสู้เป็นรุ่น ๆ เพื่อความเห็นพ้องให้เป็นส่วนของการต่อสู้ความเป็นเจ้าของบทความ
ในทางปฏิบัติแล้ว ... มักจะมีเจ้าของหน้าโดยพฤตินัย หรือมีกลุ่มผู้แก้ไขที่กำหนดเนื้อความของบทความ ความเห็นพ้องในอดีตของคนกลุ่มนี้อาจยกว่าเป็นเรื่องโต้แย้งไม่ได้ อำพรางการเล่นอำนาจที่ต้องทำเพื่อสร้างความเห็นพ้อง ประเด็นก็คือความชอบธรรมของความเห็นพ้องในอดีต เพราะผู้ร่วมงานระยะยาวย่อมไม่อยากเสียเวลาโต้เถียงประเด็นที่ตนพิจารณาว่าจบแล้ว การชี้ความเห็นพ้องในอดีตก็เหมือนกับการลิงก์ไปยังนโยบายต่าง ๆ เป็นวิธีรับมือกับพฤติกรรมเกรียน ในนัยตรงกันข้าม ผู้ใช้ใหม่หรือผู้ร่วมงานแบบนาน ๆ มาทีหนึ่งก็มักจะรู้สึกว่ามุมมองของตนไม่ได้พิจารณาในการโต้เถียงครั้งก่อน ๆ และต้องการจะยกปัญหาเดิมขึ้นอีก
งานศึกษาใช้ตัวอย่างการอภิปรายนี้เพื่อแสดงการต่อสู้ที่เป็นไปอย่างต่อเนื่อง
สิ่งที่กล่าวเหล่านี้ [ของ ผช17] ได้พิจารณาอย่างละเอียดแล้ว มันเหมือนกับเกมตีหัวตุ่น พวกเขาลองด้วยวิธีหนึ่ง แล้วถูกปฏิเสธ ก็จะลองด้วยวิธีที่สอง ซึ่งก็ถูกปฏิเสธ แล้วลองวิธีที่สาม ซึ่งก็ถูกปฏิเสธ แล้วก็จะลองวิธีที่หนึ่งอีก [ผช18]
มันน่าสนใจที่จะดูว่ามีผู้ใช้ต่าง ๆ กันจำนวนเท่าไรที่พยายามร่วมงานในบทความนี้และขยายมุมมองอีกมุมหนึ่ง แล้วเพียงแต่ถูกขับไล่ไปโดยบุคคลที่เชื่อใน [การแบ่งเป็นสองพวกแบบคลุมจักรวาล] เหมือนกับเป็นความเชื่อทางศาสนา ทำไมคุณไม่พิจารณาบ้างว่า บางทีพวกเขาก็พูดถูกแล้ว และว่า [ผช19], [ผช20] และพวกคุณที่เหลือต่างขับผู้แก้ไขอื่น ๆ ไปจากบทความนี้ด้วยการผลักดันมุมมองแบบหนักมือโดยมีสิทธิผู้ดูแลระบบของคุณ? [ผช21]
ตัวอย่างหนึ่งแสดงให้เห็นว่า ผู้ดูแลระบบได้ลบล้างความเห็นพ้องแล้วลบบัญชีของผู้ใช้คนหนึ่งซึ่งเป็นผู้ป่วยที่ป่วยด้วยโรคซึ่งยังไม่ได้ชื่อ (เรียกว่า Frupism ในงานศึกษา) ผู้ดูแลระบบได้ทำเช่นนี้เมื่อบทความกำลังได้เสนอให้เป็นบทความคัดสรร
การใช้อำนาจชนิดนี้แสดงด้วย[ผช24]ที่อ้างผลงานในอดีตเพื่อโต้เถียงผู้ร่วมงานอีกคนหนึ่งผู้กล่าวหา[ผช24]ว่า ทำให้งานเสียเปล่าและทำงานให้ยุ่งเหยิง (disruptive)
งั้นหรือ คุณหมายความว่า "ผม" คอยวนเวียนเพียงเพื่อชี้เรื่องความไร้คุณภาพของบทความที่เขียนสำหรับวิกิพีเดีย? โปรดกรุณาดูจำนวนการแก้ไขของผมอีกสักครั้ง!! LOL ผมแก้ไขเกินกว่า 7,000 ครั้งแล้ว... ตามที่คุณรู้ ผมสามารถเคลมเครดิตสำหรับการเขียนบทความคัดสรรในด้านปรัชญา 2 ใน 6 บทความโดยเริ่มต้นจากเอกสารเปล่า [ผช24]
งานศึกษาพบว่า มีผู้ร่วมงานที่ละเมิดนโยบายอย่างสม่ำเสมอและอย่างสำเร็จโดยไม่ถูกลงโทษ
[ผช24]ได้แข่งขันชิงอำนาจในรูปแบบ "ไม่ฉันก็คุณ" แบบโต้ง ๆ คือ ถ้าการกระทำของ[ผช25]ยังดำเนินต่อไป เขาจะลาออก ... การกระทำเช่นนี้ชัดเจนว่าละเมิดนโยบายความเป็นเจ้าของบทความ ความสุภาพต่อผู้ร่วมงานอื่น ๆ และการปฏิบัติต่อผู้ใช้ใหม่ ในฐานเป็นผู้ใช้ใหม่ [ผช25]อาจไม่รู้นโยบายเหล่านี้ แต่[ผช26]รู้แน่ ๆ การทำเป็นมองไม่เห็น[ของผช26]เกิดเพราะ[ผช24]เป็นผู้ร่วมงานที่มีคุณค่าในบทความทางปรัชญาผู้ชี้จุดนี้อย่างไม่อาย เพราะมีผู้ร่วมงานน้อยที่ตั้งใจสร้างเนื้อหาคุณภาพสูงอย่างสม่ำเสมอ ชุมชนวิกิพีเดียยอมอดทนต่อการใช้ในทางผิด ๆ และการละเมิดนโยบายถ้าได้ผลงานที่มีคุณค่า...
ขอโทษเถอะครับ แต่นั่นไม่ตอบคำถามนั่นเลย ผมอยากจะรู้ว่าอะไรที่[ผช25]เสนอซึ่งใช้ไม่ได้ การไม่มีแหล่งอ้างอิงของเขาเป็นต้น เป็นข้อบกพร่องแน่นอน แต่นั่นเป็นเหตุที่ผมหาให้แหล่งหนึ่ง (ในหัวข้อย่อยที่ 8 คือ Enquiry) [ผช26]
...
ประเด็นนี้ได้กล่าวถึงแล้วในบทความ อาจจะต้องขยายมันบ้าง ผมสามารถทำเองได้อย่างสบาย ๆ เมื่อมีเวลา มีเรื่องอื่นไหมครับ ? คุณสนับสนุนแนวความคิดแข่งขันของ[ผช25]ด้วยหรือไม่ว่าบทความนี้เขียนไม่ดี ว่าจำเป็นต้องปรับปรุงใหม่ตั้งแต่หัวจนถึงท้าย สิ่งไร้สาระไร้ความหมายที่เขาพยายามเติมด้านบน หรืองานค้นคว้าต้นฉบับอันอื่นที่เขาได้เขียนลงในหน้านี้? โดยแท้จริงแล้ว มีสองพวกในเรื่องนี้ บทความนี้ควรถูกยึดโดยคนความคิดประหลาดเช่นคนชื่ออะไรนั่น หรือไม่ควร ถ้าควรแล้ว ผมขอไป คุณสามารถสนับสนุนผมหรือไม่สนับสนุน จุดยืนของคุณอยู่ที่ไหน?... [ผช24]
มันไม่มีทางจินตนาการอย่างไร ๆ เลยได้ว่า ผมสนับสนุนมุมมองว่าบทความนี้ไม่ดี จริง ๆ ผมไม่เห็นด้วยกับอะไรหลายอย่างที่[ผช25]กล่าวในหน้านี้ที่อื่น ๆ ผมเสียใจจริง ๆ ถ้านี่ทำให้คุณอารมณ์เสีย [ผช26]
ในปี 2008 นักวิจัยจากมหาวิทยาลัยคาร์เนกีเมลลอน (สหรัฐ)[21] ได้สร้างแบบจำลองโพรบิต (probit model)[F] ของผู้แก้ไขวิกิพีเดียภาษาอังกฤษที่ได้ผ่านกระบวนการทบทวนเพื่อเป็นผู้ดูแลระบบได้อย่างสำเร็จ โดยใช้เพียงข้อมูลอภิพันธุ์ของวิกิพีเดียรวมทั้งความย่อการแก้ไข แบบจำลองนี้พยากรณ์ผู้ได้การเสนอชื่อที่ประสบผลสำเร็จอย่างแม่นยำในอัตราร้อยละ 74.8
งานศึกษาให้ข้อสังเกตว่า แม้จะมีการคัดค้านความเช่นนี้ แต่ "ในด้านหลาย ๆ ด้าน การได้รับเลือกเป็นผู้ดูแลเป็นการเลื่อนตำแหน่ง ซึ่งแยกแกนนำผู้เป็นอภิชนจากชุมชนผู้แก้ไขจำนวนมากอื่น ๆ" ดังนั้น งานศึกษานี้จึงได้ใช้กระบวนการ policy capturing[23] ซึ่งในจิตวิทยาสังคม เป็นวิธีเปรียบเทียบลักษณะต่าง ๆ ที่สำคัญเพียงแต่พูดกับลักษณะอื่น ๆ ที่จริง ๆ ทำให้ได้เลื่อนตำแหน่งงาน
อัตราการเลื่อนตำแหน่งที่สำเร็จรวม ๆ กันได้ลดลงจากร้อยละ 75 ในปี 2005 เหลือร้อยละ 53 ในปี 2006 จนเหลือร้อยละ 42 ในปี 2007 อัตราความล้มเหลวที่สูงขึ้น ๆ เช่นนี้ให้เหตุว่า ผู้ดูแลระบบที่ได้เลื่อนตำแหน่งเร็ว ๆ นี้ต้องผ่านมาตรฐานที่สูงขึ้น ซึ่งได้รับการสนับสนุนโดยหลักฐานโดยเรื่องเล่าจากงานศึกษาอีกงานหนึ่ง[24] ซึ่งอ้างอิงผู้ดูแลระบบรุ่นต้น ๆ ผู้แสดงข้อสงสัยว่า ตนจะผ่านเกณฑ์มาตรฐานเช่นนี้หรือไม่ถ้าการเลือกตั้งของตนได้ทำเร็ว ๆ นี้ เพราะเหตุนี้ งานศึกษาจึงอ้างว่า
กระบวนการที่ผู้ก่อตั้งวิกิพีเดียเองครั้งหนึ่งเคยจัดว่า "ไม่ใช่เรื่องใหญ่ " (no big deal) ได้กลายเป็นเรื่องใหญ่พอควร
ปัจจัย | ปี 2006-2007 | ก่อนปี 2006 |
---|---|---|
การเสนอชื่อแต่ละครั้งในอดีต | -14.7% | -11.1% |
เดือนแต่ละเดือนหลังจากเริ่มแก้ไขเป็นครั้งแรก | 0.4% | (0.2%) |
การแก้ไขบทความทุก ๆ 1,000 ครั้ง | 1.8% | (1.1%) |
การแก้ไขนโยบายวิกิพีเดียทุก ๆ 1,000 ครั้ง | 19.6% | (0.4%) |
การแก้ไขบทความโครงการวิกิ ทุก ๆ 1,000 ครั้ง | 17.1% | (7.2%) |
การแก้ไขหน้าพูดคุยทุก ๆ 1,000 ครั้ง | 6.3% | 15.4% |
การแก้ไขหน้า คอต./การไกล่เกลี่ยข้อพิพาท /มารยาทแต่ละครั้ง | -0.1% | -0.2% |
คะแนนความหลากหลายแต่ละคะแนน (ดูข้อความต่อไป) | 2.8% | 3.7% |
อัตราการระบุว่าเป็นการแก้ไขเล็กน้อยในความย่อการแก้ไขทุก ๆ ร้อยละ 1 | 0.2% | 0.2% |
อัตราการเขียนความย่อการแก้ไขทุก ๆ ร้อยละ 1 | 0.5% | 0.4% |
การเขียนขอบคุณในความย่อการแก้ไขแต่ละครั้ง | 0.3% | (0.0%) |
การแก้โดยระบุเหตุเป็นมุมมองที่ไม่เป็นกลางแต่ละครั้ง | 0.1% | (0.0%) |
การแจ้งผู้ดูแลระบบ/การแก้ไข Noticeboards แต่ละครั้ง | -0.1% | (0.2%) |
อาจเป็นเรื่องผิดคาดว่า การเสนอชื่อเป็นผู้ดูแลระบบหลายครั้งหลายคราวกลับมีผลลบต่อการได้รับตำแหน่ง คือความพยายามแต่ละครั้งมีโอกาสประสบความสำเร็จน้อยกว่าคราวที่แล้วในอัตราร้อยละ 14.8 เวลาที่ได้ร่วมงานกับวิกิพีเดียมีผลดีเพียงเล็กน้อยต่อการได้รับเลือก
ข้อสำคัญที่งานค้นพบอย่างหนึ่งก็คือการแก้ไขนโยบายวิกิพีเดียหรือโครงการวิกิ มีค่าเป็น 10 เท่าของการแก้ไขบทความ ข้อสังเกตอีกอย่างก็คือผู้ได้การเสนอชื่อที่มีประสบการณ์ใน "ส่วน" ต่าง ๆ หลายส่วนของระบบมีโอกาสได้รับเลือกมากกว่า ซึ่งวัดเป็น คะแนนความหลากหลาย (diversity) คือการนับส่วนต่าง ๆ ที่ผู้แก้ไขได้ร่วมทำงาน
งานศึกษาได้แบ่ง "ส่วน" วิกิพีเดียออกเป็น 16 ส่วน รวมทั้ง บทความ หน้าคุยของบทความ หน้าเกี่ยวกับการลบบทความ/หมวดหมู่/หรือแม่แบบ หน้าทบทวนการย้อนการลบ เป็นต้น (ดูงานวิจัยสำหรับรายการทั้งหมด) ยกตัวอย่างเช่น ผู้ใช้ที่ได้แก้บทความ หน้าผู้ใช้ของตน และโพ้สต์ครั้งหนึ่งในหน้าทบทวนการย้อนการลบก็จะได้ความหลายหลาก 3 คะแนน การแก้ไขเพิ่มในส่วนอื่น ๆ ใดก็ได้มีสหสัมพันธ์กับโอกาสได้ตำแหน่งผู้ดูแลระบบเพิ่มขึ้นร้อยละ 2.8
การระบุว่าเป็นการแก้ไขเล็กน้อยก็ช่วยด้วย แม้นักวิจัยจะพิจารณาว่า นี่อาจเป็นเพราะการแก้ไขเล็กน้อยมีสหสัมพันธ์กับประสบการณ์ โดยเทียบกัน การแก้ไขแต่ละครั้งที่หน้าของ คอต. หรือคณะไกล่เกลี่ยข้อพิพาท หรือการปรึกษาเรื่องมารยาท ซึ่งล้วนเป็นหน้าที่ใช้ระงับข้อพิพาท กลับลดโอกาสประสบผลสำเร็จร้อยละ 0.1 การโพสต์ไปที่กระดานปิดประกาศถามเรื่องนโยบาย (noticeboards) ก็มีผลลบเช่นกัน งานศึกษาระบุว่านี่เป็นหลักฐานแสดงว่า ผู้มีส่วนร่วมเพิ่มความรุนแรงหรือทำให้ยืดยาวซึ่งข้อพิพาทมีโอกาสได้เป็นแอดมินน้อยลง
การขอบคุณหรืออะไรเช่นกันในความย่อการแก้ไข และการชี้ว่าเป็นการแก้ไขมุมมองที่ไม่เป็นกลาง (เพียงในความย่อการแก้ไข เพราะงานศึกษาวิเคราะห์เพียงข้อมูลอภิพันธุ์เท่านั้น) แต่ละครั้งมีผลบวกเล็กน้อย คือเพิ่มโอกาสร้อยละ 0.3 และ 0.1 ว่าจะได้ตำแหน่งในระหว่างปี 2006-2007 แม้จะไม่มีนัยสำคัญทางสถิติก่อนหน้านั้น
ปัจจัยบางอย่างพบว่าไม่สำคัญหรือสำคัญอย่างมากก็นิดหน่อยคือ
งานศึกษาเสนอว่าความแปรผันของผลการได้ตำแแหน่งร้อยละ 25 ที่อธิบายไม่ได้อาจมาจากปัจจัยที่ไม่ได้วัด เช่น คุณภาพการแก้ไขหรือการร่วมมือประสานงานนอกเว็บไซต์ เช่น ในบัญชีจ่าหน้าลับที่รายงานในเว็บไซต์ข่าวและความเห็น The Register [25] งานศึกษาสรุปว่า
การสร้างข้อความจำนวนมากไม่พอให้ได้ "เลื่อนตำแหน่ง" ในวิกิพีเดีย การแก้ไขบทความของผู้ได้การเสนอชื่อเป็นตัวพยากรณ์ความสำเร็จที่ไม่ดี ผู้ได้การเสนอชื่อต้องแสดงพฤติกรรมเป็นผู้จัดการยิ่งขึ้น ประสบการณ์หลายหลากและการร่วมพัฒนานโยบายและโครงการวิกิเป็นตัวพยากรณ์ที่ดีกว่าในการได้ตำแหน่ง นี่สมกับสิ่งที่ได้เคยพบว่า วิกิพีเดียเป็นอำมาตยาธิปไตย/ระบบข้าราชการ[19] และการประสานงานกันได้เพิ่มขึ้นอย่างสำคัญ[26][27] ... การร่วมงานในนโยบายวิกิพีเดียและโครงการวิกิไม่ใช่ตัวพยากรณ์การได้เป็นผู้ดูแลระบบก่อนปี 2006 ซึ่งแสดงว่าชุมชนโดยรวม ๆ เริ่มให้ความสำคัญกับการสร้างนโยบายและประสบการณ์การจัดระเบียบเหนือการประสานงานในระดับบทความ
งานวิจัยต่อมาในปี 2011 ของนักวิจัยอีกทีมหนึ่ง[28] ตรวจสอบเหตุผลของบุคคลเมื่อช่วยเลือกผู้ดูแลระบบ ซึ่งพบว่า การตัดสินใจจะขึ้นกับการตีความร่วมกันของหลักฐานที่พบในวิกิและกับปฏิสัมพันธ์กับคนอื่น ๆ ในอดีต
แม้ครูอาจารย์จะไม่ค่อยเต็มใจให้ใช้วิกิพีเดียเป็นส่วนของการบ้าน แต่ก็พบว่านักเรียนนักศึกษาที่แก้ไขวิกิพีเดีย (ในงานวิจัยเป็นวิกิพีเดียภาษาฮีบรู) สนใจในการเรียนเพิ่ม ได้ผลงานเพิ่ม ปรับปรุงการเรียนและการพัฒนาตน และเพิ่มทำงานร่วมกับคนทั้งในพื้นที่และในระดับนานาประเทศ[29]
ขั้นตอนวิธีการสืบหาความรู้เชิงความหมายโดยอัตโนมัติและโดยใช้การเรียนรู้ของเครื่องได้ใช้เพื่อ "ดึงข้อมูลที่เครื่องแปลผลได้โดยมีค่าใช้จ่ายและความซับซ้อนค่อนข้างน้อย"[30] ดีบีพิเดีย[G]ได้ใช้เนื้อหามีโครงสร้าง (structured content) ที่ดึงมาจากกล่องข้อมูลของวิกิพีเดียภาษาต่าง ๆ ด้วยขั้นตอนวิธีการเรียนรู้ของเครื่องเพื่อสร้างทรัพยากรเป็นข้อมูลลิงก์ (linked data) ภายในเว็บเชิงความหมาย[33]
ในงานศึกษาหนึ่งที่ตีพิมพ์ในวารสารวิทยาศาสตร์ PLoS ONE [34] นักวิชาการจากสถาบันอินเทอร์เน็ตแห่งออกซฟอร์ด (OII) และผู้ร่วมงานจากมหาวิทยาลัยเซนทรัลยุโรเปียน (CEU) ได้แสดงว่า สถิติการดูหน้าเกี่ยวกับภาพยนตร์มีสหสัมพันธ์ที่ดีกับรายได้ภาพยนตร์ พวกเขาได้พัฒนาแบบจำลองคณิตศาสตร์ที่พยากรณ์รายได้ภาพยนตร์โดยวิเคราะห์จำนวนดูหน้าบวกกับจำนวนการแก้ไขและจำนวนผู้แก้ไข (เป็นเอกบุคคล) หน้าเกี่ยวกับภาพยนตร์ แม้แบบจำลองนี้จะได้พัฒนาโดยใช้ข้อมูลของวิกิพีเดียอังกฤษ แต่วิธีการที่ใช้เป็นอิสระจากภาษา จึงสามารถใช้กับภาษาอื่น ๆ และใช้กับผลิตภัณฑ์อื่น ๆ นอกเหนือจากภาพยนตร์[35]
ในงานศึกษาอีกงานหนึ่งที่ตีพิมพ์ในวารสารวิทยาศาสตร์ Scientific Reports ในปี 2013[36] ทีมนักวิชาการได้แสดงว่า การเปลี่ยนแปลงจำนวนการดูหน้าบทความวิกิพีเดียอังกฤษเกี่ยวกับการเงินสัมพันธ์กับการเปลี่ยนแปลงขนาดใหญ่ในตลาดหลักทรัพย์สหรัฐ[37][38]