קישור שבור הוא מונח המתייחס לתופעה של קישורים הנוטים עם הזמן להפסיק להצביע על דף האינטרנט, הקובץ או השרת אליו הצביעו במקור, בגלל שהאובייקט הזה (למשל דף אינטרנט) הועבר לכתובת חדשה או הפך לא זמין לצמיתות.
שיעור הקישורים השבורים הוא נושא ללימוד ומחקר בשל משמעותו ליכולת האינטרנט לשמר מידע. ההערכות לגבי שיעור זה משתנות באופן דרמטי בין המחקרים. מומחי מידע הזהירו כי תופעת הקישורים השבורים עלולה לגרום לנתוני ארכיון חשובים להיעלם, מה שעלול להשפיע על מערכת המשפט ועל נגישות ידע בעולם האקדמי.
מספר מחקרים בחנו את השכיחות של קישורים שבורים ברשת הכלל עולמית (ה-World Wide Web), בספרות אקדמית המשתמשת בכתובות URL כדי לצטט תוכן אינטרנט, ובתוך ספריות דיגיטליות.
מחקר משנת 2002 העלה כי התפתחות קישורים שבורים בספריות דיגיטליות היא איטית במידה ניכרת מאשר באינטרנט, ומצא שכ-3% מהאובייקטים כבר לא היו נגישים לאחר שנה אחת.[1]
מחקר משנת 2003 מצא שברשת האינטרנט, נשבר בערך קישור אחד מכל 200 קישורים מדי שבוע.[2] שיעור זה אושש במידה רבה על ידי מחקר שנערך בשנים 2016–2017 על קישורים ב-Yahoo! Directory (שהפסיקה להתעדכן ב-2014 לאחר 21 שנות פיתוח).[3]
מחקר משנת 2004 הראה שבקבוצות ספציפיות של קישורי אינטרנט (כגון אלה המכוונים לסוגי קבצים ספציפיים או אלה המתארחים בשרתים של מוסדות אקדמיים) שיעור התפתחות הקישורים השבורים עשוי להיות שונה באופן דרמטי.[4] נראה שקישורים שנבחרו לפרסום נהנים מחיים ארוכים יותר מאשר קישורים לאתרים אחרים.
מחקרים אחרים מצאו שיעורים גבוהים יותר של הישברות קישורים בספרות אקדמית.[5][6]
במחקר משנת 2021 על קישורים חיצוניים במאמרי ניו יורק טיימס שפורסמו בין 1996 ל-2019 מצא יציבות טובה יחסית של הקישורים (עם שונות משמעותית בין נושאי התוכן), אך ציין כי 13% מהקישורים הפונקציונליים אינם מובילים עוד לתוכן המקורי - תופעה הנקראת סחף תוכן (content drift).[7]
מחקר משנת 2013 מצא ש-49% מהקישורים באתר פרסומי דעה של בית המשפט העליון בארצות הברית הם קישורים שבורים.[8]
מחקר משנת 2023, שבחן לוחות מחוונים (Dashboard) של COVID-19 בארצות הברית, מצא ש-23% מלוחות המחוונים של מדינות ארצות הברית שהיו זמינים בפברואר 2021 כבר לא היו זמינים בקישורים המקוריים שלהם באפריל 2023 (כלומר - הקישורים אליהם היו שבורים).[9]
קישור שבור יכול להיגרם עקב מספר סיבות. ייתכן שדף אינטרנט שאליו הצביע הקישור הוסר. ייתכן שיש תקלה בשרת שמארח את דף היעד, או שהשרת הוסר מהשירות או הועבר לשם דומיין חדש. עוד בשנת 1999, צוין כי עם כמות החומר שניתן לאחסן בכונן קשיח, "כשל בדיסק בודד יכול להיות דומה לשריפת הספרייה באלכסנדריה."[10] הרישום של שם דומיין עלול לפוג או לעבור לידי גורם אחר. סיבות מסוימות עלולות לגרום לכך שהקישור לא יוביל ליעד כלשהו ויחזיר שגיאה כגון HTTP 404. סיבות אחרות עלולות לגרום לקישור להצביע לתוכן שונה מזה שההקישור הצביע אליו במקור.
סיבות נוספות לקישורים שבורים כוללות:
ארגון מחדש של אתרים שגורם לשינויים בכתובות URL (למשל, domain.net/pine_tree עלול לעבור ל-domain.net/tree/pine)
העברה של תוכן שהיה חינמי בעבר אל מאחורי חומת תשלום[9]
שינוי בארכיטקטורת השרת שגורם לכך שקוד (למשל PHP) פועל בצורה שונה
תוכן דף דינמי כגון תוצאות חיפוש עשוי להשתנות בהתאם לכוונת מתכנני האתר
מחיקת עמוד היעד ו/או תוכנו
נוכחות של מידע ספציפי למשתמש (כגון שם התחברות) בתוך הקישור
חסימה מכוונת על ידי מסנני תוכן או חומות אש (Firewalls)
אסטרטגיות למניעת קישורים שבורים יכולות להתמקד בהצבת תוכן במקומות שבהם הסבירות שלו לשרוד גבוהה יותר, יצירת קישורים באופן שיקטין את הסיכוי שהם יישברו, נקיטת צעדים לשימור קישורים קיימים או תיקון קישורים שהאובייקטים שלהם הועברו או הוסרו.
יצירת כתובות URL שלא ישתנו עם הזמן היא השיטה הבסיסית למניעת קישורים שבורים. טים ברנרס-לי וחלוצי רשת אחרים קידמו את הרעיון של תכנון מניעתי לצמצום הישברות קישורים.[11]
שימוש במנגנוני ניתוב מחדש כגון HTTP 301 כדי להפנות אוטומטית דפדפנים וסורקים לתוכן שהועבר למקום אחר.
שימוש במערכות ניהול תוכן, שיכולות לעדכן קישורים באופן אוטומטי כאשר תוכן בתוך אותו אתר מועבר למיקום אחר, או להחליף באופן אוטומטי קישורים בכתובות URL קנוניות[20]
זיהוי קישורים שבורים עשוי להתבצע באופן ידני או אוטומטי. שיטות אוטומטיות כוללות תוספות עבור מערכות ניהול תוכן וכן בודקים עצמאיים של קישורים שבורים כמו למשל Link Sleuth של Xenu. ייתכן שבדיקה אוטומטית לא תזהה קישורים שמחזירים soft 404 או קישורים שמחזירים 200 OK[22] אך מצביעים על תוכן שהשתנה בפועל.[23]
Markwell, John; Brooks, David W. (2002). "Broken Links: The Ephemeral Nature of Educational WWW Hyperlinks". Journal of Science Education and Technology. 11 (2): 105–108. doi:10.1023/A:1014627511641. S2CID60802264. (באנגלית)