ספאמדקסינג

ב-World Wide Web, ספאמדקסינג (ידוע גם כספאם במנועי חיפוש, באנגלית: Spamdexing) מתייחס לשימוש בטכניקות מפוקפקות או לא חוקיות, המיועדות לשפר דירוג אתרים בתוצאות מנועי חיפוש. המונח, הלחם של המילים ספאם ואינדקס, נטבע לראשונה בשנת 1996 על ידי אריק קונווי, ובמהרה הוכר כאחד מהאתגרים המרכזיים בתעשיית מנועי החיפוש.[1] ספאמדקסינג מתייחס לכל פעולה אנושית מכוונת שאמורה לעורר תוצאות שאינן רצויות או רלוונטיות לדפי אינטרנט בהתחשב בערך האמיתי של הדפים.

ספאמדקסינג מיועד לגרום לדפי אינטרנט מסוימים להיות מדורגים גבוה יותר מכפי שהם אמורים להיות מדורגים, עקב תוכן רדוד, לא מלא או לא ראוי. הדבר מביא לירידה באיכות תוצאות החיפוש, כיוון שאתרים לגיטימיים מדורגים בתוצאות נמוכות יותר מאלה שהיו מופיעים בהן לולא הספאם. הספאמדקסינג מחליש את אמון המשתמשים באותם מנועים. אתרי ספאם משמשים כאמצעי להפצה של תוכנות זדוניות, תכנים פורנוגרפיים ופישינג. לעיתים, ספאמדקסינג מיועד לזרוע הרס בזדון, כמו במקרה של האקר הפורץ לרשתות מאובטחות על מנת לשנות, להרוס או לגנוב נתונים, ולגרום למשתמש ברשתות ובמנועי החיפוש להרגיש בלתי בטוח.[2]

תופעת הספאמדקסינג מאלצת את חברות מנועי החיפוש להוציא כסף רב ומשאבים על פתרונות למיגורה. כל חברות מנועי החיפוש הגדולות, מחשיבות כריית מידע נגדית כבעלת חשיבות עליונה עקב האפקט השלילי הנגרם באמצעות ספאם. זהו גם אתגר חדש בתחום המחקר. כדי להתגבר על הפעילות הגוברת של ספאמדקסינג, נערכים מחקרים רבים בעולם על מנת לקטלג ולסווג את סוגי הספאמדקסינג השונים, לגלות את דרך פעולתם ומתוך כך ללמוד כיצד להתמודד עם התופעה. הספאמדקסינג מתבצע גם בעזרת עשרות אלפי דפי רשת שמטרתם למשוך גולשים לפרסומות, שמציפים את האינטרנט ומתרבים ללא הפסק. חוקרים של מיקרוסופט טוענים כי איתרו את החברות העומדות מאחורי סוג זה של ספאם ואת הטכניקות שלהן. במחקר שפורסם על ידי החוקרים נאמר כי דפי הרשת הללו נוצרים על ידי קבוצה קטנה ומפוקפקת הפועלת באישור כמה מפרסמים גדולים, חברות אירוח אתרים ואיגודי מפרסמים. ממצא זה מעיד על כך שישנה אפשרות למיגור התופעה.

חשיבותם של מנועי החיפוש ושגשוג תעשיית הספאמדקסינג

[עריכת קוד מקור | עריכה]

כיום, ממלאים מנועי החיפוש תפקיד מרכזי בעולמם של הגולשים ברשת האינטרנט. בעוד שבעבר היו הגולשים שומרים סימניות במחשב של כתובות האתרים בהם הם נהגו להשתמש, כיום מסתמכים רוב הגולשים על הקלקת שם האתר או התוכן המבוקש במנועי חיפוש כמו גוגל, יאהו, בינג ואחרים. כתוצאה מכך, אתרי אינטרנט מסחריים תלויים כיום יותר מאי פעם במיקום בו הם יוצבו בתוצאות החיפוש. מיקום גבוה במנוע החיפוש הוא אחד התורמים העיקריים והחשובים להצלחתו של אתר אינטרנט מסחרי. מסיבות אלה, קמה תעשייה חדשה של קידום אתרים במנועי חיפוש. מטרתה של תעשייה זו היא לגרום לאתרים מסחריים להשיג תוצאות גבוהות במנועי החיפוש, על ידי אופטימיזציה והתאמה של האתר לדרישות מנוע החיפוש שנבחר. חלק משיטות האופטימיזציה הללו כוללות מניפולציה מכוונת של האינדקסים במנועי חיפוש, כלומר טעינת דפים של האתר באמצעות מגוון רחב של שאילתות פופולריות, בין אם הן רלוונטיות לאתר, אם לאו. תופעה זו קלה לאיתור מבחינת מנועי החיפוש אולם במהרה השתכללו השיטות. כיום רוב שיטות האופטימיזציה מתוכנתות באופן בלעדי על מנת להטעות את מנועי החיפוש, כשמטרתם לכוון את התנועה לעבר האתר, ולכן מנועי החיפוש מתייחסים אליהם כספאמדקסינג.[3]

תעשיית הספאמדקסינג מגלגלת מאות מיליוני דולרים בשנה ומרוויחים ממנה מפרסמים וחברות המשתמשות בשירותי קידום האתרים, לעיתים מבלי לדעת כי הם משתמשים בתוכנות ובשיטות שאינן חוקיות. מחקר מ-2015 העלה כי ישראל שולטת בשוק התוכנות שמשתילות פרסומות במחשב באמצעות מנוע החיפוש של גוגל.[4]

כמו בכל תעשייה, גם תעשיית האינטרנט ובתוכם מנועי החיפוש, חשופים להונאות מצד גורמים שונים שמטרתם היא ליצור רווחים קלים. מכיוון שלחברות מנועי החיפוש יש רצון לשמור על המשתמשים בשירותיהם ולשמר את חוויית החיפוש כחיובית ונעימה ובנוסף, לא להפסיד משתמשים וכתוצאה מכך כסף רב, הן משקיעות רבות על מנת למגר תופעות אלה. דפים או אתרים הנחשדים כלא חוקיים, נפסלים על ידי מנועי החיפוש ומורדים מהרשת. אתר שכזה לא ייכנס לאינדקס ויוטל עליו חרם, אך ניתן לעקוף הורדה זו על ידי רישום בדומיין או ספק אחר.

סוגי ספאמדקסינג

[עריכת קוד מקור | עריכה]

ישנם מספר סוגי ספאמדקסינג.[5]

ספאם תוכן מבוסס על התכנים בדפים, ועל מילים ספציפיות והוא העיקרי והמתפשט ביותר מבין הספאם ברשת. הוא מתפשט כל כך עקב העובדה כי מנועי חיפוש משתמשים באינפורמציה מאוחזרת ובמודלים המבוססים על התכנים בדפים. ספאמרים מנתחים את החולשות שבמודלים אלה ומנצלים אותם לשימושם.

סוגים של ספאם תוכן

  • ספאם בכותרת (Title spamming) – מכיוון שהכותרת מאוד חשובה בדפים ובאתרים, ספאמרים משקיעים מאמץ רב להשתמש בכותרות על מנת לקדם את הדפים שלהם.
  • ספאם בגוף הדף (Body Spamming) – זו השיטה השכיחה ביותר של ספאם תוכן מכיוון שהיא זולה ומאפשרת ליישם אסטרטגיות מגוונות. אם מדובר בשאילתא, דוחסים בגוף הדף כמה שיותר מונחים שיכולים להופיע באותה שאילתא. אם המטרה היא לכסות כמה שיותר שאילתות, האסטרטגיה תהיה להשתמש בכמה שיותר מילים רנדומליות בגוף הדף.
  • ספאם בתגי מטא (Meta-Tags Spamming) – מכיוון שלתגי מטא יש תפקיד ספציפי בתיאור המסמך, מנועי החיפוש מנתחים אותם בזהירות. הפאמרים פורצים לקטלוגים בהם נמצאים תגי המטא וכך מתאפשר להם לקטלג את הדפים שלהם באופן שיביא תוצאות גבוהות במנועי החיפוש.
  • ספאם בקישור (Anchor Text Spamming) – יצירת קישורים לדפים שאינם לתוצאה הרצויה.
  • ספאם בכתובת (URL Spamming) – יצירת כתובות URL לדפים שבהם מילים שאמורות להיות מוזכרות בתוך סט של שאילתות שמיועדות ליעד ספציפי.

ספאם מבוסס קישורים

[עריכת קוד מקור | עריכה]

מניפולציה זו מבוססת על חוות קישורים וקבוצות המקושרות בדפי ספאם, כשהמטרה היא לדחוף דירוג של מספר קטן של דפים המהווים מטרה בתוך החווה. סוג זה מופיע בשתי צורות:

[עריכת קוד מקור | עריכה]

זו השיטה הפשוטה והזולה, מפני שיש לספאמרים גישה ישירה לדפים ובאפשרותם לשנות בתוכו דברים. כמו כן, הם יכולים להעתיק את קטלוג הרשת כולו וליצור במהרה סט נרחב של קישורים מורשים, המאפשרים צבירה של תוצאות רלוונטיות. סוג זה של ספאם מכוון ברובו לאלגוריתם של (HITS (Hyperlink-Induced Topic Search כשהמטרה היא להשיג תוצאות גבוהות מה hub.

[עריכת קוד מקור | עריכה]

במקרה זה, ספאמרים מנסים להעלות את תוצאת דירוג האתר או בפשטות דוחפים כמות גבוהה של קישורים נכנסים. ישנם שני אופנים בהם ניתן לעשות זאת:

באמצעות ״דף עצמי״ (Own Page): במקרה זה לספאמרים יש שליטה ישירה על כל הדפים ויכולת להיות גמישים מאוד באסטרטגיה שלהם. הוא יכול ליצור חוות קישורים ובזהירות לכוון את הטופולוגיה שלהם על מנת להבטיח את הערכים הרצויים והמיטביים.

באמצעות ״דפים נגישים״ (Accessible Pages): אלה הם דפים אותם ספאמרים יכולים לשנות אך הם אינם שייכים להם. זה יכולים להיות בלוג עם אפשרות לתגובות הציבור, קבוצת דיון ציבורית, אתרים אותם הציבור יכול לעדכן ועוד. הספאמרים מנצלים את ההזדמנות להכניס שינויים בדפים החיצוניים על ידי יצירת קישורים לדפים שלהם.

הסוואה וניתוב מחדש (Cloaking and Redirection)

[עריכת קוד מקור | עריכה]

הסוואה היא הדרך לספק מספר וריאציות של סריקת דפים המבוססים על המידע שבבקשה. כשמשתמשים בזה למטרה טובה זה אפילו עוזר לחברות מנועי החיפוש. אולם בשימוש ספאמרים, ההסוואה מקבלת צורה של אלימות רשתית. במקרה שכזה, בעלי אתרים יריבים משתמשים בהעתקים שונים של הדף בסריקה ובמשתמש בעל המטרה, על מנת להטעות את מחפש.

הונאת קליקים (Click Spam)

[עריכת קוד מקור | עריכה]

מכיוון שמנועי חיפוש משתמשים בנתוני רצף הקלקות כפידבק לכיוון פונקציות דירוג, ספאמרים נחושים לחולל הקלקות במרמה מתוך כוונה להטות את הפונקציות הללו לכיוון האתרים שלהם. כדי להשיג את המטרה הזו, הספאמרים מגישים שאילתות למנועי החיפוש ואז מקליקים על קישורים המצביעים על הדפים אליהם הם מכוונים.

SEO הוא התהליך המשפר את הנראות של האתר או של דף האינטרנט בתוצאות מנועי החיפוש (SERP). הוא מנתח את שיטת העבודה של דירוג האלגוריתמים במנועי חיפוש תוך התמקדות בפרופיל של המשתמש- מה הוא מחפש, אילו סוגי משתמשים מחפשים אילו סוגי אינפורמציה, וכן סיווג קהל יעד למנועי חיפוש ספציפיים. זוהי משימת מניפולציה של תוכן וקישורים של האתרים ולמעשה התהליך שבו מאושרת הנראות של אתר או דף אינטרנט בתוצאות מנועי חיפוש. הטכניקה שלה יכולה להיות מסווגת לתוך שתי קטגוריות עיקריות: white hat SEO, black hat SEO .

בהקשר של spamdexing, black hat SEO נותן דירוג גבוה יותר ונראות גבוהה יותר לאתר בתוצאות מנועי החיפוש מאשר האתר ראוי לו.[6]

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ E. Convey, Porn sneaks way back on Web, The Boston Herald, May 22, 1996
  2. ^ Moore, Robert ,2005, Cybercrime: Investigating High Technology Computer Crime, Matthew Bender & Company. p. 258. ISBN 1-59345-303-5.
  3. ^ D.Fetterly, M.Manasse, M.Najork, 2004, Spam, Damn Spam, and Statistics, Using statistical analysis to locate spam web pages
  4. ^ אסף גלעד, גוגל מכריזה מלחמה על מפיצי פרסומות מישראל, באתר כלכליסט, 18 במאי 2015
  5. ^ 2012, Nikita spirim, Jiawei Ham, Survey on Web Spam Detection: Principles and Algorithms, SIGKDD Explorations Volume 13, Issue 2
  6. ^ S.K. Jayanthi and S. Sasikala, 2016, NLSDF Boosting The Recital of Web Spamdexing, ICTACT Journal on Soft Computing, Volume 7, pp 1324-1331