ניתוח קוד סטטי

במדעי המחשב, ניתוח קוד סטטי (באנגלית: Static program analysis) הוא תהליך אוטומטי לבחינת התנהגות תוכנה ללא הרצתה, וזאת בניגוד לניתוח קוד דינמי, אשר מחייב את הרצת התוכנה לצורך בחינת התנהגותה. ניתוח קוד סטטי מוצא ומעדכן את המנתח אודות שגיאות ודאיות ושגיאות אפשריות אשר עלולות להתרחש בזמן הרצת התוכנה.

שגיאות מאותרות

ניתוח סטטי מחפש למעשה שגיאות מכניות כדוגמת השגיאות הבאות:

זליגת משאבי זיכרון ומערכת הפעלה.
סיכוני אבטחת מידע כמו קלט לא תקין או דריסת זיכרון.
מרוץ תהליכים.
שגיאת זיכרון כמו אי אתחול נתונים.
המצאות משתנים ללא שימוש בקוד המקור.
חריגה על כל מיניה, כדוג' חריגה אריתמטית.
הפרת עיקרון הכימוס כמו קריאה לשדה או שגרה פרטיים.
אי עמידה בסטנדרטים של כתיבת קוד כגון MISRA C.
שימוש במצביע האפס^[1].
שימוש במשתנים בלתי מאותחלים.

יתרונות

אוטומטי.
מוצא שגיאות באופן מהיר, זול ובשלבים המאד מוקדמים של פיתוח תוכנה.
מבטיח מציאת שגיאות בעלות תבניות מסוימות.
מבודד שגיאות ולא מציג רק סימפטומים כדוגמת קריסת תוכנית.
מציג את הנתיב המלא בקוד המקור שמוביל ליצירת הבעיה הספציפית גפי שתקרה בהקשר של הנתיב הספציפי^[2]

חסרונות

מצריך גישה לקובצי קוד המקור.
מכסה שגיאות באופן חלקי; רק בעלות תבנית שהוגדרה מראש.
לא מוצא שגיאות הקשורות לזמן ריצה.
False Positives (אזהרה אודות שגיאות אשר לא קיימות בפועל) עלולים להוות מטרד עבור המפתח ולעלות לו בזמן בדיקת נכונות האזהרה.
False Negative (אי מציאת שגיאות שברור שקיימות בפועל, ואמורות, להמצא על ידי הכלי שבשימוש בהתאם לאלגוריתמי החיפוש שבנויים לתוכו), דבר אשר יכול לגרום לביטחון מוטעה בתקינות הקוד שנבדק^[3]

שיטות מימוש

קיימות מספר שיטות למימוש הניתוח הסטטי של הקוד:

ניתוח Control Flow ו-Data Flow – איסוף מידע אודות מקבץ הערכים האפשריים של משתנים בעקבות סדר ריצת הקוד.
ניתוח מבוסס התניה – הגדרת התניות לישויות קוד ופתרון מתמטי של ההתניות.
מערכת טיפוסים – ווידוא (אי) קיום של התנהגות שגויה בהתאם לטיפוס המשתנה (למשל פעולת החילוק אשר איננה אפשרית בין שני משתני מערך).
פרשנות מופשטת – אינטרפרטציית התוכנה מעל דומיין מופשט.
אימות מודל - רק בהינתן מספר מצבים סופי.
שימוש ב"הערות הסבר" (Annotations) - מאפשר למפתח להצהיר על ציפיותיו בנוגע לקלט, ומקל על כלי הניתוח הסטטי במהלך הניתוח. לדוגמה השימוש ב- @NotNull ו-@Nullable בדוגמת הקוד הבאה:

private void DoSomething(@Nullable string firstName, @NotNull string lastName)
{
   if (firstName.substring(0,1).equals(“a”))
   {
     PrintStartsWithA();
   }
}

מדדי סיבוכיות

ניתוח סיבוכיות הוא פן חשוב בתהליך ניתוח קוד סטטי, וזאת לצורכי הבטחת איכות תוכנה. מדדי הסיבוכיות בוחנים את מבנה התוכנה, אורכה, וממשקיה. בין קבוצות המדדים המוכרות כיום בעולם התוכנה, ניתן למצוא את מדדי McCabe ומדדי Halstead. מדדי הסיבוכיות מתחלקים לשתי קטגוריות:

מדדי ארכיטקטורה - מבוססים על עיצוב התוכנה, ובוחנים מודולריות של קוד, שימוש במבני נתונים וכדומה.
מדדים טקסטואליים - נמדדים על מרכיבי קוד יחידניים, ובוחנים מאפיינים ופונקציות בקוד.

כמו כן, יש להבחין בין מדדים לתוכניות שעוצבו בתכנות מונחה-עצמים) לעומת מדדים לתוכניות פרוצדורליות (procedural programming). מדדים לתוכניות שעוצבו באובייקטים בוחנים מאפייני תוכנית כמו כימוס (Encapsulation), פולימורפיזם (Polymorphism), ירושה (Inheritance), אבסטרקציה (Abstraction) ועוד.

להלן מדדי סיבוכיות לדוגמה:

מורכבות ציקלומטית (Cyclomatic Complexity) - מודד את כמות הלוגיקה שבמתודה, פונקציה או רכיב תוכנה אחר. על ידי מניית מספר הנתיבים הליניאריים בקוד המקור של התוכנית. המורכבות הציקלומטית מחושבת בעזרת בקרת הזרימה (ה-Control flow) של התוכנית. ערך גבוה מעיד על מורכבות גבוהה אשר מהווה סיכון בהבנה ובבדיקות התוכנה.
מספר שורות קוד (LOC) - אינדיקציה לאורך התוכנית מבוססת על מספר שורות קוד המקור המרכיבות את התוכנית.
מספר מתודות למחלקה (WMC) - מניית מספר המתודות שמומשו במחלקה. מדד זה מאפשר לחזות את המאמץ שיידרש במקרה של שינוי המחלקה.

כלי ניתוח סטטי

קיימים בשוק כלים רבים המאפשרים הרצה אוטומטית של ניתוח סטטי על קטעי קוד נרחבים בשפות השונות והמגוונות. דוגמה לכלי הוא FindBugs שפותח באוניברסיטת מרילנד לצורך ביצוע ניתוח קוד סטטי בתוכנות מבוססות ג'אווה. בנוסף ליכולות הניתוח הסטטי שצוינו לעיל, ניתן למצוא כלים המעניקים גם אפשרויות ויזואליזציה של מדדי איכות שונים של הקוד. דוגמה לכלי ויזואליזציה הוא SolidSX^[4]. כלים נוספים הם תוכנות דוגמת LDRA Testbed, SonarQube וקלוקוורק.

ראו גם

קישורים חיצוניים

http://www.mccabe.com/iq_research_metrics.htm

הערות שוליים

^ CWE-476: NULL Pointer Dereference
^ Parasoft, Using Flow Analysis
^ KirstenS, Nick Bloor, Sarah Baso, James Bowie, Ram ch, EvgeniyRyzhkov, Iberiam, Ann.campbell, Ejohn20, Jonathan Marcil, Christina Schelin, Jie Wang, Fabian, Achim, Dirk Wetter, kingthorin, Static Code Analysis, OWASP, ‏November 2020
^ לצפייה בסרטון הדגמה, לחצו כאן

[1] CWE-476: NULL Pointer Dereference

[2] Parasoft, Using Flow Analysis

[3] KirstenS, Nick Bloor, Sarah Baso, James Bowie, Ram ch, EvgeniyRyzhkov, Iberiam, Ann.campbell, Ejohn20, Jonathan Marcil, Christina Schelin, Jie Wang, Fabian, Achim, Dirk Wetter, kingthorin, Static Code Analysis, OWASP, ‏November 2020

[4] לצפייה בסרטון הדגמה, לחצו כאן

[1]

[2]

[3]

[4]