נתחיל מהסוף: אפשר ללמוד ניתוח נתונים לבד ואפשר להתקבל למשרה ראשונה על סמך הידע הזה. אני עשיתי את זה וכך גם הרבה אנליסטים איתם עבדתי. זה לא אומר שכשתסיימו ללמוד תדעו כל מה שצריך כדי לנתח נתונים. זה כן אומר שיהיו לכם את כל הכלים בשביל להיכנס למשרה ראשונה בהצלחה, ליישם את מה שלמדתם ולהמשיך ללמוד שם.
למי מתאים ללמוד לבד ולמי לא?
אני באסכולה שאומרת שאין דבר שאי אפשר ללמוד לבד. היופי בתקופה בה אנחנו חיים הוא שכל הידע מונגש בצורה מצויינת בכמעט כל תחום. אם יש לכם משמעת עצמית וחיבור לאינטרנט, אפשר ללמוד ניתוח נתונים לבד ובחינם.
מצד שני, אני מבין שרוב האנשים בעולם צריכים מסגרת מסודרת, לוח זמנים ברור ומורה בכיתה שיגרום להם להתמיד. כדי לללמוד לבד תחום כל כך רחב, שכולל גם שפות תכנות, גם כלים טכניים כמו אקסל או Tableau וגם לוגיקה עסקית, צריך יכולת למידה, משמעת עצמית והתמדה. אנשים שמאמינים שיהיה להם קשה לעשות את זה בכוחות עצמם יכולים לבחור לעשות קורס ניתוח נתונים באחת מהמכללות הרבות שמציעות הכשרה כדאטה אנליסט. שתי הדרכים יעבדו בהנחה ויש לכם את הרקע המתאים וכוח הרצון.
כמה זמן זה אמור לקחת?
לשאלה זו אין תשובה חד משמעית. זה תלוי בכמה מהר אתם לומדים, כמה שעות ביום יש לכם להשקיע ובעומק אליו תרצו להגיע בכל תחום. אחד היתרונות בקורס הסבה או הכשרה 'מסודר' הוא שבין אם הגעתם לעומק וההבנה אליהם אתם שואפים ובין אם לא, ברגע שהמדריך יסיים את הפרק, הוא יעבור לפרק הבא. כמובן שזה גם החיסרון שבקורס הסבה 'מסודר' כי הוא לא מאפשר תמיד לחומר לשקוע עד הסוף.
מניסיוני למידה עצמית שכוללת את התוכן המוצע בתוכנית למטה יארוך כחצי שנה. זאת בהתאם לחישוב של 2-3 שעות ביום, 5 ימים בשבוע. כלומר בין 240 ל360 שעות למידה. אם כבר יש לכם רקע חלקי, כלומר, אתם יודעים SQL או שאתם תותחי אקסל, אפשר להחסיר את פרק הזמן בהתאם לתוכנית הלימודים שאציע בהמשך.
ההצעה של לימודים לאורך חצי שנה היא הצעה בלבד. תוכלו ליישם אותה איך שתראו לנכון. אם אתם בשלב בחיים בו מתאים לכם ללמוד מבוקר עד ערב במסגרת בוטקאמפ עצמאי, אתם מוזמנים לעשות זאת ולסיים את ההכשרה גם תוך חודשיים-שלושה.
כמה זה אמור לעלות?
התוכנית המוצעת כאן, מהווה מעין קורס דאטה אנליסט חינם. בפועל, אני ממליץ בחום לשלם על קורסי הכשרה אונליין על מנת לקבל תוכן ברמה גבוהה, סביבת עבודה וירטואלית (בענן) ובסיסי נתונים רלוונטיים ומעניינים. דוגמא לכך הוא בקורסים של LearnSQL. עוד על כך בחלק העוסק בSQL. ישנן אופציות חינמיות לחלוטין ללמוד כל דבר, מsql ועד עבודה עם אקסל ותוכנות bi. בפועל, השקעה כספית מצומצמת בהכשרה מקצועית אונליין, תסייע לכם להימנע מתסכולים מיותרים (כמו הקמת סביבת עבודה והורדת בסיסי נתונים) ותגביר את הסיכויים שלכם להצליח לסיים את ההכשרה.
מטרה סופית
תהליך הלמידה צריך מצד אחד להכשיר אתכם בצורה הטובה ביותר להתמודד עם בעיה אנליטית בעזרת כלים אנליטיים ומצד שני לאפשר לכם להציג את ההתמודדות הזאת לטובת מעסיקים פטנציאליים. הדרך הטובה ביותר שעומדת לרשותכם הוא יצירת פרויקט. פרויקט טוב יאפשר לכם להתמודד עם בעיה אנליטית ולהציג אותה בצורה ויזואלית. התמקדות ביצירת פרויקט גם יהפוך את הלמידה שלכם למשמעותית יותר על בסיס מודל Project Based Learning.
ישנה מגמה בקרב ג'וניורים שמחפשים משרה ראשונה, ליצור בידול מול מועמדים אחרים על ידי יצירת 'תיק עבודות'. הטענה היא שמגייסות או מנהלות פוטנציאליות יכנסו לתיק העבודות שלכם, יתרשמו ויציעו לכם משרה. אני מציע הערכה קצת יותר שמרנית. מטרת הפרויקט (בניגוד לתיק עבודות המכיל מספר פרויקטים) היא שיהיה לכם על מה לדבר בראיון העבודה.
אחת השאלות הקשות בראיונות בתור אנליסט ללא ניסיון היא השאלה 'האם יש לך ניסיון כלשהו בניתוח נתונים?'. ברור למראיין שלא עבדתם בתחום בצורה מסודרת כי הוא מודע לעובדה שהוא מגייס ג'וניור ללא ניסיון. הוא מצפה מכם לספר על ניסיון כלשהו. אם יש לכם פרויקט מסודר, מקצועי, ברמה הגבוהה ביותר מבחינה ויזואלית, אז השאלה הזאת רק מהווה הרמה להנחתה.
השקעה ב'תיק עבודות' המכיל מספר פרויקטים, מיותרת מתוך הנחה שמגייסות או מנהלות פוטנציאליות לא ישקיעו יותר מדקה ברפרוף קל בו. בראיון עצמו, אף מעסיק לא ישתכנע שיש לכם ניסיון אם תחזיקו בתיק עבודות ענק. כל מה שיש לכם לעשות הוא להשקיע בפרויקט אחד איכותי ולקוות שהמעסיק הפוטנציאלי יתרשם מספיק מהידע והיכולות שצברתם כדי לתת לכם הזדמנות.
תוכנית הלימודים
לאחר שהגדרנו את המטרה – למידה לצורך בניית פרויקט דאטה איכותי שישקף את היכולות שלכם, נשאלת השאלה איזה יכולות אתם נדרשים להציג וכמה זמן יקח לכם להשיג אותם. אני מציע ללכת על התוכנית שתפורט כאן, שמהווה גרסא רזה של קורסי ההכשרה שמציעות המכללות. זה לא כי אני חושב שהתוכן הנוסף לא חשוב אלא כי אני מאמין שכשלומדים לבד קל להתפזר ולכן חשוב להתמקד בנושאים בעלי המשקל הגדול יותר לעבודת היום יום של אנליסט.
הטבלה מציגה את הנושאים הכלליים שצריך להכיר אנליסט ואת פרק הזמן המוערך ללמידה של כל תחום. פירוט נרחב של תכני הלימוד ולינקים למקורות ניתן למצוא במאמר 'מה לומדים לקראת משרת דאטה אנליסט ראשונה'.
נושא | זמן |
SQL | כ-6 שבועות |
אקסל או Google Sheets | 3-4 שבועות |
Tableau או Power BI | 4-6 שבועות |
Python לניתוח נתונים | כחודשיים |
שלב א' – ללמוד את הבסיס של SQL
SQL מהווה הכלי החשוב והבסיסי ביותר של כל אנליסט דאטה. לכן חשוב להתחיל בו ולהשתדל לשלב אותו בכל השלבים הבאים כמה שאפשר. העבודה היומיומית של דאטה אנליסט לרוב תכלול הרבה שימוש בSQL ובהתאמה, גם מבחני הכניסה לתפקידי דאטה רבים יעסקו בהיכרות ופתרון בעיות בSQL.
הדרך הפשוטה והטובה ביותר שאני מצאתי ללמוד SQL וכן לוודא בקיאות בשפה היא הקורסים המקוונים של LearnSQL. האתר מאפשר למידה מהבסיס ועד רמה מתקדמת בעזרת תוכן מקצועי וללא צורך בהקמת סביבות עבודה או הורדת בסיסי נתונים. הקורסים בתשלום, אך לג׳וניור אנליסט מדובר בהשקעה נמוכה יחסית ששווה כל שקל וכנראה תחזיר את עצמה תוך זמן קצר מאוד לאחר קבלה לעבודה הראשונה.
שלב ב' – לתרגל SQL בצורה חופשית
אין צורך לסיים את שלב א' לפני שניגשים לשלב ב'. יותר מכך, אתם תרוויחו המון אם תתרגלו מייד כל קונספט חדש שלמדתם בקורס של LearnSQL, בעצמכם על דאטה סט אותו תבחרו.
בחירת דאטה סט רלוונטי
מאחר ואמרנו שאנחנו רוצים לשים את הפרויקט הסופי בראש כמה שיותר מוקדם, בשלב הזה תצטרכו לבחור קובץ שמכיל דאטה אותו תרצו לנתח. חשוב לבחור דאטה בתחום אליו אתם מתחברים אבל אין צורך להתעכב על הבחירה יותר מידי. תמיד תוכלו להחליף. אופציה קלה היא לבחור בדאטה סט של IMDB שמכיל דאטה על סרטים במספר טבלאות. חשוב לבחור דאטה סט שמכיל כמה טבלאות שקשורות זו לזו ולא קובץ CSV בודד מאחר ותרצו לתרגל גם קישור בין טבלאות שונות.
הורידו תוכנה לשליפה וניהול של בסיסי נתונים
אחת התוכנות בשימוש הנפוץ ביותר היא Microsoft SQL Server Studio (SSMS). התוכנה היא חינמית ויחסית קלה להתקנה. אם אתם נתקלים עם קשיים רצוי להשתמש בכלים החשובים ביותר שעומדים לרשותכם: יוטיוב וגוגל 🙂 . גם בעבודה שלכם בתור אנליסטים אתם הולכים להשתמש בהם הרבה.
שאלו את הדאטה שאלות ותוציאו ממנו את התשובות
שווה לחשוב כבר בתחילת הדרך אילו תובנות מעניינות ניתן להוציא מהדאטה. אם נישאר בדוגמא של IMDB, שאלות אפשריות יכולות להיות: מה הסרטים הכי נצפים בכל הזמנים? מי השחקן הכי עסוק בתעשיית הקולנוע? האם האורך הממוצע של סרטים השתנה לאורך השנים?
אין סוף לכמות השאלות שאפשר לחקור בכל דאטה סט. כמות הדאטה סטים היא אינסופית וקיימת כמעט בכל תחום. אני לא ממליץ להוריד דאטה סטים בשפה העברית למתחילים אבל רק לשם היכרות, גם הממשלה שלנו מנגישה דאטה בתחומים שונים ששווה לנסות ונתח.
ממליץ לכם לעבור על רשימת הנושאים ללמידה בSQL ולוודא שאתם מכסים לאט לאט כל אחד מהם. סדר הנושאים דומה לקורס SQL של LearnSQL עליו המלצתי כבר, כמו גם לקורסים אחרים.
שלב ג' – התנסו באקסל
בניגוד לקורס SQL עליו המלצתי בחלק א', אני מאמין שלא חובה לעשות קורס שלם באקסל לפני שמתחילים לעבוד. כדי לתרגל אקסל כל מה שתצטרכו זה רשימת נושאים ללמוד באקסל ודאטה סט רלוונטי. אם תרצו לתרגל עד הסוף את עבודת האנליסט, השתמשו בSQL על מנת לשלוף נתונים מהדאטה בייס אותו הורדתם, יצאו אותו לאקסל ותתחילו לתרגל.
מניסיוני, קורסי אקסל נוטים להיות מאוד מפורטים ולגעת בנושאים שלרוב לא זוכרים אחרי שלומדים אותם פעם אחת. היצמדו לרשימת הנושאים המינימלית במאמר ותרגלו אותם אחד אחרי השני. מומלץ לנסות לענות על השאלות אותן שאלתם בסעיף הקודם ולנסות ליצור להם ויזואליזציות בעזרת גרפים שונים. השתדלו להימנע מהטיות וקראו קצת על איך לבחור גרף נכון למטרה הנכונה.
שלב ד' – למדו ויזואליזציה ובנו דשבורד
זוכרים את הדאטה סט אותו הורדתם בשלב ב'? את הניתוח שביצעתם בשלב ג'? זה הזמן ליצור ויזואליזציה שתשקף את היכולות שלכם בויזואליזציה לצד החשיבה האנליטית שלכם. בשלב הזה חשוב (מאוד) להקפיד על נראות והצגה יפה אך אל תסתפקו בזה. ניתוח איכותי יכול להציג גם חשיבה לוגית קוהרנטית. השתמשו בגרפים נכונים. אל תציגו ממוצע או סכום אלא אם הם משרתים מטרה ברורה. השקיעו בפרטים הקטנים. צרו דשבורד מושך ויזואלית כדי להרשים את הצופה. ניתן למצוא דוגמאות מוצלחות לויזואליזציות בTableau Public.
מקורות ללימוד Tableau ניתן למצוא במאמר 'מה ללמוד'.
שלב ה' – למדו ניתוח נתונים בעזרת פייתון (אופציונלי)
פייתון הוא כלי חזק לניתוח נתונים. הפונקציונליות שלו מאפשרת לייבא נתונים מכל סוג, לנקות דאטה בצורה קלה, לחבר בין טבלאות, ליצור גרפים, ועוד ועוד. בגדול, עם פייתון אפשר לעשות כמעט כל מה שאפשר לעשות באקסל או בטבלו. אך האם זה קריטי לדעת פייתון בשביל להתקבל למשרה ראשונה?
ההחלטה האם להשקיע זמן ומאמץ בללמוד פייתון, כלי מורכב יותר ללמידה מSQL או מתוכנות כמו אקסל או Tableau, תלויה עוצמת 'האיתות' שלכם למעסיק. למי שלא מכיר, 'איתות' הוא מונח שמתאר את היכולת של אדם להראות בפני מעסיקים את הפוטנציאל שלו כעובד. אם עשיתם תואר במתמטיקה יש לכם איתות חזק יותר מאדם שעשה תואר במדעי הרוח. אם שירתתם ב8200, יש לכם איתות חזק יותר מאדם ששירת בנח"ל.
יכול מאוד להיות שאם אתם לומדים ניתוח נתונים בעצמכם זה בגלל שחסר לכם רקע רלוונטי נוסף כמו תואר בתעשייה וניהול או שירות כדאטה אנליסט ב8200. אם זה המצב, שקלו בחום ללמוד Python כדי לאותת על הפוטנציאל שלכם בצורה חזקה יותר.
העצה שלי? תשאירו את לימודי הפייתון לסוף התהליך ותלכו על זה אם אתם מרגישים שאתם צריכים Edge נוסף בתהליך הקבלה לעבודה.
האם בוודאות אמצא עבודה בסוף?
כדי לענות על השאלה האם סביר שתמצאו עבודה אחרי שתלמדו את כל התכנים שפורטו למעלה אתם צריכים לשאול את עצמכם את השאלות הבאות: האם יש לי רקע רלוונטי כמו תואר כמותי כלשהו או ניסיון בתחום ניתוח נתונים? האם יש לי תכונות אופי שנדרשות מאנליסט? האם אני אוהב ללמוד ולפתור בעיות? אם התשובות שלכם חיוביות על חלק מהשאלות, סביר שעם הכלים הנכונים תוכלו למצוא עבודה ראשונה בתחום.
אני בטוח שלחלק מהשאלות אין לכם תשובות עדיין. במקרה זה העצה שלי היא פשוט להתחיל ללמוד ולגלות בעצמכם.