מה לומדים לקראת משרת דאטה אנליסט ראשונה?

תוכן עניינים

לפני כמה שנים, קצת לפני סבב חיפושי עבודה, רציתי להימנע מסיטואציה בה אתקל בנושא שאני לא מכיר בראיון עבודה או מבחן בית. עשיתי מה שאני תמיד עושה כשאני מנסה לפתור בעיה מורכבת – חקרתי את הנושא ברחבי הרשת וצמצמתי את הממצאים לצ'ק ליסט. המטרה שלי הייתה לעבור נושא אחר נושא ולוודא שאני מכיר אותו בצורה מספיק טובה ובמידת הצורך, לחפש מקור טוב ללמוד ממנו כדי להשלים את הפערים הרלוונטיים.

הוצאתי את הצ'ק ליסט ממעמקי הGoogle Drive, עידכנתי אותו בעקבות פרספקטיבה של אנליסט עם קצת יותר ניסיון ואני מעוניין לחלוק אותו עם העולם. לטובת הנוחות, אירגנתי אותו בטבלה עם הערות וגם הוספתי מקורות שאני סומך עליהם. חשוב לציין שכל המקורות חינמיים. בעוד המאמר הזה מדבר על 'מה ללמוד', ישנו מאמר נפרד שעוסק ב'איך ללמוד ניתוח נתונים?' ממליץ להעיף מבט גם עליו.

דיסקלמיירים

ברור לי שההחלטה על מה צריך או לא צריך להיכנס לרשימה היא מאוד סובייקטיבית. אני יודע שאת הכתבות כאן קוראים אנליסטים מתפקידים שונים ומחברות שונות. אנליסט מוצר יבחר בנושאים אחרים מBusiness Analyst. אנליסט בחברת Saas יתעדף את הרשימה אחרת מאנליסט בחברת גיימינג. זה הגיוני ונורמלי. המטרה היא לא ליצור רשימה שמקיפה הכל. אלא להקיף 95% מהעיקר. אני מאמין שזה יעזור מאוד לג'וניורים להבין מה רוצים מהם מעסיקים ואולי יעזור למעסיקים לקבל מרואיינים שיגיעו אליהם קצת יותר מאופסים לגבי מה הם נדרשים לדעת.

עוד Disclaimer קטן לפני שאתחיל – מטרת הפוסט היא להתמקד ביכולות הטכניות המינימליות לקבלה לעבודה הראשונה. אני מאמין שישנן יכולות נוספות שהן חשובות ביותר. לדוגמא: יכולת אנליטית, יכולת תקשורת, הבנה עסקית והיכרות עם התחום הספציפי בו עוסקת החברה והתפקיד. בדרך כלל, אלה יכולות שקצת מביאים מהבית וקצת לומדים עם הזמן. אלה לאו דווקא דברים שבוגרת תואר בכלכלה יכולה לעבור עליהם לפני שהיא מתחיל להתראיין למשרות. בלי קשר, קצרה היריעה מלעסוק בתחומים אלה במסגרת פוסט אחד. בפוסט זה נישאר עם הטכני.

SQL

בנוסף לרשימת הנושאים שמוצגת בטבלה למטה, חשוב לי להמליץ בחום על הקורסים של חברת LearnSQL. הקורסים בתשלום, אך מדובר בהשקעה שתחזיר את עצמה במהירות לאחר קבלה לעבודה ראשונה. שימוש בLearnSQL יאפשר לכם ללמוד בעזרת תוכן מקצועי ויחסוך לכם יצירה של סביבת עבודה והורדת בסיסי נתונים רלוונטיים. כל הקורסים מתקיימים בסביבת עבודה בענן עם בסיסי נתונים אותם מספק האתר.

למטה רשימת הנושאים אותם בחרתי כהכרחיים ללמידה יחד עם מקורות חינמיים אחרים. כמובן שכל הנושאים הללו ועוד רבים אחרים מכוסים בקורס בתשלום של LearnSQL.

הסברLinkSpecific Functions and StatementsSubject
פונקציונליות בסיסית – איך לשלוף מטבלה. איך לפלטר ולסדר ערכים.Learn SQL in 15 minutes (YouTube)SELECT
FROM
WHERE
ORDER BY
Basic SQL Statements
איך לעשות אגרגציות (קיבוץ) ואיך לסנן על פי ערכים מקובצים.Learn SQL in 15 minutes (YouTube)GROUP BY
(SUM, MAX, COUNT, MIN, AVG)
HAVING
Grouping Statements
איך מחברים שתי טבלאות בDB רלציוני. מה הם ההבדלים בין סוגי החיבורים.SQL Joins Explained
(YouTube)
JOIN
INNER
LEFT
RIGHT
UNION
Joining Tables
מה זה ערך Null ומה הן הטעויות הנפוצות שקשורות לעבודה עם ערכים מסוג NullSQL Mistakes Juniors Make
(DataNoobs)
ISNULL
IS NULL
IS NOT NULL
Null Values
פונקציות שימושיות הקשורות לתאריכים.DateTime functions in
SQL Server
(YouTube)
YEAR
MONTH
Date Functions
פונקציית קייס משמשת להוספת תנאים לשאילתא. דומה לIF בשפות תכנות אחרות. פונקציית קייס בשילוב עם SUM או כל אגרגציה אחרת, להוספת אגרציה רק במידה והערך בשורה עונה על תנאי מוגדר. Case Statement
(YouTube)
SUM CASE statements
(Learn SQL)
CASE
SUM/AVG CASE
Case
Statements
איך יוצרים שאילתא בתוך שאילתא, מה סדר ההרצה ולמה זה משמש.Sub queries
(Ram Kedem)

Sub queries
שימוש בCTE ליצירת שאילתות מודלריות ומסודרות. חשוב במיוחד לשאילתות ארוכותAdvanced SQL Tutorial | CTE (Common Table Expression)
(YouTube)
CTE (WITH)
פונקציות חלון הן נושא שנתפס כקצת יותר מתקדם. ספציפית הזכרתי את הפונקציות השימושיות ביותר שעוזרות לכתוב שאילתא בUse cases יותר נפוצים. לא יזיק ללמוד עוד פונקציות חלון.Window functions in SQL server
(YouTube)
SQL Window Functions
(Mode analytics)
ROW_NUMBER
LAG
LEAD
Window functions
עולה המון בראיונות עבודה ולכן הוא נושא חשוב. בלי קשר לראיונות, חשוב גם בהיבט Performance של השאילתא ופילטור ערכים בסדר הרצוי למשתמש.Order of execution of a
Query
(SQL bolt)
SQL order of Execution
פונקציות לעבודה עם Strings. לטעמי לא בשימוש נפוץ אבל נושא שחשוב מאוד להכיר בעיקר בגלל שהוא מאוד פשוט וכשצריך להשתמש בפונקציות מהסוג, אין לזה תחליף.String Functions
(YouTube)
LTRIM
RTRIM
LEN
UPPER
LOWER
REPLACE
SUBSTRING
String Functions
מיועד בעיקר להשוואת ערכים בתוך הטבלה. לא מאוד נפוץ אבל עולה לא מעט בראיונות עבודה. Self Join
(Ram Kedem)
Self Join

נושאים שלא נכנסו לרשימה ולמה:

  1. Correlated sub queries – נושא מעניין אך לטעמי לא מאוד שימושי. השימוש שלו בא לידי ביטוי כמעט אך ורק בראיונות עבודה שאוהבים להקשות קצת 😉
    לינק למתעניינים (GeeksForGeeks).
  2. פקודות לכתיבת טבלאות – נושא חשוב בפני עצמו אבל מניסיוני האישי וממחקר לא מייצג שערכתי, רוב האנליסטים לא נדרשים לכתיבת טבלאות.
    לינק למתעניינים (מהאתר של רם קדם).
  3. Temp tables – נושא מאוד שימושי במיוחד בSQL server אך בהנחה ויודעים להשתמש בSub queries, זה אמור לענות על מטרות דומות. למעוניינים להרחיב – עוזר מאוד בייעול שאילתות כבדות שרוצים להריץ יותר מפעם אחת.
    לינק למתעניינים (יוטיוב).

אקסל

הסברLinkSpecific Functions Subject
מונחי בסיס הקשורים לSpreadsheets, כפתורים בשימוש תכוף, פונקציות בסיסיות. How To Use Excel
(spreadsheeto)
Basic Excel functionalityBasic Excel
הפונקציות השימושיות ביותר באקסלBasic Excel Formulas and Functions

Excel SUMIFS COUNTIFS & AVERAGEIFS
(YouTube)
Min, Max, Average, Median, Sum, Sumifs, Count, Countifs, IfBasic Functions
פונקציות לעבודה עם Strings Excel String Functions
(datatofish)
Left, Right, Mid, Len, FindString Functions
סידור ופילטור ערכים בטבלאות אקסלHow to Sort and Filter Data in ExcelSort and Filter
עבודה עם תאריכים – המרת מספרים לתאריכים ופונקציות להוצאת חלק מתאריךExcelist
Year, Month, DayDates in Excel
סוגי הגרפים השונים באקסל עם דגש על היסטוגרמה, גרף עמודות ופיזורExcel Charts & Graphs: Learn the Basics
(YouTube)
Histogram, Bar Charts, Scatter plotCharts
טבלת ציר היא כלי חשוב מאוד לניתוח, חישוב ואגרגציה של ערכים בSpreadsheet.Excel Pivot Tables EXPLAINED
(YouTube)
Pivot Tables and Slicers
פונקציות המשמשות לחיפוש ערך בתוך רשימת ערכים והבאתוExcel VLOOKUP: Basics of VLOOKUP and HLOOKUP explained
(YouTube)
Vlookup, Hlookup, Index+matchLook up values

Tableau

הסברLinkSubject
היכרות עם ההתוכנה והממשק, מושגים בסיסיים בטאבלו, יצירת ויזואליזציה בסיסיתצעד אחר צעד לעבודה עם טאבלו Intro to Tableau
איך יוצרים חישובים בטאבלוBasic Calculation (SQLbelle)Tableau Basic Calculations
איך משתמשים בפילטרים על מנת לייצר תצוגה דינמית בהתאם לדרישת המשתמשTableau Filters (SQLbelle)Tableau Filters
חישובים מורכבים בטאבלו (אך בשימוש נפוץ)LOD Expressions (SQLbelle)LOD calculations
יצירת גרפים Charts (SQLbelle)Charts
עבודה עם תאריכים Tableau Dates (SQLbelle)Dates
עבודה עם פרמטרים לטובת יצירת ממשקים דינמייםTableau Paremeters (SQLbelle)Working with Parameters
תהליך יצירת דשבורד מהSheets השונים בטאבלוDashboards in Tableau
(SQLbelle)
Dashboard Creation

נושאים נוספים שחשוב לדעת

אין לי כוונה לטעון כאן שכדי להתקבל למשרה הראשונה כל מה שצריך זה לדעת אקסל, SQL וTableau. תואר או ניסיון רלוונטיים חשובים מאוד. בנוסף, ישנם תחומים נוספים שיכולים להוות יתרון משמעותי על מנת להשיג משרה ראשונה בתחום.

כמה מילים לגבי ידע בפייתון: כל מה שהצגתי בטבלאות למעלה אפשר לעשות גם עם פייתון וספציפית עם ספריות כמו: Pandas, Numpy, Matplotlib ואחרות. בהערכה גסה, מעטות החברות שדורשות ידע בפייתון כתנאי כניסה. אם אתם יודעים פייתון, זה יכול להוות אחלה של יתרון. אתם לא יודעים פייתון? דעו שברוב המשרות זה יתרון בלבד. לא בטוח ששווה להשקיע בזה את הזמן כדי להשיג את המשרה הראשונה. עם זאת, אם אתם חושבים שיהיה לכם קשה להשיג משרה ראשונה כי אין לכם רקע או ניסיון מתאימים, אז ידע ויכולת מוכחת בפייתון יכולים להוות אחלה 'איתות' למעסיק שיש לכם יכולת טכנית מספקת.

קצת על סטטיסטיקה: רמת ההיכרות הנדרשת עם סטטיסטיקה מאוד תלויה בתפקיד הדאטה הספציפי אליו אתם מתמיינים. יש תפקידים שנחוץ ידע במודלים סטטיסטיים, יש תפקידים שנחוץ ידע בAB tests ויש משרות שלא מצריכות כל ידע סטטיסטי. אני מניח שחלק מהסיבה שחברות מתעדפות בוגרי תארים ריאליים (ספציפית, הנדסה תעו"נ, כלכלה, תארים מתקדמים במדעי החיים) נובעת גם מההיכרות של הבוגרים עם חשיבה סטטיסטית. ככלל, בראיונות עבודה או מבחני בית, נדיר להיתקל בשאלות שכוללות ידע סטטיסטי פר אקסלנס. בהרבה מקומות יחפשו חשיבה אנליטית וCommon Sense סטטיסטי. איך מתכוננים לזה? אשאיר את זה לפוסט נפרד.

רוצים לשמוע על מקורות מידע נוספים ללמידה אונליין? כתבו לי.

שתף

תוכן עניינים

0
Would love your thoughts, please comment.x
()
x