علم داده چیست و چگونه میتوان دانشمند داده شد؟
بهباور بسیاری از صاحبنظران، علم داده جذابترین و پرکاربردترین علم قرن بیستویکم است. در جهان امروز که تکنولوژی حرف اول را در آن میزند، همه سؤالهایی دارند که تنها راه جواب دادن به آنها بررسی دقیق و کامل حجم قابلتوجهی از دادهها خواهد بود. از سازمانهای تجاری کوچکتر گرفته تا مؤسسههای دولتی، همه دادههای نامحدودی در اختیار دارند که با دستهبندی، تفسیر و بهکار گرفتن آنها، میتوان مقاصد گوناگونی را برآورده کرد و البته این کار ساده نیست و میتواند چالشبرانگیز باشد. اینجا است که پای علم داده و تخصص در آن به میان میآید. علم داده چیست و چگونه میتوان دانشمند داده شد؟ این سؤالی است که در ادامهٔ مقاله جوابی برایش خواهیم یافت.
علم داده چیست؟
اساس علم داده یا دیتا ساینس (به انگلیسی Data Science) متشکل از نظریهها و مباحث مرتبط با چند رشتهٔ علمی مختلف است. در آن، با استفاده از روشهای علمی، الگوریتمها، فرایندها و سامانههای مختلف سعی میشود تا از دادههای ذخیرهشدهٔ سازمانها و مؤسسهها به مقاصد مختلف بهرهبرداری بشود. دانشمند داده باید در زمینهها مختلفی مهارت داشته باشد که مهمترین آنها مفاهیم آماری، علوم کامپیوتری و دانش مرتبط با دنیای کسبوکار است. کار اصلی دانشمند داده تجزیهوتحلیل دادههایی است که در بانکهای اطلاعاتی سازمانها و مؤسسهها ذخیرهسازی شدهاند. دادههایی که از اینترنت، گوشیهای هوشمند، مشتریها و … گردآوری شدهاند.
در علم داده سعی بر آن است تا با واکاوی و تجزیهوتحلیل دادهها، اطلاعات ارزشمندی در اختیار مسئولان سازمانها قرار داده بشود تا با استفاده از آن، بتوانند با نوآوری بیشتری خدمات خود را ارائه یا محصولاتشان را تولید کنند و بهدنبال آن، بازخورد بهتری دریافت کنند. دادههای سازمان در این فرایند نقش کلیدی دارند، اما مهمتر از آن اطلاعاتی است که با تخصص و مهارت دانشمند داده حاصل میشود و فعالیتهای آتی سازمان، بر اساس آن برنامهریزی میشوند.
مهارتهای مورد نیاز برای فعالیت در حوزهٔ علم داده
۱. تجربه و مهارت در کار بار زبانهای برنامهنویسی کامپیوتر (در برنامههای آموزش علم داده که در ادامه شرح داده خواهد شد، کار با دو زبان برنامهنویسی R و Python آموزش داده میشود).
۲. داشتن اطلاعات کاربردی در زمینهٔ فعالیت: دانشمند داده باید درک کاملی از زمینهای که در آن فعالیت میکند (زمینهٔ کاری مؤسسه یا سازمانی که برای آن کار میکند) داشته باشد. تنها در این صورت میتواند راهحل مناسب را برای مسائل پیچیده ارائه کند. راهحلی که در هماهنگی با اهداف سازمان محل فعالیتش باشد.
۳. مهارتهای ارتباطی: یافتههای دانشمند داده فنی و تحلیلی هستند. او باید این یافتهها را بهشکلی قابلفهم و به زبانی ساده در اختیار بخش مربوطه در سازمان محل فعالیت قرار بدهد. بهعلاوه صرف تخصص در علم داده کافی نیست و دانشمند داده باید با برقراری ارتباط مؤثر با بخشهای غیرفنی سازمان (بهعنوان مثال تیمهای بازاریابی) درک کاملی از نیازهای آنها پیدا کند. تنها در این صورت است که قادر به تجزیهوتحلیل درست دادهها خواهد بود.
۴. داشتن مهارت فنی در سطح عالی در زمینههای زیر:
- ریاضیات (جبر خطی، حسابداری، احتمالات)؛
- آمار؛
- ابزارها و تکنیکهای یادگیری ماشین (به انگلیسی Machine Learning که یکی از شاخههای هوش مصنوعی است و در آن به تنظیم و طراحی الگورتیمهایی پرداخته میشود که با استفاده از آنها بتوان امکان یادگیری روندها را برای کامپیوتر و برخی سیستمها فراهم کرد)؛
- دادهکاوی (فرآیند شناسایی روندهای مختلف در حجم زیادی از دادهها)؛
- پاکسازی داده (پیدا کردن دادههای بیارزش یا نادرست و اصلاح یا حذف آنها)؛
- تکنیکهای گزارشنویسی و مصورسازی داده (شاخهای از آمار توصیفی و مرتبط به مطالعهٔ چگونگی نمایش داده و انتقال اطلاعات است)؛
- تکنیکهای مرتبط با دادههای ساختارنیافته.
ویژگیهای دانشمند داده
دانشمند علم داده باید در چند زمینهٔ مختلف دانش و تخصص داشته باشد. مهمترین این زمینهها، دانش آماری و مهارتهای کامپیوتری لازم برای حل کردن مسائل پیچیده است. او با استفاده از انواع مدلهای توصیفی، پیشبینی و استنباطی قادر به ریشهیابی و پیشبینی مشکلات احتمالی خواهد بود و بر اساس عوامل مختلف راهحل مناسب برای آنها را ارائه خواهد کرد.
دانشمند داده علاوه بر تخصص در زمینهٔ علوم کامپیوتری، با ریاضیات هم آشنا است. مهارتهای فرد متخصص در علم داده از حوزههای تکنولوژی و کسبوکار فراتر میرود. به همین خاطر است که تمامی سازمانها و مؤسسههای کوچک و بزرگ بهدنبال افراد متخصص در علم داده میگردند.
آموزش علم داده
تبدیل شدن به دانشمند داده کار سادهای نیست و به مجموعهای از تخصصها و مهارتهای مختلف نیاز دارد. اما نباید فراموش کرد که در حال حاضر، فرصتهای شغلی بسیار خوبی برای افراد متخصص در علم داده وجود دارد و کسب مهارت در آن، میتواند بهمنزلهٔ مهاجرت به آمریکا، کانادا، مهاجرت به استرالیا و دیگر کشورهای توسعهیافته باشد و مشخصاً، چشمانداز بسیار روشنی برای آینده بهدنبال دارد. راهکار اول برای کسب تخصص در علم داده کمی طولانیتر است و شامل سه مرحلهٔ زیر میشود:
- دریافت مدارک تحصیلی در مدارج لیسانس، فوق لیسانس یا دکتری در یکی از رشتههای مهندسی صنایع، علوم کامپیوتر، فناوری اطلاعات، ریاضی، فیزیک یا رشتهای مرتبط با موارد یاد شده همچون مدیریت؛
- گذراندن دورههای آموزشی و دریافت مدرک معتبر در زمینهٔ علوم داده یا رشتهای مرتبط با آن؛
- کسب تخصص در زمینهای که قصد فعالیت در آن را دارید (همچون حوزههای صنایع، سلامت، بازاریابی، کسبوکار و …).
در حال حاضر مؤسسهٔ آموزشی عالی آزاد توسعه معتبرترین مؤسسه مطرح در زمینهٔ آموزش و برگزاری دوره علم داده است و با شرکت در دورههای آن، میتوان کلیه مهارتهایی که یک متخصص علم داده از قبیل بکارگیری مفاهیم آماری و الگوریتمهای پیشرفته در نرمافزارهایی چون R و Python (از زبانهای برنامهنویسی علم داده)، وب کاوی، متن کاوی و … را نیاز دارد، آموخت. این مؤسسه علاوه بر برگزاری کارگاه علم داده بهصورت حضوری، اقدام به برگزاری دورههای آنلاین علم داده نیز میکند که برای اشخاصی که به دلیل بعد مسافت یا زمان قادر به شرکت در دورههای حضوری علم داده نمیباشند، بتوانند از آموزشهای دیتا ساینس بهرهمند گردند.
شرح وظایف دانشمند داده
وظیفهٔ اصلی دانشمند داده استخراج معانی مختلف و کاربردی از انواع داده است (ساختاریافته، نیمهساختاریافته، ساختارنیافته). دادهای که بهطور بیوقفه وارد بانکهای اطلاعاتی سازمان میشود. استخراج داده از بانکهای اطلاعاتی، فراهم کردن داده برای تجزیهوتحلیلهای گوناگون، طراحی و ساخت مدلهای آماری و تألیف گزارشهایی به زبان ساده و قابلفهم از دادههای مصورسازی شده (گزارشهایی که در اختیار مسئولان سازمان قرار میگیرد)، از مهمترین وظایف دانشمند داده هستند. در ادامه میتوانید سایر وظایف دانشمند داده را مشاهده کنید:
- گردآوری داده؛
- آمادهسازی داده؛
- تجزیهوتحلیل دادههای اکتشافی (بهاختصار EDA؛ مرحلهٔ اول در تحلیل هرگونه داده است و شامل بررسی اشتباهات و فعالیتهای اینچنینی میشود)؛
- ارزیابی و تفسیر نتایج حاصلشده از تجزیهوتحلیل دادههای اکتشافی؛
- طراحی و ساخت مدلهای آماری؛
- امتحان کردن و گسترش این مدلها؛
- بهینهسازی مدلها.
چشمانداز فعالیت در زمینهٔ علم داده
با کسب تخصص در زمینهٔ علم داده و فعالیت در آن علاوه بر داشتن امنیت شغلی، چشماندازی بسیار امیدوارکننده پیش رو خواهید داشت. در حال حاضر دستمزدهای در نظر گرفتهشده برای کسانی که در این زمینه تخصص دارند بیشتر از میانگین دستمزدهای شغلهای دیگر است (بهعنوان مثال دستمزد دانشمند داده در مقایسه با مهندس نرمافزار و تحلیلگر داده ۵۰٪ بیشتر است) و بهعلاوه، انتظار میرود طی سالهای آتی نیاز به افراد متخصص در علم داده بیشتر و بیشتر بشود.
در حال حاضر سازمانها و کسبوکارهای مختلف بیش از هر زمان دیگری برای تصمیمگیری متکی به دادههای جمعآوریشده در بانکهای اطلاعاتیشان هستند. به همین خاطر نیاز به کسانی که توانایی سازماندهی، گردآوری، تفسیر و استخراج الگوها و برآورد روندهای مختلف از دادهها را داشته باشند، محسوستر از همیشه است. گردآوری داده توسط کسبوکارها مسئلهای است که در آینده با جدیت بیشتری ادامه خواهد یافت. با این تفاسیر طی سالهای آتی تقاضا برای افراد متخصص در زمینهٔ علم داده روندی روبهرشد خواهد داشت.
سخن پایانی
در این مقاله سعی بر آن بود تا در حد امکان توضیحاتی اجمالی دربارهٔ علم داده، و اهمیت آن در عصر حاضر ارائه بشود. مطالب این مقاله برای آشنایی ابتدایی شما با مبحث یادشده مناسب است و اگر قصد کسب اطلاعات بیشتر در این خصوص را دارید، پیشنهاد میکنیم در رویدادها و همایشهای علم داده موسوم به “دیتا میتینگ” که از سوی مؤسسهٔ آموزش عالی آزاد توسعه برگزار میشود شرکت کنید. در این گونه رویدادها علاوه بر درک بهتر موضوع با نقطهنظر افرادی چون دکتر یاسر زرهساز آشنا خواهید شد که فارغالتحصیل دانشگاه میشیگان آمریکا، مشاور و مجری پروژههای علم داده در ایران و آمریکا است. همچنین در جلسات دیتا میتینگ از مدیران و افراد خبره در این حوزه دعوت میشود تا نظرات و سخنان خود را بیان کنند.