از کی دانشمند داده (Data Scientist) شدم !!! - آموزش و تحلیل آماری با نرم افزار R
 

آموزش و تحلیل آماری با نرم افزار R

آموزش و اشتراک دانسته ها درباره ی نرم افزار SPSS,SAS, R ,... به همراه تحلیل داده و پروژه آماری

از کی دانشمند داده (Data Scientist) شدم !!!
ساعت ۱۱:٢۳ ‎ب.ظ روز شنبه ۱۳٩٠/۱٢/۱۳  کلمات کلیدی: r ، دانشمند داده ، تحلیل آماری ، داده کاوی

نمودار ون دانشمند داده

( توضیح نمودار: این نمودار که به سبک نمودارهای ون رسم شده است، جایگاه یک دانشمند داده را به خوبی مشخص می کند.)

همیشه با اساتید و بچه های دانشگاه درباره ی نحوه ی تدریس رشته ی آمار در دانشگاه ها بحث می کردم. من از اینکه آمار در دانشگاه برای بچه ها اینقدر تئوری تدریس می شود، شکایت داشتم. گاهی این بحث ها این قدر جدی می شد که من احساس می کردم که انجام کار آماری اصلا وظیفه ی یک دانشجوی آمار نیست !!!

من می دیدم که بچه ها، نمرات خوبی از امتحان ها می گیرند ولی ذره ای با مفاهیمی که خوانده اند، ارتباط برقرار نمی کنند. این مسئله اینقدر بین دانشجویان آمار رایج هست که دانشجویان علوم اجتماعی، پزشکی و ... بیشتر از خود آماری ها کار آماری انجام می دهند.

من در کنار آمار ، رشته ی مهندسی IT نیز خوانده ام. به همین واسطه مقالات هر دو حوزه را دنبال می کردم.

از چند وقت پیش، واژه ای وارد اصطلاحات دنیای IT شد که قرار است در دهه ی آینده ی این صنعت را دگرگون کند. در حقیقت، "دانشمند داده" کسی است که با داشتن مهارت های بالای برنامه نویسی و دانشی از آمار و ریاضیات و با اتکا به توانایی های خوداموز خود می تواند از منابع عظیم داده، نتایج پایداری را استخراج کند.

دیگر مسئله ی داشتن مدرکی از آمار یا IT ملاک نیست، چرا که منابع آموزشی برای تحلیل داده ها به وفور در اینترنت و ... در دسترسند. شاید یک دانشجوی آمار بتواند UMVUE ها را خیلی سریع اثبات کند ولی آیا می تواند تحلیل داده های واقعی را نیز انجام دهد؟ وبلاگ یکی از موفق ترین دانشمندان داده را که می خواندم ، می دیدم که وی هیچ دانش آکادمیکی آماری ندارد ولی درک و فهمش از UMVUE خیلی خیلی بیشتر از  دانشجویان و شاید حتی اساتید آمار باشد، چرا که در عمل آن را دیده است و لمسش کرده است.

دیگر مثلا این که بگوییم فلانی داده کاوی کار می کند، یا فلانی بیزی کار است، یا فلانی ماشین یادگیری می نویسد، یا فلانی فازی تحلیل می کند و یا ... دیگر مهم نیست. یک دانشمند داده باید همه ی اینها و خیلی خیلی بیشتر از اینها را بلد باشد تا بتواند مسائل واقعی را حل کند. باید بتواند به روز باشد، تکنیک های جدید را یاد بگیرد و خودش را تکرار نکند.

شاید خنده دار باشد در عصر cluod computing همچنان فقط به دنبال یادگیری نحوه ی انجام آزمون t در  SPSS و ... باشیم!

جهان آینده ی نزدیک، به دنبال دانشمندان داده می گردد و اگر می گویند آمار در 2018 جذابترین شغل خواهد بود، نه این آمار که ما می خوانیم، بلکه آماری که راهگشا باشد.

محبوب ترین ابزار دانشمندان داده به نقل از یک نظرسنجی معتبر، نرم افزار R است. کار با R ساده و یادگیریش آسان است و جدیدترین تکنیک ها خیلی سریع در آن نیز قابل پیاده سازی هستند. امیدوارم این وبلاگ محیطی باشد برای تبادل اطلاعات در این زمینه ها.

علاقه مندان نقطه نظرات و همکاری های خود را با ایمیل زیر یا قسمت نظرات اعلام نمایند:

LearnRWS@gmail.com

حق کپی رایت برای نویسنده محفوظ است.
به حقوق یکدیگر احترام بگذاریم!