ডেটা সায়েন্স কী? ডেটা সায়েন্সের জন্য একটি শিক্ষানবিশ এর গাইড

ডেটা সায়েন্স কৃত্রিম বুদ্ধিমত্তার ভবিষ্যত। ডেটা সায়েন্স কী তা শিখুন, কীভাবে এটি আপনার ব্যবসায় এবং এর বিভিন্ন জীবনচক্র পর্যায়ের মান যুক্ত করতে পারে।

বিশ্বের বড় ডেটার যুগে প্রবেশের সাথে সাথে এর সঞ্চয়ের প্রয়োজনীয়তাও বেড়েছে। এটি 2010 পর্যন্ত এন্টারপ্রাইজ শিল্পগুলির জন্য প্রধান চ্যালেঞ্জ এবং উদ্বেগ ছিল The মূল ফোকাস ছিল ডেটা সংরক্ষণের কাঠামো এবং সমাধান তৈরি করা। এখন যখন হাদুপ এবং অন্যান্য ফ্রেমওয়ার্কগুলি স্টোরেজটির সমস্যাটি সফলভাবে সমাধান করেছে, তখন এই ডেটা প্রক্রিয়াকরণের দিকে ফোকাস স্থানান্তরিত হয়েছে। ডেটা সায়েন্স হ'ল এখানে সিক্রেট সস। হলিউডের সাই-ফাই সিনেমাগুলিতে আপনি যে সমস্ত ধারণাগুলি দেখেন সেগুলি ডেটা সায়েন্স দ্বারা বাস্তবে রূপান্তরিত হতে পারে। ডেটা সায়েন্স কৃত্রিম বুদ্ধিমত্তার ভবিষ্যত। অতএব, ডেটা সায়েন্স কী এবং এটি কীভাবে আপনার ব্যবসায়ের মূল্য যুক্ত করতে পারে তা বোঝা খুব গুরুত্বপূর্ণ।



এডুরেকা 2019 টেক ক্যারিয়ার গাইড বাইরে! সর্বাধিক কাজের ভূমিকা, সঠিক শিক্ষার পাথ, শিল্পের দৃষ্টিভঙ্গি এবং আরও অনেক কিছু। ডাউনলোড করুন এখন

এই ব্লগে, আমি নিম্নলিখিত বিষয়গুলি কভার করব।



এই ব্লগটির শেষে, আপনি আমাদের চারপাশের জটিল এবং বৃহত্তর উপাত্তগুলির অর্থবহ অন্তর্দৃষ্টিগুলি আবিষ্কার করার জন্য ডেটা সায়েন্স কী এবং এর ভূমিকা বুঝতে পারবেন।ডেটা সায়েন্সে গভীর-জ্ঞান পেতে, আপনি লাইভের জন্য তালিকাভুক্ত করতে পারেন 24/7 সমর্থন এবং আজীবন অ্যাক্সেস সহ এডুরেকা দ্বারা।

ডেটা সায়েন্স কী?

ডেটা সায়েন্স হ'ল কাঁচা তথ্য থেকে গোপনীয় নিদর্শনগুলি আবিষ্কার করার লক্ষ্য সহ বিভিন্ন সরঞ্জাম, অ্যালগরিদম এবং মেশিন লার্নিং নীতিগুলির মিশ্রণ। তবে পরিসংখ্যানবিদরা বছরের পর বছর যা করছেন তার থেকে এটি কীভাবে আলাদা?



উত্তরটি ব্যাখ্যা এবং ভবিষ্যদ্বাণী করার মধ্যে পার্থক্যের মধ্যে রয়েছে।

ডেটা অ্যানালিস্ট v / s ডেটা সায়েন্স - এডুরেকা

আপনি উপরের চিত্রটি থেকে দেখতে পাচ্ছেন, একজন ডেটা অ্যানালিস্টসাধারণত ডেটা ইতিহাসের প্রক্রিয়া দ্বারা কী চলছে তা ব্যাখ্যা করে। অন্যদিকে, ডেটা সায়েন্টিস্ট কেবল অনুসন্ধান থেকে বিশ্লেষণগুলি এ থেকে অন্তর্দৃষ্টি আবিষ্কার করতে পারে না, তবে ভবিষ্যতে কোনও নির্দিষ্ট ঘটনার ঘটনা সনাক্ত করতে বিভিন্ন উন্নত মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে। একজন ডেটা সায়েন্টিস্ট অনেকগুলি কোণ থেকে ডেটা দেখবেন, কখনও কখনও আগে কোণগুলি জানা যায় না।



সুতরাং, ডেটা সায়েন্স প্রাথমিকভাবে ভবিষ্যদ্বাণীমূলক কার্যকারিতা বিশ্লেষণ, প্রিক্রিপটিভ অ্যানালিটিক্স (ভবিষ্যদ্বাণীপূর্ণ প্লাস সিদ্ধান্ত বিজ্ঞান) এবং মেশিন লার্নিংয়ের ব্যবহার এবং সিদ্ধান্ত গ্রহণের জন্য ব্যবহৃত হয়।

  • ভবিষ্যদ্বাণীমূলক কার্যকারণ বিশ্লেষণ - আপনি যদি এমন একটি মডেল চান যা ভবিষ্যতে কোনও নির্দিষ্ট ঘটনার সম্ভাবনাগুলির পূর্বাভাস দিতে পারে, আপনার ভবিষ্যদ্বাণীমূলক কার্যকারিতা বিশ্লেষণ প্রয়োগ করতে হবে। বলুন, আপনি যদি ক্রেডিটে অর্থ সরবরাহ করে থাকেন, তবে গ্রাহকদের ভবিষ্যতে creditণ পরিশোধের সময়মতো করার সম্ভাবনা আপনার পক্ষে উদ্বেগের বিষয়। এখানে, আপনি এমন একটি মডেল তৈরি করতে পারেন যা গ্রাহকের অর্থ প্রদানের ইতিহাস সম্পর্কে ভবিষ্যদ্বাণীমূলক বিশ্লেষণ করতে পারে ভবিষ্যতের পেমেন্টগুলি সময়মতো হবে কিনা তা অনুমান করতে।
  • ব্যবস্থাপত্র বিশ্লেষণ: আপনি যদি এমন কোনও মডেল চান যা তার নিজস্ব সিদ্ধান্ত নেওয়ার বুদ্ধি এবং গতিশীল পরামিতিগুলি দিয়ে এটি সংশোধন করার ক্ষমতা রাখে তবে অবশ্যই এর জন্য আপনাকে অবশ্যই ব্যবস্থাপত্র বিশ্লেষণের প্রয়োজন। এই তুলনামূলকভাবে নতুন ক্ষেত্রটি পরামর্শ প্রদান সম্পর্কে। অন্য পদগুলিতে, এটি কেবল ভবিষ্যদ্বাণী করে না তবে নির্ধারিত ক্রিয়া এবং সম্পর্কিত ফলাফলগুলির একটি পরিসীমাও প্রস্তাব করে।
    এর সর্বোত্তম উদাহরণ হ'ল গুগলের স্ব-ড্রাইভিং গাড়ি যা আমি আগেও আলোচনা করেছি। যানবাহন দ্বারা সংগৃহীত ডেটা স্ব-ড্রাইভিং গাড়ি প্রশিক্ষণের জন্য ব্যবহার করা যেতে পারে। এটিতে বুদ্ধি আনতে আপনি এই ডেটাতে অ্যালগোরিদম চালাতে পারেন। এটি কখন আপনারা কখন ঘুরিয়ে নেবেন, কোন পথ অবলম্বন করবেন তা সিদ্ধান্ত নিতে আপনার গাড়িটিকে সক্ষম করবে,কখন মন্থর হবে বা গতি বাড়াবে।
  • ভবিষ্যদ্বাণী করার জন্য মেশিন লার্নিং - যদি আপনার কাছে কোনও ফিনান্স সংস্থার লেনদেনের ডেটা থাকে এবং ভবিষ্যতের প্রবণতা নির্ধারণের জন্য একটি মডেল তৈরি করা প্রয়োজন, তবে মেশিন লার্নিং অ্যালগরিদমই সেরা বেট। এটি তদারকি শিক্ষার দৃষ্টান্তের আওতায় পড়ে। একে তদারকি বলা হয় কারণ আপনার কাছে ইতিমধ্যে এমন ডেটা রয়েছে যার ভিত্তিতে আপনি আপনার মেশিনগুলিকে প্রশিক্ষণ দিতে পারেন। উদাহরণস্বরূপ, জালিয়াতি কেনার historicalতিহাসিক রেকর্ড ব্যবহার করে একটি জালিয়াতি সনাক্তকরণ মডেলকে প্রশিক্ষণ দেওয়া যেতে পারে।
  • প্যাটার্ন আবিষ্কারের জন্য মেশিন লার্নিং - আপনি যদি ভবিষ্যদ্বাণী করতে পারেন তার উপর ভিত্তি করে যদি আপনার কাছে প্যারামিটার না থাকে তবে অর্থপূর্ণ ভবিষ্যদ্বাণী করতে সক্ষম হওয়ার জন্য আপনাকে ডেটাসেটের মধ্যে লুকানো নিদর্শনগুলি খুঁজে বের করতে হবে। এটি গোছানো মডেল ছাড়া কিছুই নয় কারণ গোষ্ঠীকরণের জন্য আপনার কোনও পূর্বনির্ধারিত লেবেল নেই। প্যাটার্ন আবিষ্কারের জন্য ব্যবহৃত সবচেয়ে সাধারণ অ্যালগরিদম হ'ল ক্লাস্টারিং।
    ধরা যাক আপনি একটি টেলিফোন সংস্থায় কাজ করছেন এবং কোনও অঞ্চলে টাওয়ার লাগিয়ে আপনার নেটওয়ার্ক স্থাপন করা দরকার। তারপরে, আপনি সেই টাওয়ারের অবস্থানগুলি খুঁজে পেতে ক্লাস্টারিং কৌশলটি ব্যবহার করতে পারেন যা নিশ্চিত করবে যে সমস্ত ব্যবহারকারী সর্বোত্তম সিগন্যাল শক্তি গ্রহণ করবে।

আসুন দেখুন ডেটা অ্যানালাইসের পাশাপাশি ডেটা সায়েন্সের জন্য উপরে বর্ণিত পদ্ধতির অনুপাত কীভাবে আলাদা fer যেমন আপনি নীচের চিত্রটিতে দেখতে পাচ্ছেন, ডেটা বিশ্লেষণবর্ণনামূলক বিশ্লেষণ এবং নির্দিষ্ট পরিমাণে ভবিষ্যদ্বাণী অন্তর্ভুক্ত করে। অন্যদিকে, ডেটা সায়েন্স প্রেডিকটিভ কজাল অ্যানালিটিক্স এবং মেশিন লার্নিং সম্পর্কে আরও বেশি।

ডেটা সায়েন্স অ্যানালিটিক্স - এডুরেকা

ডেটা সায়েন্স কী তা আপনি জানেন এখন, প্রথমে এটির প্রয়োজনীয়তার কারণটি খুঁজে বের করুন।

ডাটা সায়েন্স কেন?

  • Ditionতিহ্যগতভাবে, আমাদের যে ডেটা ছিল তা বেশিরভাগ কাঠামোগত এবং আকারে ছোট ছিল, যা সাধারণ বিআই সরঞ্জাম ব্যবহার করে বিশ্লেষণ করা যেতে পারে।ডেটা থেকে পৃথকপ্রচলিত সিস্টেম যা বেশিরভাগ কাঠামোগত ছিল structআজকের দিনে বেশিরভাগ ডেটাই কাঠামোগত বা আধা-কাঠামোগত। নীচে প্রদত্ত চিত্রটিতে থাকা ডেটা ট্রেন্ডগুলি একবার দেখে নেওয়া যাক যা দেখায় যে ২০২০ সালের মধ্যে 80০% এর বেশি ডেটা কাঠামোগত করা হবে।
    কাঠামোগত ডেটার প্রবাহ - এডুরেকা
    এই ডেটা বিভিন্ন উত্স যেমন আর্থিক লগগুলি, পাঠ্য ফাইলগুলি, মাল্টিমিডিয়া ফর্মগুলি, সেন্সরগুলি এবং যন্ত্রগুলি থেকে উত্পন্ন হয়। সাধারণ বিআই সরঞ্জামগুলি এই বিশাল পরিমাণ এবং বিভিন্ন ডেটা প্রক্রিয়াকরণ করতে সক্ষম নয়। এ কারণেই এর থেকে অর্থবহ অন্তর্দৃষ্টি প্রক্রিয়াকরণ, বিশ্লেষণ এবং অঙ্কন করার জন্য আমাদের আরও জটিল এবং উন্নত বিশ্লেষণাত্মক সরঞ্জাম এবং অ্যালগরিদম প্রয়োজন।

ডেটা সায়েন্স এত জনপ্রিয় হয়ে ওঠার একমাত্র কারণ নয়। আসুন আরও গভীর খনন করা যাক এবং বিভিন্ন ডোমেনগুলিতে ডেটা সায়েন্স কীভাবে ব্যবহৃত হচ্ছে তা দেখুন।

  • গ্রাহকের অতীত ব্রাউজিং ইতিহাস, ক্রয়ের ইতিহাস, বয়স এবং আয়ের মতো বিদ্যমান ডেটা থেকে আপনার গ্রাহকদের যথাযথ প্রয়োজনীয়তা বুঝতে পারলে কীভাবে হয়। কোনও সন্দেহ নেই যে আপনার আগেও এই সমস্ত ডেটা ছিল, তবে এখন বিশাল পরিমাণ এবং বিভিন্ন ধরণের ডেটা দিয়ে আপনি মডেলগুলিকে আরও কার্যকরভাবে প্রশিক্ষণ দিতে পারেন এবং আরও গ্রাহকদের কাছে পণ্যটি আরও নির্ভুলতার সাথে সুপারিশ করতে পারেন। এটি কীভাবে আশ্চর্যজনক হবে না যেহেতু এটি আপনার সংস্থায় আরও ব্যবসায় নিয়ে আসবে?
  • এর মধ্যে ডেটা সায়েন্সের ভূমিকা বোঝার জন্য একটি আলাদা পরিস্থিতি নেওয়া যাক সিদ্ধান্ত গ্রহণআপনার গাড়ীর আপনাকে বাড়ি চালানোর বুদ্ধি থাকলে কীভাবে? স্ব-চালিত গাড়িগুলি তার চারপাশের মানচিত্র তৈরি করতে রাডার, ক্যামেরা এবং লেজার সহ সেন্সরগুলি থেকে সরাসরি ডেটা সংগ্রহ করে। এই ডেটার উপর ভিত্তি করে, কখন গতি বাড়ানো যায়, কখন গতি কমাতে হবে, কখন ওভারটেক করতে হবে, কোথায় ঘুরতে হবে - উন্নত মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে এমন সিদ্ধান্ত গ্রহণ করে।
  • আসুন দেখে নেওয়া যাক ডেটা সায়েন্স কীভাবে ভবিষ্যদ্বাণীমূলক বিশ্লেষণে ব্যবহৃত হতে পারে। আসুন উদাহরণ হিসাবে আবহাওয়ার পূর্বাভাস নেওয়া যাক। মডেল তৈরির জন্য জাহাজ, বিমান, রাডার, উপগ্রহ থেকে ডেটা সংগ্রহ এবং বিশ্লেষণ করা যেতে পারে। এই মডেলগুলি কেবল আবহাওয়ার পূর্বাভাসই দেয় না তবে যে কোনও প্রাকৃতিক দুর্যোগের ঘটনা সম্পর্কে ভবিষ্যদ্বাণী করতে সহায়তা করে। এটি আপনাকে আগে থেকে যথাযথ ব্যবস্থা নিতে এবং অনেক মূল্যবান জীবন বাঁচাতে সহায়তা করবে।

ডেটা সায়েন্স তার ছাপ তৈরি করছে এমন সমস্ত ডোমেনগুলি দেখতে নীচের ইনফোগ্রাফিকটিতে দেখে নেওয়া যাক।

ডেটা সায়েন্স ব্যবহারের কেস - এডুরেকা

ডেটা সায়েন্টিস্ট কে?

ডেটা সায়েন্টিস্টের উপর বেশ কয়েকটি সংজ্ঞা রয়েছে। সহজ কথায়, একটি ডেটা সায়েন্টিস্ট হলেন ডেটা সায়েন্সের শিল্পকে অনুশীলন করে।শব্দ 'ডেটা সায়েন্টিস্ট' হয়েছেকোনও ডেটা সায়েন্টিস্ট বৈজ্ঞানিক ক্ষেত্র এবং অ্যাপ্লিকেশন থেকে প্রচুর তথ্য এনেছে যে তা পরিসংখ্যান বা গণিত কিনা তা বিবেচনা করার পরে তৈরি হয়েছে।

একজন ডেটা সায়েন্টিস্ট কী করে?

তথ্য বিজ্ঞানীরা হলেন যারা কিছু নির্দিষ্ট বৈজ্ঞানিক শাখায় শক্তিশালী দক্ষতার সাথে জটিল ডেটা সমস্যাগুলিকে ক্র্যাক করেন। তারা গণিত, পরিসংখ্যান, কম্পিউটার বিজ্ঞান ইত্যাদি সম্পর্কিত বিভিন্ন উপাদানগুলির সাথে কাজ করে (যদিও তারা এই সমস্ত ক্ষেত্রে বিশেষজ্ঞ নাও হতে পারে)।সংস্থার বৃদ্ধি ও বিকাশের জন্য সমাধানগুলি সন্ধান এবং সিদ্ধান্তে পৌঁছাতে তারা সর্বশেষতম প্রযুক্তিগুলির প্রচুর ব্যবহার করে। কাঠামোগত ও কাঠামোগত ফর্ম থেকে প্রাপ্ত কাঁচা তথ্যের তুলনায় ডেটা বিজ্ঞানীরা তথ্যকে আরও কার্যকর আকারে উপস্থাপন করেন।

ওভারলোডিং বনাম ওভাররাইডিং সি ++

ডেটা সায়েন্টিস্ট সম্পর্কে আরও জানতে আপনি এই নিবন্ধটি পড়তে পারেন

আরও সরানো, এখন বিআই আলোচনা করা যাক। আমি নিশ্চিত আপনি ব্যবসা বুদ্ধি (বিআই) এর কথাও শুনে থাকতে পারেন। প্রায়শই ডেটা সায়েন্স বিআইয়ের সাথে বিভ্রান্ত হয়। আমি কিছু সংক্ষিপ্ত এবং পরিষ্কার বলবদুজনের মধ্যে বিপরীতে যা আপনাকে আরও ভাল বোঝার জন্য সহায়তা করবে। চল একটু দেখি.

বিজনেস ইন্টেলিজেন্স (বিআই) বনাম ডেটা সায়েন্স

  • বিজনেস ইন্টেলিজেন্স (বিআই) মূলত ব্যবসায়িক প্রবণতা বর্ণনা করার জন্য অন্তর্দৃষ্টি এবং অন্তর্দৃষ্টি সনাক্ত করতে পূর্ববর্তী ডেটাগুলি বিশ্লেষণ করে। এখানে দ্বি আপনাকে বাহ্যিক এবং অভ্যন্তরীণ উত্সগুলি থেকে ডেটা নিতে, এটি প্রস্তুত করতে, এটিতে কোয়েরি চালাতে এবং ড্যাশবোর্ড তৈরি করতে সক্ষম করে যেমন প্রশ্নের উত্তর দেয় toত্রৈমাসিক রাজস্ব বিশ্লেষণবা ব্যবসায়িক সমস্যা। বিআই অদূর ভবিষ্যতে কিছু নির্দিষ্ট ইভেন্টের প্রভাব মূল্যায়ন করতে পারে।
  • তথ্য বিজ্ঞান আরও প্রত্যাশিত দৃষ্টিভঙ্গি, অতীত বা বর্তমান তথ্য বিশ্লেষণ এবং জ্ঞাত সিদ্ধান্ত গ্রহণের লক্ষ্য নিয়ে ভবিষ্যতের ফলাফলগুলির পূর্বাভাস দেওয়ার উপর মনোনিবেশ সহ এক অনুসন্ধানের উপায়। এটি 'কী' এবং 'কীভাবে' ইভেন্টগুলি হয় সে সম্পর্কে খোলামেলা প্রশ্নের উত্তর দেয়।

আসুন কিছু বিপরীত বৈশিষ্ট্যগুলি দেখে নেওয়া যাক।

বৈশিষ্ট্য ব্যবসায় গোয়েন্দা (বিআই) তথ্য বিজ্ঞান
তথ্য সূত্রকাঠামোগত
(সাধারণত এসকিউএল, প্রায়শই ডেটা গুদাম)
উভয় কাঠামোগত এবং কাঠামোগত

(লগ, ক্লাউড ডেটা, এসকিউএল, নোএসকিউএল, পাঠ্য)

পন্থাপরিসংখ্যান এবং ভিজ্যুয়ালাইজেশনপরিসংখ্যান, মেশিন লার্নিং, গ্রাফ বিশ্লেষণ, নিউরো-ভাষাগত প্রোগ্রামিং (এনএলপি)
ফোকাসঅতীত এবং বর্তমানবর্তমান এবং ভবিষ্যত
সরঞ্জামপেন্টাহো, মাইক্রোসফ্ট বিআই,কুলিকভিউ, আরর‌্যাপিডমিনার, বিগএমএল, ওয়েকা, আর

ডেটা সায়েন্স কী সে সম্পর্কে এটিই ছিল, এখন আসুন ডেটা সায়েন্সের জীবনচক্রটি বুঝতে পারি।

ডেটা সায়েন্স প্রকল্পগুলিতে করা একটি সাধারণ ভুল প্রয়োজনীয়তাগুলি না বুঝে বা এমনকি ব্যবসায়ের সমস্যাটিকে সঠিকভাবে ফ্রেম না করে ডেটা সংগ্রহ এবং বিশ্লেষণে ছুটে চলেছে। অতএব, প্রকল্পের সুচারু কার্যকারিতা নিশ্চিত করার জন্য আপনার জন্য ডেটা সায়েন্সের আজীবনকালীন সমস্ত ধাপগুলি অনুসরণ করা অত্যন্ত গুরুত্বপূর্ণ।

ডেটা সায়েন্সের লাইফাইসাইকেল

এখানে ডেটা সায়েন্স লাইফসাইকের মূল পর্যায়ের সংক্ষিপ্ত বিবরণ দেওয়া হল:

ডেটা সায়েন্সের লাইফাইসাইকেল - এডুরেকা


ডেটা সায়েন্সের আবিষ্কার - এডুরেকাপ্রথম পর্যায় — আবিষ্কার:
আপনি প্রকল্পটি শুরু করার আগে বিভিন্ন স্পেসিফিকেশন, প্রয়োজনীয়তা, অগ্রাধিকার এবং প্রয়োজনীয় বাজেট বোঝা গুরুত্বপূর্ণ। আপনার অবশ্যই সঠিক প্রশ্ন জিজ্ঞাসা করার ক্ষমতা থাকতে হবে।এই প্রকল্পটি সমর্থন করার জন্য আপনার কাছে লোকেরা, প্রযুক্তি, সময় এবং ডেটার শর্তাদি উপস্থিত প্রয়োজনীয় সংস্থান রয়েছে কিনা তা আপনি এখানে মূল্যায়ণ করুন।এই পর্যায়ে, আপনার ব্যবসায়ের সমস্যাটি ফ্রেম করা এবং পরীক্ষার জন্য প্রাথমিক হাইপোথেসিস (আইএইচ) প্রণয়ন করা প্রয়োজন।

তথ্য বিজ্ঞানের ডেটা প্রস্তুতি - এডুরেকা ure

দ্বিতীয় ধাপ — ডেটা প্রস্তুতি: এই পর্যায়ে আপনার বিশ্লেষণাত্মক স্যান্ডবক্স দরকার যা আপনি প্রকল্পের পুরো সময়কালের জন্য বিশ্লেষণ সম্পাদন করতে পারেন। মডেলিংয়ের আগে আপনাকে এক্সপ্লোর, প্রিপ্রসেস এবং শর্তের ডেটা প্রয়োজন need আরও, আপনি স্যান্ডবক্সে ডেটা পেতে ইটিএলটি (এক্সট্র্যাক্ট, ট্রান্সফর্ম, লোড এবং ট্রান্সফর্ম) সম্পাদন করবেন। আসুন নীচের পরিসংখ্যান বিশ্লেষণ প্রবাহটি একবার দেখুন।

ডেটা সায়েন্সের লাইফাইসাইকেল
আপনি ডেটা পরিষ্কার, রূপান্তর এবং ভিজ্যুয়ালাইজেশনের জন্য আর ব্যবহার করতে পারেন। এটি আপনাকে বহিরাগতদের স্পট করতে এবং ভেরিয়েবলগুলির মধ্যে সম্পর্ক স্থাপনে সহায়তা করবে।একবার আপনি ডেটা পরিষ্কার এবং প্রস্তুত করার পরে, অনুসন্ধানের কাজ করার সময় এসেছেবিশ্লেষণচালু কর. আপনি কীভাবে এটি অর্জন করতে পারেন তা দেখুন।

ধাপ 3 — মডেল পরিকল্পনা: ডেটা বিজ্ঞানের মডেল পরিকল্পনা - এডুরেকা এখানে, আপনি ভেরিয়েবলের মধ্যে সম্পর্ক আঁকার জন্য পদ্ধতি এবং কৌশলগুলি নির্ধারণ করবেন।এই সম্পর্কগুলি অ্যালগরিদমের ভিত্তি তৈরি করবে যা আপনি পরবর্তী পর্যায়ে প্রয়োগ করবেন।আপনি বিভিন্ন পরিসংখ্যান সূত্র এবং ভিজ্যুয়ালাইজেশন সরঞ্জাম ব্যবহার করে এক্সপ্লোরার ডেটা অ্যানালিটিক্স (ইডিএ) প্রয়োগ করবেন।

আসুন দেখে নেওয়া যাক বিভিন্ন মডেল পরিকল্পনার সরঞ্জামগুলিতে।

ডেটা সায়েন্সে মডেল পরিকল্পনার সরঞ্জাম - এডুরেকা

  1. আর মডেলিং ক্ষমতাগুলির একটি সম্পূর্ণ সেট রয়েছে এবং ব্যাখ্যামূলক মডেল তৈরির জন্য একটি ভাল পরিবেশ সরবরাহ করে
  2. এসকিউএল বিশ্লেষণ সেবা সাধারণ ডেটা মাইনিং ফাংশন এবং বেসিক ভবিষ্যদ্বাণীপূর্ণ মডেলগুলি ব্যবহার করে ইন-ডাটাবেস বিশ্লেষণ সম্পাদন করতে পারে।
  3. এসএএস / অ্যাক্সেস হাদুপ থেকে ডেটা অ্যাক্সেস করতে ব্যবহার করা যেতে পারে এবং পুনরাবৃত্তযোগ্য এবং পুনরায় ব্যবহারযোগ্য মডেল ফ্লো ডায়াগ্রাম তৈরি করতে ব্যবহৃত হয়।

যদিও, অনেক সরঞ্জাম বাজারে উপস্থিত রয়েছে তবে আর সবচেয়ে বেশি ব্যবহৃত সরঞ্জাম।

এখন আপনি নিজের ডেটার প্রকৃতি সম্পর্কে অন্তর্দৃষ্টি পেয়েছেন এবং আলগোরিদিমগুলি ব্যবহার করার সিদ্ধান্ত নিয়েছেন। পরবর্তী পর্যায়ে, আপনি হবেপ্রয়োগঅ্যালগরিদম এবং একটি মডেল আপ আপ।

তথ্য বিজ্ঞানের মডেল বিল্ডিং - এডুরেকাফেজ 4 — মডেল বিল্ডিং: এই পর্যায়ে, আপনি প্রশিক্ষণ এবং পরীক্ষার উদ্দেশ্যে ডেটাসেটগুলি বিকাশ করবেন। এখানে yআপনার বিদ্যমান সরঞ্জামগুলি মডেলগুলি চালনার জন্য যথেষ্ট কিনা তা আরও বিবেচনা করা দরকার বা এর জন্য আরও দৃust় পরিবেশের প্রয়োজন হবে (যেমন দ্রুত এবং সমান্তরাল প্রক্রিয়াজাতকরণ)। আপনি মডেলটি তৈরির জন্য শ্রেণিবিন্যাস, সমিতি এবং ক্লাস্টারিংয়ের মতো বিভিন্ন শিক্ষার কৌশল বিশ্লেষণ করবেন।

আপনি নিম্নলিখিত সরঞ্জামগুলির মাধ্যমে মডেল বিল্ডিং অর্জন করতে পারেন।

ডেটা সায়েন্সে মডেল বিল্ডিংয়ের সরঞ্জাম

পর্যায় 5 — অপারেশনালাইজ করুন: ডেটা সায়েন্স কার্যকর - এডুরেকা এই পর্যায়ে, আপনি চূড়ান্ত প্রতিবেদন, ব্রিফিং, কোড এবং প্রযুক্তিগত নথি সরবরাহ করেন deliverতদাতিরিক্ত, কখনও কখনও একটি পাইলট প্রকল্প বাস্তব-সময় উত্পাদন পরিবেশেও প্রয়োগ করা হয়। এটি আপনাকে পুরো স্থাপনার আগে একটি ছোট স্কেলে কর্মক্ষমতা এবং অন্যান্য সম্পর্কিত সীমাবদ্ধতার একটি পরিষ্কার চিত্র সরবরাহ করবে provide


ডেটা সায়েন্সে যোগাযোগ - এডুরেকাপর্যায় 6 results যোগাযোগের ফলাফল:
এখন আপনার মূল্যায়ন করা গুরুত্বপূর্ণ যে আপনি প্রথম পর্যায়ে আপনার যে লক্ষ্যটি পরিকল্পনা করেছিলেন তা অর্জন করতে সক্ষম হয়েছি কিনা। সুতরাং, শেষ পর্যায়ে, আপনি সমস্ত মূল অনুসন্ধানগুলি চিহ্নিত করুন, স্টেকহোল্ডারদের সাথে যোগাযোগ করুন এবং ফলাফলগুলি নির্ধারণ করুন কিনা তা নির্ধারণ করুনপ্রকল্পের 1 ম পর্যায় উন্নত মানদণ্ডের ভিত্তিতে সাফল্য বা ব্যর্থতা।

এখন, আমি আপনাকে উপরে বর্ণিত বিভিন্ন ধাপগুলি ব্যাখ্যা করতে একটি কেস স্টাডি নেব।

জাভাতে কীভাবে বস্তুর অ্যারে তৈরি করা যায়

কেস স্টাডি: ডায়াবেটিস প্রতিরোধ

আমরা যদি ডায়াবেটিসের প্রকোপটি পূর্বাভাস দিতে পারি এবং এটি প্রতিরোধের জন্য আগে থেকেই যথাযথ ব্যবস্থা গ্রহণ করতে পারি?
এই ব্যবহারের ক্ষেত্রে, আমরা পূর্বে আলোচনা করেছি যে পুরো জীবনচক্রটি ডায়াবেটিস তৈরির ঘটনাটি পূর্বাভাস দেবে। আসুন বিভিন্ন পদক্ষেপের মধ্য দিয়ে যেতে দিন।

ধাপ 1:

  • প্রথম,আমরা চিকিত্সার ইতিহাসের উপর ভিত্তি করে ডেটা সংগ্রহ করবপ্রথম ধাপে আলোচনা করা হিসাবে রোগীর আপনি নীচের নমুনা তথ্য উল্লেখ করতে পারেন।

তথ্য বিজ্ঞানের নমুনা ডেটা - এডুরেকা

  • আপনি দেখতে পাচ্ছেন, নীচে উল্লিখিত হিসাবে আমাদের বিভিন্ন বৈশিষ্ট্য রয়েছে।

বৈশিষ্ট্য:

  1. npreg - গর্ভবতী হওয়ার সংখ্যা
  2. গ্লুকোজ - প্লাজমা গ্লুকোজ ঘনত্ব
  3. বিপি - রক্তচাপ
  4. ত্বক - ট্রাইসেপস স্কিনফোল্ডের বেধ
  5. bmi - বডি মাস ইনডেক্স
  6. পেড - ডায়াবেটিস পেডিগ্রি ফাংশন
  7. বয়স - বয়স
  8. আয় - আয়

ধাপ ২:

  • এখন, একবার আমাদের কাছে ডেটা হয়ে গেলে আমাদের বিশ্লেষণের জন্য ডেটা পরিষ্কার এবং প্রস্তুত করা দরকার prepare
  • এই ডেটাটিতে প্রচুর অসঙ্গতি রয়েছে যেমন হারিয়ে যাওয়া মান, ফাঁকা কলাম, আকস্মিক মান এবং ভুল ডেটা ফর্ম্যাট যা পরিষ্কার করা দরকার।
  • এখানে, আমরা বিভিন্ন বৈশিষ্ট্যের অধীনে একক টেবিলের মধ্যে ডেটা সংগঠিত করেছি - এটি আরও কাঠামোগত দেখায়।
  • আসুন নীচের নমুনা ডেটাটি দেখুন।

ডেটা সায়েন্সের বেমানান ডেটা - এডুরেকা

এই ডেটাতে প্রচুর অসঙ্গতি রয়েছে।

  1. কলামে npreg , 'একটি' লেখা আছেশব্দ,যদিও এটি 1 এর মতো সংখ্যা আকারে হওয়া উচিত।
  2. কলামে বিপি মানগুলির মধ্যে একটি হ'ল 6600 যা অসম্ভব (কমপক্ষে মানুষের পক্ষে) বিপি যেমন বিশাল মান পর্যন্ত যেতে পারে না।
  3. আপনি দেখতে পারেন আয় কলামটি ফাঁকা এবং ডায়াবেটিসের পূর্বাভাস দেওয়ার কোনও মানে নেই। অতএব, এটি এখানে থাকা বাড়াবাড়ি এবং টেবিল থেকে অপসারণ করা উচিত।
  • সুতরাং, আমরা আউটলিয়ারগুলি অপসারণ, নাল মান পূরণ করে এবং ডেটা ধরণের স্বাভাবিককরণের মাধ্যমে এই ডেটাটি পরিষ্কার এবং প্রসেসরোস করব। যদি আপনি মনে রাখেন, এটি আমাদের দ্বিতীয় ধাপ যা ডেটা প্রিপ্রোসেসিং।
  • অবশেষে, আমরা নীচে প্রদর্শিত পরিষ্কার তথ্য পেয়েছি যা বিশ্লেষণের জন্য ব্যবহার করা যেতে পারে।

তথ্য বিজ্ঞানের ধারাবাহিক ডেটা - এডুরেকা

ধাপ 3:

এর আগে ৩ য় ধাপে আলোচনা করা অনুসারে কিছু বিশ্লেষণ করা যাক।

  • প্রথমত, আমরা বিশ্লেষণাত্মক স্যান্ডবক্সে ডেটা লোড করব এবং এটিতে বিভিন্ন পরিসংখ্যানীয় কার্যাদি প্রয়োগ করব। উদাহরণস্বরূপ, আর এর মতো ফাংশন রয়েছে বর্ণনা যা আমাদের অনুপস্থিত মান এবং অনন্য মানগুলির সংখ্যা দেয়। আমরা সংক্ষিপ্ত ফাংশনটিও ব্যবহার করতে পারি যা আমাদের গড়, মধ্যম, পরিসর, ন্যূনতম এবং সর্বাধিক মানগুলির মতো পরিসংখ্যান সম্পর্কিত তথ্য দেবে।
  • তারপরে, আমরা হিস্টোগ্রাম, লাইন গ্রাফ, বাক্স প্লটগুলির মতো ভিজ্যুয়ালাইজেশন কৌশলগুলি ডেটা বন্টন সম্পর্কে ন্যায্য ধারণা পেতে ব্যবহার করি।

ডেটা সায়েন্স ভিজ্যুয়ালাইজেশন - এডুরেকা

পদক্ষেপ 4:

এখন, পূর্ববর্তী পদক্ষেপ থেকে প্রাপ্ত অন্তর্দৃষ্টিগুলির উপর ভিত্তি করে, এই ধরণের সমস্যার জন্য উপযুক্ত উপযুক্ত সিদ্ধান্ত গাছ। দেখা যাক কিভাবে?

  • যেহেতু, বিশ্লেষণের জন্য আমাদের কাছে ইতিমধ্যে প্রধান বৈশিষ্ট্য রয়েছে এনপ্রেগ, বিএমআই , ইত্যাদি, সুতরাং আমরা ব্যবহার করবএকটি তদারকি প্রশিক্ষণ কৌশলমডেল এখানে।
  • তদুপরি, আমরা বিশেষত সিদ্ধান্ত গাছ ব্যবহার করেছি কারণ এটি সমস্ত বৈশিষ্ট্যগুলি একসাথে বিবেচনা করে, যেমনগুলির রয়েছে তার মতোরৈখিক সম্পর্ক এবং সেইসাথে যাদের একটি অ-রৈখিক সম্পর্ক রয়েছে। আমাদের ক্ষেত্রে, আমাদের মধ্যে একটি লিনিয়ার সম্পর্ক রয়েছে npreg এবং বয়স, যেখানে মধ্যাহীন সম্পর্ক রয়েছে npreg এবং প্যাড
  • সিদ্ধান্ত গাছের মডেলগুলিও খুব শক্তিশালী কারণ আমরা বিভিন্ন গাছ তৈরি করতে বিভিন্ন বৈশিষ্ট্যের বিভিন্ন সংমিশ্রণ ব্যবহার করতে পারি এবং শেষ পর্যন্ত সর্বাধিক দক্ষতার সাথে একটিটি বাস্তবায়িত করি।

আসুন আমাদের সিদ্ধান্ত গাছটি একবার দেখুন।

ট্রি ডেটা সেট সেট করুন

এখানে, সর্বাধিক গুরুত্বপূর্ণ প্যারামিটারটি গ্লুকোজের স্তর, সুতরাং এটি আমাদের মূল নোড। এখন, বর্তমান নোড এবং এর মান পরবর্তী গুরুত্বপূর্ণ পরামিতি নেওয়া হবে তা নির্ধারণ করে। আমরা শর্তাবলী ফলাফল না পাওয়া পর্যন্ত এটি চলে পোজ বা নেং । পোজ মানে ডায়াবেটিস হওয়ার প্রবণতা ইতিবাচক এবং নেংটি ডায়াবেটিস হওয়ার প্রবণতা নেতিবাচক।

আপনি যদি সিদ্ধান্তের গাছের প্রয়োগ সম্পর্কে আরও জানতে চান তবে এই ব্লগটি দেখুন

পদক্ষেপ 5:

এই পর্যায়ে, আমরা আমাদের ফলাফল উপযুক্ত কিনা তা পরীক্ষা করতে একটি ছোট পাইলট প্রকল্প চালাব will আমরা পারফর্মেন্সের সীমাবদ্ধতাগুলিও খুঁজছি। ফলাফলগুলি সঠিক না হলে, আমাদের আবার মডেলটি পুনরায় প্রতিস্থাপন এবং পুনর্নির্মাণ করা দরকার।

পদক্ষেপ::

প্রকল্পটি সফলভাবে সম্পাদন করা হয়ে গেলে, আমরা সম্পূর্ণ স্থাপনার জন্য আউটপুটটি ভাগ করব।

জাভা চর অ্যারের ডিফল্ট মান

ডেটা সায়েন্টিস্ট হওয়ার চেয়ে কাজ করা বেশি সহজ। সুতরাং, ডেটা সায়েন্টিস্ট হওয়ার জন্য আপনার কী কী প্রয়োজন তা দেখা যাক।একজন ডেটা সায়েন্টিস্টের মূলত দক্ষতা প্রয়োজননীচে প্রদর্শিত হিসাবে তিনটি প্রধান অঞ্চল থেকে।

ডেটা বিজ্ঞানের দক্ষতা - এডুরেকা

উপরের চিত্রটিতে আপনি দেখতে পাচ্ছেন, আপনাকে বিভিন্ন কঠোর দক্ষতা এবং নরম দক্ষতা অর্জন করতে হবে। আপনি ভাল হতে হবে পরিসংখ্যান এবং গণিত তথ্য বিশ্লেষণ এবং ভিজ্যুয়ালাইজ করতে। বলা বাহুল্য, মেশিন লার্নিং ডেটা সায়েন্সের হৃদয় গঠন করে এবং আপনাকে এটিতে ভাল হওয়া দরকার। এছাড়াও, আপনার সম্পর্কে একটি শক্ত বোঝাপড়া হওয়া দরকার ডোমেইন আপনি ব্যবসায়ের সমস্যাগুলি স্পষ্টভাবে বোঝার জন্য কাজ করছেন। আপনার কাজ এখানেই শেষ হয় না। আপনার বিভিন্ন অ্যালগরিদম প্রয়োগ করতে সক্ষম হওয়া উচিত যা ভাল প্রয়োজন কোডিং দক্ষতা অবশেষে, একবার আপনি কিছু গুরুত্বপূর্ণ সিদ্ধান্ত নিলে আপনার পক্ষে স্টেকহোল্ডারদের কাছে পৌঁছে দেওয়া আপনার পক্ষে গুরুত্বপূর্ণ। খুব ভাল যোগাযোগ অবশ্যই আপনার দক্ষতায় ব্রাউন পয়েন্ট যুক্ত করবে।

আমি আপনাকে এই ডেটা সায়েন্স ভিডিও টিউটোরিয়ালটি দেখার জন্য অনুরোধ করছি যা ডেটা সায়েন্স কী এবং যা আমরা ব্লগে আলোচনা করেছি সেগুলি ব্যাখ্যা করে। এগিয়ে যান, ভিডিও উপভোগ করুন এবং আপনার কী মনে হয় তা বলুন।

ডেটা সায়েন্স কী? ডেটা সায়েন্স কোর্স - নতুনদের জন্য ডেটা সায়েন্স টিউটোরিয়াল | এডুরেকা

এই এডুরেকা ডেটা সায়েন্স কোর্সের ভিডিও আপনাকে ডেটা বিজ্ঞানের প্রয়োজনীয়তা, ডেটা সায়েন্স কী, ব্যবসায়ের জন্য ডেটা সায়েন্স ব্যবহারের কেস, বিআই বনাম ডেটা সায়েন্স, ডেটা অ্যানালিটিক্স সরঞ্জাম, ডেটা বিজ্ঞানের লাইফসাইকেল সহ একটি ডেমো গ্রহণ করবে।

শেষ পর্যন্ত, এটি বলা ভুল হবে না যে ভবিষ্যত ডেটা বিজ্ঞানীদের। এটি পূর্বাভাস দেওয়া হয়েছে যে 2018 সালের শেষের দিকে, প্রায় এক মিলিয়ন ডেটা সায়েন্টিস্টের প্রয়োজন হবে। আরও এবং আরও ডেটা কী ব্যবসায়ের সিদ্ধান্ত নেওয়ার সুযোগ প্রদান করবে। এটি খুব শীঘ্রই আমাদের চারপাশের ডেটাগুলির সাথে বিশ্বকে বিভ্রান্ত করার উপায়ে পরিবর্তন করতে চলেছে। অতএব, একটি ডেটা সায়েন্টিস্টকে সবচেয়ে জটিল সমস্যা সমাধানের জন্য অত্যন্ত দক্ষ এবং অনুপ্রাণিত করা উচিত।

আমি আশা করি আপনি আমার ব্লগটি পড়তে উপভোগ করেছেন এবং ডেটা সায়েন্স কী তা বুঝতে পেরেছেন।আমাদের দেখুন এখানে, প্রশিক্ষকের নেতৃত্বাধীন লাইভ প্রশিক্ষণ এবং বাস্তব জীবনের প্রকল্পের অভিজ্ঞতা নিয়ে আসে।