পাইথনে লজিস্টিক রিগ্রেশন কীভাবে করা যায়?

পাইথনের লজিস্টিক রিগ্রেশন নির্ভর ও এক বা একাধিক স্বতন্ত্র ভেরিয়েবলের মধ্যে সম্পর্ক নির্ধারণ করে ফলাফলটি পূর্বাভাস দেওয়ার জন্য স্কেলার্ন ব্যবহার করে।

পাইথনে লজিস্টিক রিগ্রেশন একটি ভবিষ্যদ্বাণীমূলক বিশ্লেষণ কৌশল। এটি বাইনারি শ্রেণিবদ্ধকরণ সমস্যার জন্য মেশিন লার্নিংয়েও ব্যবহৃত হয়। পাইথনে লজিস্টিক রিগ্রেশন বোঝার জন্য এই ব্লগে আমরা নিম্নলিখিত বিষয়গুলির মধ্য দিয়ে যাব:

  1. রিগ্রেশন কী?
  2. পাইথনে লজিস্টিক রিগ্রেশন
  3. লজিস্টিক রিগ্রেশন বনাম লিনিয়ার রিগ্রেশন
  4. ব্যবহারের ক্ষেত্রে
  5. প্রদর্শন

আপনি আরও ভাল বোঝার জন্য একটি বিক্ষোভ দিয়ে পাইথনে লজিস্টিক রিগ্রেশন সম্পর্কিত এই বিশদ টিউটোরিয়ালটি উল্লেখ করতে পারেন বা এর মধ্য দিয়ে যেতে পারেন লজিস্টিক রিগ্রেশন মাস্টার।





রিগ্রেশন কী?

বিশ্লেষণ একটি শক্তিশালী পরিসংখ্যান বিশ্লেষণ কৌশল। ক নির্ভরশীল আমাদের আগ্রহের পরিবর্তনশীল অন্যের মানগুলি পূর্বাভাস দেওয়ার জন্য ব্যবহৃত হয় স্বাধীন চলক একটি ডেটা সেট।

আমরা সর্বদা একটি স্বজ্ঞাত উপায়ে রিগ্রেশন জুড়ে আসি। অতীতের আবহাওয়ার অবস্থার ডেটা-সেট ব্যবহার করে আবহাওয়ার পূর্বাভাস দেওয়ার মতো।



ফলাফলটি বিশ্লেষণ ও পূর্বাভাস দেওয়ার জন্য এটি অনেক কৌশল ব্যবহার করে তবে জোরটি মূলত এর উপর নির্ভরশীল ভেরিয়েবল এবং এক বা একাধিক স্বতন্ত্র ভেরিয়েবলের মধ্যে সম্পর্ক।

বিশ্লেষণ একটি বাইনারি পরিবর্তনশীল ফলাফলের পূর্বাভাস দেয় যার দুটি মাত্র সম্ভাব্য ফলাফল রয়েছে।



পাইথনে লজিস্টিক রিগ্রেশন

বাইনারি ভেরিয়েবলের ফলাফলটি পূর্বাভাস দেওয়ার জন্য একটি নির্ভরশীল ভেরিয়েবল এবং এক বা একাধিক স্বতন্ত্র ভেরিয়েবল রয়েছে এমন একটি ডেটা-সেট বিশ্লেষণ করার কৌশলটি, যার অর্থ কেবল দুটি ফলাফল থাকবে।

নির্ভরশীল পরিবর্তনশীল শ্রেণিবদ্ধ প্রকৃতিতে. নির্ভরশীল পরিবর্তনশীল হিসাবে উল্লেখ করা হয় লক্ষ্য পরিবর্তনশীল এবং স্বাধীন ভেরিয়েবলগুলি বলা হয় ভবিষ্যদ্বাণীকারী

লজিস্টিক রিগ্রেশন লিনিয়ার রিগ্রেশন-এর একটি বিশেষ কেস যেখানে আমরা কেবল একটি শ্রেণিবদ্ধ পরিবর্তনশীলতে ফলাফলটির পূর্বাভাস দিয়ে থাকি। এটি লগ ফাংশনটি ব্যবহার করে ইভেন্টের সম্ভাবনার পূর্বাভাস দেয়।

আমরা ব্যবহার করি সিগময়েড ফাংশন / বক্ররেখা শ্রেণিবদ্ধ মান পূর্বাভাস। প্রান্তিক মান ফলাফল নির্ধারণ করে (জয় / হারা)।

লিনিয়ার রিগ্রেশন সমীকরণ: y = β0 + β1X1 + X2X2…। + এনএক্সএন

  • ওয়াই হ'ল নির্ভরশীল পরিবর্তনশীল যা ভবিষ্যদ্বাণী করা দরকার।
  • β0 হ'ল ওয়াই-ইন্টারসেপ্ট, যা মূলত লাইনের পয়েন্ট যা y- অক্ষকে স্পর্শ করে।
  • β1 হ'ল লাইনের opeাল (নির্ভরশীল পরিবর্তনশীল এবং স্বতন্ত্র ভেরিয়েবলের মধ্যে সম্পর্কের উপর নির্ভর করে theাল negativeণাত্মক বা ধনাত্মক হতে পারে))
  • এক্স এখানে স্বতন্ত্র ভেরিয়েবলের প্রতিনিধিত্ব করে যা আমাদের ফলাফল নির্ভরশীল মানটির পূর্বাভাস দিতে ব্যবহৃত হয়।

সিগময়েড ফাংশন: পি = 1/1 + ই-ওয়াই

লিনিয়ার রিগ্রেশন সমীকরণে সিগময়েড ফাংশন প্রয়োগ করুন।

পাইথন-এডুরেকাতে লজিস্টিক রিগ্রেশন

লজিস্টিক রিগ্রেশন সমীকরণ: পি = 1/1 + ই- (β0 + β1X1 + X2X2…। + XnXn)

বিভিন্ন ধরণের লজিস্টিক রিগ্রেশনকে একবার দেখে নেওয়া যাক।

লজিস্টিক রিগ্রেশন প্রকার

রবি রেল ওয়েবসাইট টিউটোরিয়াল
    • বাইনারি লজিস্টিক রিগ্রেশন - এটির মাত্র দুটি সম্ভাব্য ফলাফল রয়েছে। উদাহরণ- হ্যাঁ বা না
    • বহুজাতিক লজিস্টিক রিগ্রেশন - এটিতে তিন বা ততোধিক নামমাত্র বিভাগ রয়েছে x উদাহরণ- বিড়াল, কুকুর, হাতি।
    • সাধারণ লজিস্টিক রিগ্রেশন- এর তিন বা ততোধিক অর্ডিনাল বিভাগ রয়েছে, অর্ডিনাল অর্থ যে বিভাগগুলি একটি ক্রমে থাকবে। উদাহরণ- ব্যবহারকারীর রেটিং (1-5)।

লিনিয়ার বনাম লজিস্টিক রিগ্রেশন

লিনিয়ার রিগ্রেশন থাকতে পারে অসীম সম্ভাব্য মান, লজিস্টিক রিগ্রেশন আছে নির্দিষ্ট ফলাফল

প্রতিক্রিয়া পরিবর্তনশীল প্রকৃতির ক্রমাগত চলতে থাকলে লিনিয়ার রিগ্রেশন ব্যবহৃত হয়, তবে প্রতিক্রিয়ার ভেরিয়েবল প্রকৃতির ক্ষেত্রে শ্রেণিবদ্ধ হলে লজিস্টিক রিগ্রেশন ব্যবহৃত হয়।

অতীতে লেনদেনের বিবরণ ব্যবহার করে কোনও ব্যাংকে খেলাপি হওয়ার পূর্বাভাস দেওয়া লজিস্টিক রিগ্রেশনের উদাহরণ, যখন শেয়ার বাজারের স্কোরের মতো অবিচ্ছিন্ন আউটপুট লিনিয়ার রিগ্রেশনের উদাহরণ।

ব্যবহারের ক্ষেত্রে

নিম্নলিখিতগুলি ব্যবহারের ক্ষেত্রে নিম্নরূপ যেখানে আমরা লজিস্টিক রিগ্রেশন ব্যবহার করতে পারি।

আবহাওয়া ভবিষ্যদ্বাণী

আবহাওয়ার পূর্বাভাসগুলি লজিকাল রিগ্রেশনের ফলাফল। এখানে আমরা পূর্ববর্তী আবহাওয়ার প্রতিবেদনের ডেটা বিশ্লেষণ করি এবং নির্দিষ্ট দিনের সম্ভাব্য ফলাফলের পূর্বাভাস দিয়ে থাকি। কিন্তু লজিকাল রিগ্রেশন কেবল শ্রেণিবদ্ধ তথ্যগুলির পূর্বাভাস দেবে, যেমন বৃষ্টি হচ্ছে বা না যায় like

অসুস্থতা নির্ধারণ করা

আমরা পারিব্যবহারযৌক্তিক রিগ্রেশন রোগীর চিকিত্সা ইতিহাসের সাহায্যে ভবিষ্যদ্বাণী করা অসুস্থতা কোনও ক্ষেত্রেই ইতিবাচক বা নেতিবাচক কিনা তা অনুমান করার জন্য।

লজিস্টিক রিগ্রেশন ব্যবহার করে ভবিষ্যদ্বাণী মডেল তৈরি করতে একটি নমুনা ডেটা-সেট নিতে দেয়।

ডেমো

আমরা একটি পূর্বাভাস মডেল তৈরি করতে যাচ্ছিব্যবহারসাহায্যে পাইথনে লজিকাল রিগ্রেশনএরএকটি ডেটাসেট,এইলজিকাল রিগ্রেশন অর্জনের জন্য আমরা নিম্নলিখিত পদক্ষেপগুলি কভার করতে চলেছি।

তথ্য সংগ্রহ

লজিস্টিক রিগ্রেশন বাস্তবায়নের প্রথম ধাপটি হ'ল ডেটা সংগ্রহ করা। আমরা প্যান্ডা ব্যবহার করে প্রোগ্রামগুলিতে ডেটা-সেটযুক্ত সিএসভি ফাইলটি লোড করব। আমরা প্রাসঙ্গিক ডেটাগুলির মধ্যে সম্পর্কের বিশ্লেষণ করে হোম গেম বা অ্যাওয়ে গেমের সম্ভাবনা পূর্বাভাস দেওয়ার জন্য ভবিষ্যদ্বাণী মডেল তৈরির জন্য এনবিএ ডেটা ব্যবহার করছি।

পিডি হিসাবে আমদানি নন্ডিকে পিপি আমদানি করুন এনপি আমদানি সমুদ্র সৈকত হিসাবে এসএনএস আমদানি matplotlib.pyplot হিসাবে plt df = পিডি.ড্রেড_সিএসভি (আর'সি: ব্যবহারকারীমোহাম্মদওয়াসিমডোকমেন্টসডাটা সিএসভি ') মুদ্রণ (df.head (5%))

সহজ বিশ্লেষণের জন্য আপনি সমস্ত ডেটা পাঠযোগ্য বিন্যাসে পাবেন। এবং তারপরে আপনি আপনার মডেলের জন্য নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলগুলি নির্ধারণ করতে পারবেন।

তথ্য বিশ্লেষণ

ভেরিয়েবলের মধ্যে সম্পর্ক নির্ধারণের জন্য ডেটা-সেট বিশ্লেষণ করা হয়। ভেরিয়েবলের মধ্যে সম্পর্ক পরীক্ষা করতে বিভিন্ন প্লট তৈরি করে।

sns.countplot ('হোম', হু = 'WINorLOSS', তথ্য = df) plt.show ()

উপরে হোম / অ্যাওয়ে গেমের সাথে জয়ের / হারের শতাংশের মধ্যে সম্পর্ক রয়েছে। এসimilarlyআমরা ডেটাতে অন্যান্য প্রাসঙ্গিক এন্ট্রিগুলির মধ্যে সম্পর্কের গ্রাফটি প্লট করতে পারি।

ডেটা র‌্যাংলিং

ডেটা সেটটি টার্গেট ভেরিয়েবল অনুযায়ী সংশোধিত হয়। আমরা ডেটা ফ্রেম থেকে সমস্ত নাল মান এবং স্ট্রিংয়ের মানগুলি মুছে ফেলব।

স্নাতকোত্তর ডিপ্লোমা বনাম স্নাতকোত্তর ডিগ্রি
মুদ্রণ (df.isnull ()। যোগফল ())

আমরা সমস্ত অপ্রাসঙ্গিক ডেটা যেমন নাল মান এবং যে মানগুলি পূর্বাভাস মডেলটি তৈরি করার সময় প্রয়োজন হবে না তা পরীক্ষা করব। আমরা যে এনবিএ ডেটাসেটটি ব্যবহার করছি তাতে যদি কোনও নাল মান না থাকে তবে আমরা ডেটা বিভক্ত করে এগিয়ে যাব।

পরীক্ষা এবং ট্রেনের ডেটা

মডেলটির পারফরম্যান্সের জন্য ডেটা পরীক্ষার ডেটা এবং ট্রেনের ডেটাতে বিভক্ত হয়। ডেটা ব্যবহার করে বিভক্ত হয় ট্রেন_স্টেস্ট_স্প্লিট । এখানে ডেটা 70:30 অনুপাতে বিভক্ত।

এখন, জন্য মডেল পূর্বাভাস লজিস্টিক রিগ্রেশন ফাংশনটি স্ক্লার্ন মডিউলটিতে লজিস্টিক রিগ্রেশন মডেল আমদানি করে প্রয়োগ করা হয়।

মডেলটি তখন ফিট ফাংশনটি ব্যবহার করে ট্রেনের সেটে ফিট হয়ে যায়। এর পরে ভবিষ্যদ্বাণীটি পূর্বাভাস ফাংশন ব্যবহার করে সঞ্চালিত হয়।

sklearn.model_selection আমদানি ট্রেন_স্টেট_স্প্লিট থেকে sklearn.linear_model আমদানি লজিস্টিক রিগ্রেশন sklearn.metics থেকে আমদানি করুন শ্রেণিবদ্ধকরণ_পরিবহন আমদানি বিভ্রান্তি_ম্যাট্রিক্স, নির্ভুলতা_স্কোর x = df.rod ('হোম', অক্ষ = 1) y = df ['হোম'] x_train, এক্স_স্টেস্ট, y_train, y_test = ট্রেন_েস্ট_স্প্লিট (x, y, টেস্ট_সাইজ = 0.33, র্যান্ডম_স্টেট = 1) লগমডেল = লজিস্টিক রিগ্রেশন () লগমডেল.ফিট (x_train, y_train) পূর্বাভাস = লগমডেল.প্রেডিক্ট (এক্স_স্টেট) প্রিন্ট (y_test, পূর্বে) মুদ্রণ (বিভ্রান্তি_ম্যাট্রিক্স (y_est, পূর্বাভাস)) মুদ্রণ (নির্ভুলতা_স্কোর (y_ সর্বশেষ, পূর্বাভাস))

শ্রেণিবিন্যাস রিপোর্ট:

শ্রেণিবিন্যাসের প্রতিবেদনটি প্রদর্শন করে যথার্থতা , পুনরায় কল করুন, এফ 1 এবং সমর্থন মডেল জন্য স্কোর।

যথার্থতা স্কোর মানে এমন একটি স্তর যা মডেল দ্বারা করা পূর্বাভাসটি যথাযথ। একটি হোম গেম জন্য নির্ভুলতা হয় 0.62 এবং দূরে খেলা জন্য 0.58

স্মরণ করুন মডেলটি ফলাফলের পূর্বাভাস দিতে পারে এমন পরিমাণ। একটি হোম গেম জন্য রিকল 0.57 এবং একটি দূরে খেলা জন্য 0.64 । F1 এবং সমর্থন স্কোরগুলি ভবিষ্যদ্বাণীগুলির জন্য পরীক্ষিত ডেটার পরিমাণ। এনবিএ ডেটা-সেট-এ হোম গেমের জন্য পরীক্ষিত ডেটা হয় 1662 এবং দূরে খেলা জন্য 1586

বিভ্রান্তির ম্যাট্রিক্স:

কনফিউশন ম্যাট্রিক্স একটি টেবিল যা পূর্বাভাস মডেলের কর্মক্ষমতা বর্ণনা করে। একটি বিভ্রান্তির ম্যাট্রিক্সে আসল মান এবং পূর্বাভাসিত মান থাকে। আমরা এই মানগুলি মডেলের যথার্থতা স্কোর গণনা করতে ব্যবহার করতে পারি।

কনফিউশন ম্যাট্রিক্স হিটম্যাপ:

সমুদ্র সৈকত এবং ব্যবহার করে বিভ্রান্তির ম্যাট্রিক্সের তাপ-মানচিত্রের প্লট করতে দেয় আমরা যে ভবিষ্যদ্বাণী মডেলটি তৈরি করেছি তা কল্পনা করতে। হিটম্যাপ প্লট করার জন্য, নিম্নলিখিত সিনট্যাক্সটি প্রয়োজনীয়।

sns.heatmap (pd.DataFrame (কনফিউশন_ম্যাট্রিক্স (y_est, পূর্বাভাস))) plt.show ()

হিটম্যাপটি দেখে আমরা নিম্নলিখিতগুলি উপসংহার করতে পারি:

  • সমস্ত পূর্বাভাসগুলির মধ্যে, শ্রেণিবদ্ধকারী মোট 1730 বার হ্যাঁ পূর্বাভাস দিয়েছিল, যার মধ্যে 1012 প্রকৃত হ্যাঁ।
  • সমস্ত পূর্বাভাসগুলির মধ্যে, শ্রেণিবদ্ধকারী মোট 1518 বারের জন্য কোনটির পূর্বাভাস দিয়েছিল, যার মধ্যে 944 প্রকৃত সংখ্যা ছিল।

বিভ্রান্তির ম্যাট্রিক্সের এই বিশ্লেষণের সাথে আমরা আমাদের পূর্বাভাস মডেলের যথার্থতা স্কোরটি উপসংহার করতে পারি।

যথার্থ স্কোর:

সঠিকতা স্কোর হ'ল মডেল দ্বারা করা ভবিষ্যদ্বাণীগুলির নির্ভুলতার শতাংশ। আমাদের মডেলটির জন্য নির্ভুলতার স্কোর 0.60, যা যথেষ্ট পরিমাণে সঠিক। তবে যত বেশি নির্ভুলতার স্কোর দক্ষতার সাথে আপনি ভবিষ্যদ্বাণী মডেল। উন্নত পূর্বাভাস মডেলের জন্য আপনার অবশ্যই সর্বদা উচ্চতর নির্ভুলতার স্কোরের লক্ষ্য রাখতে হবে।

উপরে আলোচিত পদক্ষেপগুলি অনুসরণ করে, আমরা এনবিএ ডেটাसेट ব্যবহার করে হোম / অ্যাওয়ে গেমের সম্ভাবনা পূর্বাভাস দিয়েছি। শ্রেণিবিন্যাসের প্রতিবেদন বিশ্লেষণ করার পরে আমরা হোম / অ্যাওয়ে গেমের সম্ভাবনাটি ধরে নিতে পারি।

এই ব্লগে আমরা পাইথন ধারণাগুলিতে লজিস্টিক রিগ্রেশন নিয়ে আলোচনা করেছি, এটি লিনিয়ার পদ্ধতির থেকে কীভাবে আলাদা। এছাড়াও, আমরা এনবিএ ডেটাসেট ব্যবহার করে একটি বিক্ষোভ coveredেকে রেখেছি। আরও অন্তর্দৃষ্টি এবং অনুশীলনের জন্য, আপনি আপনার পছন্দের একটি ডেটাসেট ব্যবহার করতে পারেন এবং পাইথনে লজিস্টিক রিগ্রেশন প্রয়োগের জন্য আলোচিত পদক্ষেপগুলি অনুসরণ করতে পারেন।

এছাড়াও, আপনার মধ্যে ডেটা সায়েন্টিস্টকে আয়ত্ত করার জন্য এডুরেকা প্ল্যাটফর্মের বিভিন্ন ডেটা-সায়েন্স ব্লগ চেকআউট করুন।

আপনি যদি পাইথন শিখতে এবং ডেটা সায়েন্সে ক্যারিয়ার গড়তে চান তবে আমাদের ইন্টারেক্টিভ, লাইভ-অনলাইন দেখুন check এখানে, এটি আপনার পড়াশোনার পুরো সময় জুড়ে আপনাকে গাইড করার জন্য 24 * 7 সমর্থন সহ আসে।
একটি প্রশ্ন আছে? দয়া করে মন্তব্যে এটি উল্লেখ করুন এবং আমরা আপনার কাছে ফিরে আসব।