মেশিন লার্নিংয়ের জন্য লিনিয়ার রিগ্রেশন কীভাবে প্রয়োগ করা যায়?

এই নিবন্ধটি বিভিন্ন পরিভাষাগুলির সাথে মেশিন লার্নিংয়ের জন্য লিনিয়ার রিগ্রেশন এবং লিনিয়ার রিগ্রেশন প্রয়োগের ক্ষেত্রে ব্যবহারের ক্ষেত্রে ধারণার অন্তর্ভুক্ত করে।

এর ফোকাস ফলাফলের পূর্বাভাস দেওয়ার জন্য একটি অ্যালগরিদম ব্যবহার করে ইনপুট এবং আউটপুট ভেরিয়েবলের চারদিকে ঘোরে। যদি কোনও নতুন ইনপুট পরিবর্তনশীল ছবিতে আসে। লিনিয়ার রিগ্রেশন অ্যালগোরিদম ইন সেরা পূর্বাভাস পাওয়ার জন্য ম্যাপিং ফাংশনটি আনুমানিক করার জন্য একটি তদারকি শেখার কৌশল। এই নিবন্ধে, আমরা মেশিন লার্নিংয়ের জন্য লিনিয়ার রিগ্রেশন সম্পর্কে শিখব। নিম্নলিখিত বিষয়গুলি এই ব্লগে আলোচনা করা হয়েছে।



রিগ্রেশন কী?

রিগ্রেশনটির মূল লক্ষ্য হ'ল গুচ্ছের অ্যাট্রিবিউট ভেরিয়েবল থেকে নির্ভরশীল গুণাবলীটি পূর্বাভাস দেওয়ার জন্য একটি দক্ষ মডেল তৈরি করা। একটি আধিপত্য সমস্যা হ'ল আউটপুট পরিবর্তনশীল হয় আসল বা একটি অবিচ্ছিন্ন মান অর্থাত বেতন, ওজন, অঞ্চল ইত্যাদি,



আমরা রিগ্রেশনকে সংখ্যাতাত্ত্বিক উপায় হিসাবেও সংজ্ঞায়িত করতে পারি যা আবাসন, বিনিয়োগ ইত্যাদির মতো অ্যাপ্লিকেশনগুলিতে ব্যবহৃত হয় এটি নির্ভরশীল ভেরিয়েবল এবং স্বতন্ত্র ভেরিয়েবলগুলির একটি গুচ্ছের মধ্যে সম্পর্কের পূর্বাভাস দেওয়ার জন্য ব্যবহৃত হয়। আসুন দেখে নিই বিভিন্ন ধরণের রিগ্রেশন কৌশল।

উদাহরণস্বরূপ - মেশিন লার্নিংয়ে লিনিয়ার রিগ্রেশন - এডুরেকা

রিগ্রেশন প্রকারের

নীচে রিগ্রেশন ধরনের হয়।



  1. সহজ রৈখিক নির্ভরণ
  2. পলিনোমিয়াল রিগ্রেশন
  3. সমর্থন ভেক্টর রিগ্রেশন
  4. সিদ্ধান্ত গাছ রিগ্রেশন
  5. র্যান্ডম ফরেস্ট রিগ্রেশন

সহজ রৈখিক নির্ভরণ

সবচেয়ে আকর্ষণীয় এবং সাধারণ রিগ্রেশন কৌশলগুলির মধ্যে একটি সহজ লিনিয়ার রিগ্রেশন। এর মধ্যে আমরা স্বাধীন ভেরিয়েবলের উপর নির্ভরশীল নির্ভরশীল ভেরিয়েবলের ফলাফলের পূর্বাভাস দিই, ভেরিয়েবলগুলির মধ্যে সম্পর্ক লিনিয়ার। সুতরাং, লিনিয়ার রিগ্রেশন শব্দটি।

পলিনোমিয়াল রিগ্রেশন

এই রিগ্রেশন কৌশলটিতে আমরা মূল বৈশিষ্ট্যগুলিকে একটি নির্দিষ্ট ডিগ্রির বহিরাগত বৈশিষ্ট্যে রূপান্তর করি এবং তারপরে এটিতে রিগ্রেশন করি।

সমর্থন ভেক্টর রিগ্রেশন

জন্য রিগ্রেশন বা এসভিআর, আমরা একটি হাইপারপ্লেনকে সর্বাধিক মার্জিনের সাথে চিহ্নিত করি যাতে সর্বাধিক সংখ্যক ডেটা পয়েন্ট সেই মার্জিনের মধ্যে থাকে। এটি সমর্থন ভেক্টর মেশিনের শ্রেণিবদ্ধকরণ অ্যালগরিদমের সাথে বেশ মিল।



সিদ্ধান্ত গাছ রিগ্রেশন

প্রতি উভয় প্রতিরোধের জন্য এবং ব্যবহার করা যেতে পারে । রিগ্রেশনের ক্ষেত্রে, আমরা স্ট্যান্ডার্ড বিচ্যুতি হ্রাস করে বিভাজন নোড চিহ্নিত করতে ID3 অ্যালগরিদম (Iterative Dichotomiser 3) ব্যবহার করি)

র্যান্ডম ফরেস্ট রিগ্রেশন

এলোমেলোভাবে বন নিগ্রহের ক্ষেত্রে, আমরা বেশ কয়েকটি সিদ্ধান্ত গাছের রিগ্রেশনগুলির পূর্বাভাসগুলি জুড়ে দিই। এখন যেহেতু আমরা বিভিন্ন ধরণের রিগ্রেশন সম্পর্কে জানি তা আসুন আমরা সরল লিনিয়ার রিগ্রেশনকে বিশদে দেখি।

লিনিয়ার রিগ্রেশন কী?

সাধারণ লিনিয়ার রিগ্রেশন একটি রিগ্রেশন কৌশল যা স্বাধীন ভেরিয়েবলের সাথে নির্ভরশীল ভেরিয়েবলের সাথে লিনিয়ার সম্পর্ক থাকে। ডায়াগ্রামের সরল রেখাটি সেরা ফিট লাইন। সাধারণ লিনিয়ার রিগ্রেশনটির প্রধান লক্ষ্য প্রদত্ত ডেটা পয়েন্টগুলি বিবেচনা করা এবং মডেলটিকে সর্বোত্তম উপায়ে ফিট করার জন্য সেরা ফিট লাইনটি প্লট করা।

লিনিয়ার রিগ্রেশন অ্যালগরিদম কীভাবে কাজ করে তা নিয়ে যাওয়ার আগে, আসুন সরল রৈখিক প্রতিরোধের কয়েকটি গুরুত্বপূর্ণ পরিভাষা দেখে নেওয়া যাক।

লিনিয়ার রিগ্রেশন টার্মিনোলজস

লিনিয়ার রিগ্রেশন অ্যালগরিদমের দিকে এগিয়ে যাওয়ার আগে নিম্নলিখিত পরিভাষাগুলির সাথে পরিচিত হওয়া গুরুত্বপূর্ণ।

ব্যয় কার্যকারিতা

সেরা ফিট লাইনটি নীচে দেওয়া লিনিয়ার সমীকরণের ভিত্তিতে তৈরি করা যেতে পারে।

  • যে নির্ভরশীল পরিবর্তনশীলটি ভবিষ্যদ্বাণী করতে হবে তা ওয়াই দ্বারা চিহ্নিত করা হয়েছে।
  • একটি রেখা যা y- অক্ষকে স্পর্শ করে তা বিরতি খ দ্বারা চিহ্নিত করা হয়0
  • একরেখার theাল, x হল স্বাধীন পরিবর্তনশীল যা Y এর ভবিষ্যদ্বাণী নির্ধারণ করে represents
  • ফলাফল পূর্বাভাসের ত্রুটিটি ই দ্বারা চিহ্নিত করা হয়েছে।

ব্যয়ের কার্যটি বিয়ের জন্য সর্বোত্তম সম্ভাব্য মান সরবরাহ করে0এবং খএকডেটা পয়েন্টগুলির জন্য সেরা ফিট লাইন তৈরি করতে। খ-এর সর্বোত্তম মানগুলি পেতে আমরা এই সমস্যাটিকে একটি ক্ষুদ্রাকরণের সমস্যায় রূপান্তর করেই করি0এবং খএক। প্রকৃত মান এবং পূর্বাভাসিত মানের মধ্যে এই সমস্যাটিতে ত্রুটিটি হ্রাস করা হয়।

ত্রুটি হ্রাস করতে আমরা উপরের ফাংশনটি নির্বাচন করি। আমরা ত্রুটির পার্থক্যটি বর্গক্ষেত্র করি এবং সমস্ত ডেটা পয়েন্টের উপর ত্রুটিটি যোগ করি, ডাটা পয়েন্টের মোট সংখ্যার মধ্যে বিভাজন। তারপরে, উত্পাদিত মান সমস্ত ডেটা পয়েন্টের তুলনায় গড় বর্গ ত্রুটি সরবরাহ করে।

এটি এমএসই (মীন স্কোয়ার্ড ত্রুটি) নামেও পরিচিত এবং আমরা খ এর মান পরিবর্তন করি0এবং খএকযাতে এমএসই মান সর্বনিম্ন স্থিত হয়।

জাভা মধ্যে প্রাথমিক তথ্য কাঠামো

গ্রেডিয়েন্ট বংশোদ্ভূত

লিনিয়ার রিগ্রেশন বোঝার পরবর্তী গুরুত্বপূর্ণ পরিভাষা হ'ল গ্রেডিয়েন্ট বংশোদ্ভূত। এটি খ আপডেট করার একটি পদ্ধতি0এবং খএকএমএসই হ্রাস করার মান। এর পিছনে ধারণাটি হচ্ছে খ এর পুনরাবৃত্তি করা0এবং খএকআমরা এমএসইকে সর্বনিম্ন পর্যন্ত হ্রাস না করা পর্যন্ত মানগুলি।

আপডেট করতে খ0এবং খএক, আমরা ব্যয় ফাংশন থেকে গ্রেডিয়েন্ট নিতে। এই গ্রেডিয়েন্টগুলি সন্ধান করতে, আমরা খ এর সাথে আংশিক ডেরিভেটিভ নিয়ে থাকি0এবং খএক। এই আংশিক ডেরাইভেটিভগুলি গ্রেডিয়েন্ট এবং খ এর মান আপডেট করার জন্য ব্যবহৃত হয়0এবং খএক

একটি ছোট শিক্ষার হার সর্বনিম্নের কাছাকাছি সময় নেয় তবে এটি আরও বেশি সময় এবং বৃহত্তর শিক্ষার হারের ক্ষেত্রে লাগে। সময় নেওয়া খুব তাড়াতাড়ি তবে ন্যূনতম মানটি ছাপিয়ে যাওয়ার সুযোগ রয়েছে। এখন যেহেতু আমরা লিনিয়ার রিগ্রেশনটির টার্মিনোলজগুলি দিয়ে যাচ্ছি, আসুন আমরা মেশিন লার্নিংয়ের জন্য রৈখিক প্রতিরোধের কয়েকটি সুবিধা এবং অসুবিধাগুলি একবার দেখে নিই।

সুবিধাগুলি এবং অসুবিধাগুলি

সুবিধাদি অসুবিধা
রৈখিক পৃথকীকরণযোগ্য ডেটার জন্য লিনিয়ার রিগ্রেশন ব্যতিক্রমীভাবে ভাল সম্পাদন করেনির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলের মধ্যে রৈখিকতার অনুমান
কার্যকর করা সহজতর, ব্যাখ্যা করা এবং প্রশিক্ষণের জন্য দক্ষএটি প্রায়শই শব্দ এবং অত্যধিক মানানসই প্রবণ হয়ে থাকে
এটি মাত্রিকভাবে হ্রাস কৌশলগুলি, নিয়মিতকরণ এবং ক্রস-বৈধকরণ ব্যবহার করে বেশ ভালভাবে পরিচালনা করেলিনিয়ার রিগ্রেশন আউটলিয়ারদের পক্ষে যথেষ্ট সংবেদনশীল
আরও একটি সুবিধা হ'ল নির্দিষ্ট ডেটা সেট ছাড়িয়ে এক্সট্রাপোলেশনএটি বহুবিধরনের প্রবণ

লিনিয়ার রিগ্রেশন ব্যবহারের ক্ষেত্রে

  • বিক্রয় পূর্বাভাস

  • ঝুঁকি বিশ্লেষণ

  • হাউজিং অ্যাপ্লিকেশনগুলি মূল্য এবং অন্যান্য কারণগুলির পূর্বাভাস দিতে

  • শেয়ারের দাম, বিনিয়োগের মূল্যায়ন ইত্যাদির পূর্বাভাস দেওয়ার জন্য ফিনান্স অ্যাপ্লিকেশন

লিনিয়ার রিগ্রেশন পেছনের মূল ধারণাটি নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলের মধ্যে সম্পর্ক সন্ধান করা। এটি সেরা ফিটিং লাইন পেতে ব্যবহৃত হয় যা সর্বনিম্ন ত্রুটির সাথে ফলাফলের পূর্বাভাস দেয়। অধ্যয়নের সময় এবং অন্যান্য নির্ধারক কারণগুলির সাথে স্যাট স্কোরগুলির পূর্বাভাস দেওয়ার মতো আমরা সাধারণ বাস্তব-জীবনে পরিস্থিতিতে লিনিয়ার রিগ্রেশন ব্যবহার করতে পারি।

এটি মাথায় রেখে, আসুন আমরা ব্যবহারের ক্ষেত্রে একবার দেখে নিই।

কেস ব্যবহার করুন - লিনিয়ার রিগ্রেশন প্রয়োগ করা হচ্ছে

প্রক্রিয়া নিম্নলিখিত পদক্ষেপে সঞ্চালিত হয়:

  1. ডেটা লোড হচ্ছে
  2. ডেটা এক্সপ্লোর করে
  3. উপাত্ত কাটা
  4. ট্রেন এবং স্প্লিট ডেটা
  5. মডেল উত্পন্ন
  6. নির্ভুলতার মূল্যায়ন করুন

লিনিয়ার রিগ্রেশন বাস্তবায়নের প্রতিটি পদক্ষেপের বিশদটি আসুন।

1. ডেটা লোড হচ্ছে

লিনিয়ার রিগ্রেশন দিয়ে আমাদের যাত্রা শুরু করার জন্য আমরা স্ক্যালার্ন (সাইকিট-শিখুন) ডেটা সেট মডিউলটিতে উপস্থিত বেসিক ডায়াবেটিস ডেটা সেট দিয়ে শুরু করতে পারি।

স্কলারন আমদানি ডেটাসেট রোগ থেকে = ডেটাসেট.লোড_ডায়াবেটিস () মুদ্রণ (রোগ)

আউটপুট:

2. ডেটা অন্বেষণ

আমরা ডেটা লোড করার পরে, আমরা নিম্নলিখিত কোডগুলি ব্যবহার করে কেবলমাত্র লেবেলগুলি পরীক্ষা করে অনুসন্ধান শুরু করতে পারি।

মুদ্রণ (রোগ.কিজ ())

আউটপুট:

উপরের কোডটি ডেটা সেট থেকে সমস্ত লেবেল দেয়, এর পরে, আমরা ডেটা স্লাইস করতে পারি যাতে আমরা শেষ পর্যন্ত লাইনটি প্লট করতে পারি। আমরা সমস্ত ডেটা পয়েন্টও ব্যবহার করব, আপাতত, আমরা তথ্য থেকে কলাম 2 স্লাইস করব।

কিভাবে একটি tostring পদ্ধতি লিখতে
এনপি রোগ_এক্স = রোগ.ডাটা হিসাবে নাম্বার আমদানি করুন [:, np.newaxis, 2] মুদ্রণ (রোগ_এক্স)

আউটপুট:

এই পদক্ষেপের পরে, আমরা ডেটাগুলিকে ট্রেন এবং পরীক্ষার সেটে ভাগ করব।

3. ডেটা বিভক্ত করা

রোগ_এক্স_ট্রেইন = রোগ_ এক্স [: - 30] রোগ_এক্স_টেষ্ট = রোগ_এক্স [-20:] রোগ_ওয়াই_ট্রেন = রোগ.টারাজেট [: - 30] রোগ_ওয়াই_টেষ্ট = রোগ.আরকেট [-20:]

পরবর্তী অংশে মডেল তৈরি করা জড়িত, যার মধ্যে স্কারার থেকে লিনিয়ার_মডেল আমদানি করা অন্তর্ভুক্ত থাকবে।

4. মডেল উত্পাদন

স্কলারন আমদানি লিনিয়ার_মডেল রেগ থেকে = লিনিয়ার_মডেল.লাইনারআগ্রেশন () রেগফিট (রোগ_এক্স_ট্রেন, রোগ_ওয়াই_ট্রেন) y_predict = reg.predict (রোগ_এক্স_টেষ্ট)

মডেলের যথার্থতাটি মূল্যায়নের জন্য, আমরা সাইকিট-লার্ন থেকে গড় স্কোয়ার ত্রুটিটি ব্যবহার করব।

5. মূল্যায়ন

নির্ভুলতা = গড়_সোখার_অরর (রোগ_ওয়াই_তম, y_predict,) মুদ্রণ (নির্ভুলতা) ওজন = reg.coef_ ইন্টারসেপ্ট = reg.intercep_ মুদ্রণ (ওজন, বিরতি)

আউটপুট:

ডাটা পয়েন্টগুলি গ্রাফের মতো দেখতে কেমন তা আরও স্পষ্ট করার জন্য, আসুন আমরা গ্রাফগুলিও প্লট করব।

প্ল্যাট প্লট.স্যাটার (রোগ_এক্স_তম, রোগ_ওয়াই_স্টেস্ট) প্লট.প্লট (রোগ_এক্স_তম, y_predict) plt.show () হিসাবে matplotlib.pyplot আমদানি করুন

আউটপুট:

এই দৃশ্যে আরও সঠিক মডেলটি পেতে, আমরা কেবলমাত্র কলাম 2 এর পরিবর্তে পুরো ডেটাটি ব্যবহার করতে পারি যা নীচে দেখানো মত একটি নির্ভুলতা দেবে:

# উপরের কোডটিতে কিছুটা পরিবর্তন আনুন এবং ত্রুটিজনিত রোগ থেকে বাঁচতে প্লটিং কোডটি সরান disease

আউটপুট:

এটি আমাদের এই নিবন্ধের শেষে নিয়ে আসে যেখানে আমরা মেশিন লার্নিংয়ের জন্য লিনিয়ার রিগ্রেশন সম্পর্কে শিখেছি। আমি আশা করি এই টিউটোরিয়ালে আপনার সাথে যা ভাগ করা হয়েছে তার সাথে আপনি পরিষ্কার হয়ে গেছেন।

আপনি যদি 'মেশিন লার্নিংয়ের জন্য লিনিয়ার রিগ্রেশন' সম্পর্কিত এই নিবন্ধটি প্রাসঙ্গিক পেয়ে থাকেন তবে এটি দেখুন check বিশ্বজুড়ে ছড়িয়ে থাকা 250,000 এরও বেশি সন্তুষ্ট শিক্ষার্থীর নেটওয়ার্ক সহ একটি বিশ্বস্ত অনলাইন লার্নিং সংস্থা।

যদি আপনার কোনও প্রশ্ন আসে তবে 'মেশিন লার্নিংয়ের জন্য লিনিয়ার রিগ্রেশন' এর মন্তব্য বিভাগে আপনার সমস্ত প্রশ্ন জিজ্ঞাসা করতে দ্বিধা বোধ করবেন এবং আমাদের দলটি উত্তর দিতে পেরে খুশি হবে।