KDD اور ڈیٹا کان کنی کے درمیان فرق

Anonim

KDD بمقابلہ ڈیٹا کان کنی

KDD (ڈیٹا بیس میں علم کی دریافت) کمپیوٹر سائنس کا میدان ہے ڈائلڈائزڈ ڈیٹا کے بڑے مجموعہ سے فائدہ مند اور پہلے سے نامعلوم معلومات (یعنی علم) نکالنے میں انسانوں کی مدد کرنے کے لئے آلات اور نظریات شامل ہیں. KDD کئی مرحلے پر مشتمل ہے، اور ڈیٹا کان کنی ان میں سے ایک ہے. اعداد و شمار سے پیٹرن نکالنے کے لئے ڈیٹا کان کنی ایک مخصوص الگورتھم کی درخواست ہے. اس کے باوجود، KDD اور ڈیٹا کان کنی کا استعمال متوازی طور پر استعمال کیا جاتا ہے.

KDD کیا ہے؟

جیسا کہ اوپر بیان کیا گیا ہے، کے ڈی ڈی کمپیوٹر سائنس کا ایک میدان ہے، جو خام ڈیٹا سے پہلے نامعلوم اور دلچسپ معلومات کے نکالنے سے متعلق ہے. KDD مناسب طریقوں یا تکنیکوں کو تیار کرکے اعداد و شمار کا احساس بنانے کی پوری کوشش ہے. یہ عمل دوسرے درجے میں کم سطح کے اعداد و شمار کی نقشہ سازی کے ساتھ نمٹنے کے لئے زیادہ پیچیدہ، خلاصہ اور مفید ہے. یہ مختصر رپورٹیں پیدا کرنے، اعداد و شمار کے عمل کی نمائش اور پیش گوئی کے ماڈل تیار کرنے کے ذریعہ حاصل کیا جاتا ہے جو مستقبل کے معاملات کی پیشکش کر سکتا ہے. اعداد و شمار کی مسلسل ترقی کی وجہ سے، خاص طور پر کاروباری علاقوں جیسے علاقوں میں، ڈی ڈی ڈی نے اعداد و شمار کے اس بڑے مال کو کاروباری انٹیلی جنس میں تبدیل کرنے کے لئے ایک اہم عمل بن چکا ہے، کیونکہ گزشتہ چند دہائیوں میں پیٹرن کے دستی نکالنے میں ناممکن ہو گیا ہے. مثال کے طور پر، اس وقت مختلف ایپلی کیشنز جیسے سماجی نیٹ ورک کا تجزیہ، دھوکہ دہی کا پتہ لگانے، سائنس، سرمایہ کاری، مینوفیکچرنگ، ٹیلی مواصلات، ڈیٹا کی صفائی، کھیلوں، معلومات کی بازیابی اور مارکیٹنگ کے لئے زیادہ سے زیادہ طور پر استعمال کیا جاتا ہے. ڈی ڈی ڈی عام طور پر سوالات کا جواب دینے کے لئے استعمال کیا جاتا ہے جیسے اگلے سال وال مارٹ میں اہم منافع حاصل کرنے میں مدد مل سکتی ہے.. یہ عمل کئی قدم ہے. یہ درخواست ڈومین اور مقصد کے بارے میں سمجھنے کی ترقی کے ساتھ شروع ہوتا ہے اور پھر ایک ہدف ڈیٹا بیس بنانے. اس کے بعد صفائی، پری پروسیسنگ، ڈیٹا کی کمی اور پروجیکشن کی پیروی کی جاتی ہے. اگلے مرحلہ پیٹرن کی شناخت کے لئے ڈیٹا کان کنی کا استعمال کرتے ہوئے (ذیل میں بیان کیا گیا ہے). آخر میں، دریافت علم کو دیکھنے اور / یا تفسیر کی طرف سے مضبوط ہے.

ڈیٹا کان کنی کیا ہے؟

جیسا کہ اوپر بیان کیا گیا ہے، ڈیٹا کان کنینگ مجموعی KDD عمل کے اندر صرف ایک قدم ہے. درخواست کے اہداف کی طرف سے بیان کردہ دو اہم معدنی اہداف ہیں، اور وہ مثالی تصدیق یا دریافت ہیں. توثیق صارف کے بارے میں اعداد و شمار کی توثیق کررہا ہے، جبکہ دریافت خود بخود دلچسپ نمونہ تلاش کر رہا ہے. چار اہم ڈیٹا کان کنی کا کام ہے: کلسٹرنگ، درجہ بندی، رجعت، اور ایسوسی ایشن (خلاصہ). کلسٹرنگ غیر منظم شدہ اعداد و شمار سے ملتے جلتے گروپوں کی شناخت کر رہا ہے. درجہ بندی کو قواعد سیکھنے کا طریقہ کار ہے جو نئے اعداد و شمار پر لاگو کیا جا سکتا ہے. اعداد و شمار کے ماڈل پر کم سے کم غلطی کے ساتھ رجریشن کام کرتا ہے.اور ایسوسی ایشن متغیر کے درمیان تعلقات تلاش کر رہا ہے. پھر، مخصوص ڈیٹا کان کنی الگورتھم منتخب کرنے کی ضرورت ہے. اس مقصد پر منحصر ہے، لکیری ریپریشن، لاجسٹک ریگریشن، فیصلے کے درختوں اور نوے بیز جیسے مختلف الگورتھمز منتخب کیے جا سکتے ہیں. پھر ایک یا زیادہ نمائندگی کے فارم میں دلچسپی کے پیٹرن تلاش کر رہے ہیں. آخر میں، ماڈلز کا اندازہ لگایا جا سکتا ہے کہ وہ پیشن گوئی کی درستگی یا سمجھنے کے قابل استعمال کرتے ہیں.

KDD اور ڈیٹا کان کنی کے درمیان کیا فرق ہے؟

اگرچہ، دو شرائط KDD اور ڈیٹا کان کنی سے زیادہ سے زیادہ متوازی طور پر استعمال کیا جاتا ہے، وہ دو متعلقہ ابھی تک تھوڑا سا مختلف تصورات کا حوالہ دیتے ہیں. ڈیٹا ڈی ڈی ڈی ڈیٹا سے متعلق معلومات کو نکالنے کا مجموعی طریقہ ہے جبکہ ڈیٹا کان کنیجنگ KDD عمل کے اندر ایک قدم ہے، جس میں اعداد و شمار کے شناخت کے نمونوں سے متعلق ہے. دوسرے الفاظ میں، ڈیٹا کان کنینگ صرف KDD عمل کے مجموعی مقصد پر مبنی مخصوص الگورتھم کی درخواست ہے.