تصویری: دقت و یادآوری در داده کاوی چیست؟
2024 نویسنده: Miles Stephen | [email protected]. آخرین اصلاح شده: 2023-12-15 23:35
در حالی که دقت، درستی به درصدی از نتایج مرتبط شما اشاره دارد، به خاطر آوردن به درصد کل نتایج مرتبط که به درستی توسط الگوریتم شما طبقه بندی شده اند، اشاره دارد. برای مشکلات دیگر، یک معاوضه مورد نیاز است و باید تصمیم گرفت که آیا حداکثر شود دقت، درستی ، یا به خاطر آوردن.
علاوه بر این، دقت و یادآوری با مثال چیست؟
مثال از دقت، درستی - به خاطر آوردن متریک برای ارزیابی کیفیت خروجی طبقه بندی کننده. دقت، درستی - به خاطر آوردن زمانی که کلاس ها بسیار نامتعادل هستند، معیار مفیدی برای موفقیت پیش بینی است. در بازیابی اطلاعات، دقت، درستی معیاری برای ارتباط نتیجه است، در حالی که به خاطر آوردن اندازه گیری تعداد نتایج واقعی مرتبط است که برگردانده می شوند.
علاوه بر موارد فوق، چگونه دقت و یادآوری را در داده کاوی محاسبه می کنید؟ به عنوان مثال، یک امتیاز دقیق و یادآوری کامل می تواند به یک امتیاز F-Measure کامل منجر شود:
- F-Measure = (2 * دقت * فراخوان) / (دقت + فراخوان)
- F-Measure = (2 * 1.0 * 1.0) / (1.0 + 1.0)
- F-Measure = (2 * 1.0) / 2.0.
- F-Measure = 1.0.
همچنین بدانید که دقت در داده کاوی چیست؟
در تشخیص الگو، بازیابی اطلاعات و طبقه بندی (فراگیری ماشین)، دقت، درستی (که ارزش پیشبینی مثبت نیز نامیده میشود) کسری از نمونههای مرتبط در بین نمونههای بازیابی شده است، در حالی که یادآوری (همچنین به عنوان حساسیت شناخته میشود) کسری از مقدار کل نمونههای مربوطه است که
چرا از دقت و یادآوری استفاده می کنیم؟
دقت است به عنوان تعداد مثبت های واقعی تقسیم بر تعداد مثبت های واقعی به اضافه تعداد مثبت های کاذب تعریف می شود. در حالی که به خاطر آوردن توانایی یافتن تمام نمونه های مرتبط در یک مجموعه داده را بیان می کند، دقت، درستی نسبت نقاط دادهای را که مدل ما میگوید مرتبط بودند در واقع مرتبط بودند را بیان میکند.
توصیه شده:
چرا دقت و دقت در علم مهم است؟
دقت نشان می دهد که اندازه گیری چقدر به مقدار واقعی خود نزدیک می شود. این مهم است زیرا تجهیزات بد، پردازش ضعیف داده یا خطای انسانی می تواند منجر به نتایج نادرستی شود که خیلی به واقعیت نزدیک نیست. دقت این است که یک سری اندازه گیری از یک چیز چقدر به یکدیگر نزدیک است
کدام روش طبقه بندی داده ها تعداد مساوی رکورد یا واحد تجزیه و تحلیل را در هر کلاس داده قرار می دهد؟
Quantile. هر کلاس دارای تعداد مساوی ویژگی است. طبقهبندی چندک برای دادههای توزیعشده خطی مناسب است. Quantile تعداد یکسانی از مقادیر داده را به هر کلاس اختصاص می دهد
دقت در ماتریس سردرگمی چیست؟
ماتریس سردرگمی تکنیکی برای خلاصه کردن عملکرد یک الگوریتم طبقه بندی است. اگر تعداد مشاهدات نابرابر در هر کلاس داشته باشید یا اگر بیش از دو کلاس در مجموعه داده خود داشته باشید، دقت طبقه بندی به تنهایی می تواند گمراه کننده باشد
کدام ویژگی داده ها مقداری است که داده ها بسیار ارزش گذاری می کنند؟
Variation: اندازه گیری مقداری که مقادیر داده ها متفاوت است. ? توزیع: ماهیت یا شکل گسترش داده ها در محدوده مقادیر (مانند زنگی شکل). ? مقادیر پرت: مقادیر نمونه ای که بسیار دور از اکثریت قریب به اتفاق سایر مقادیر نمونه قرار دارند
کدام داده ها در نقشه های توپوگرافی نشان داده شده است؟
داده های توپوگرافی اطلاعاتی در مورد ارتفاع سطح زمین است. دو نوع داده از این دست معمولاً با GeoPads استفاده می شود. اولی دادههایی هستند که نشاندهنده اطلاعاتی هستند که معمولاً روی نقشههای چهار گوش توپوگرافی یافت میشوند، مانند خطوط خطوط، جادهها، نهرها، راهآهنها، شهرها و غیره