روش TF-IDF برای ساختاردهی به داده‌های متنی

مقدمه   روش TF-IDF: در این روش میزان تکرار یک کلمه در یک مستند را در مقابل تعداد تکرا آن در مجموعه کلیه مستندات در نظر می گیریم. در روش TF-IDF وزن دهی کلمات تابعی از توزیع کلمات مختلف در مستندات است. برای پیاده سازی این روش ابتدا یک مجموعه اسناد (برای مثال مجموعه اسناد …

روش TF-IDF برای ساختاردهی به داده‌های متنی ادامه مطلب »