نرم افزار R یکی از قدرتمندترین و پرطرفدارترین نرم افزارهای آماری در سراسر دنیا می باشد که با رشد چشمگیری مورد توجه دانشجویان و محققان در زمینه های مختلف قرار گرفته است. یکی از حوزه های کاربردی برای استفاده از نرم افزار R متن کاوی است که در این مقاله، مثال هایی از کدنویسی برای متن کاوی در R را ارائه کرده ایم.
بیشتر بخوانید: داده کاوی چیست؟
در ابتدا باید به این نکته اشاره کنیم:
فایل های ارائه شده در این مقاله که به صورت کدهای R هستند، همگی حاصل تلاش شبانه روزی نویسنده می باشند بنابراین لطفاً در صورت استفاده، به منبع ارجاع دهید.
بیشتر بخوانید: کلان داده چیست؟
متن کاوی در R را به ترتیب گام های زیر اجرا کنید:
1- کدها را دانلود کنید
شما می توانید کدهای مربوط به مثال متن کاوی در R را از اینجا به صورت رایگان دانلود کنید.
رمز فایل: r-studio.ir
2- مثال متن کاوی در R
در این مثال برای آموزش متن کاوی با نرم افزار R یک سوال مطرح کرده ایم (کدهای مربوط به پاسخ این سوال در گام 1 موجود هستند):
سوال)
برنامه ای بنویسید که در ابتدا فایل متنی Text.txt را دریافت کند و کارهای زیر را بر روی آن انجام دهد:
الف) تعداد تکرار هر کلمه موجود در متن را مشخص کند. خروجی این مرحله باید یک ماتریس با دو ستون باشد که ستون اول حاوی کلمات متن و ستون دوم حاوی تکرار هر کلمه است.
ب) ستون سومی را به عنوان وزن هر کلمه تخصیص دهید و وزن هر کلمه را در متن حساب کنید.
ج) 100 کلمه با بیشترین وزن را مشخص کنید.
در این جا چند مثال ساده برای درک بهتر متن کاوی با نرم افزار R ارائه شد، اما نرم افزارهای مختلفی وجود دارند که به صورت تخصصی کار متن کاوی را برای شما انجام می دهند و خروجی های بسیار مناسب تری را به شما می دهند. توجه داشته باشید که نرم افزار R تخصصی در زمینه متن کاوی ندارد اما از آن جایی که منبع-باز است شما می توانید هر کدی را در آن اجرا کنید.
بیشتر بخوانید: معرفی نرم افزارهای آماری
مطالب مرتبط: