بازیابی اطلاعات و روش های آن
بازیابی اطلاعات به معنی بازیافت اطلاعات غیرقابل دسترس از هرگونه رسانهی ذخیرهسازی است. از دست دادن اطلاعات مهم کاری یا شخصی ، یکی از اتفاقات ناگواری است که می تواند برای کاربران دستگاه های هوشمند یا دارندگان فضاهای ذخیره سازی است. علت این اتفاقات میتواند خراب شدن data، باگهای نرمافزاری، حملات ویروسی، حتی نوسانات برق، آسیب به هارد دیسک و … باشد. در صورتی که بخشی از دادههای موجود در هارد دیسک (HDD,SSD) ، فلش یا دیگر رسانههای ذخیرهسازی از بین برود، میتوان باخرید نرمافزارهای بازیابی اطلاعات و یا مراجعه به افرادی که متخصص در حوزه ی بازیابی اطلاعات هستند، اقدام به بازیابی اطلاعات از دست رفته کرد. البته همواره امکان بازیابی اطلاعات بصورت کامل وجود ندارد چرا که برخی هارددیسک ها به شدت دچار آسیب بر اثر ضربه یا آتش سوزی شده اند و سطح آسیب دیدگی بالاست و امکان بازیابی را به حداقل می رساند.
انواع مختلف سیستم های بازیابی اطلاعات
اجزای سیستم بازیابی اطلاعات
سیستم بازیابی اطلاعات دارای چهار مولفه اساسی است. آنها یک پایگاه داده ، یک مکانیسم جست و جو ، یک زبان و یک رابط برای ایجاد تعامل بین کاربر و سیستم هستند. اولین مولفه پایگاه داده است. پایگاه داده یک سیستم ذخیره سازی سازمان یافته است که امکان جستجو در موارد موجود در آن را با استفاده از معیارهای از پیش تعیین شده فراهم می کند. دومین مولفه مکانیزم جست و جو است. مکانیسم جست و جو سیستمی است که امکان جستجوی پایگاه داده را برای بازیابی اطلاعات ذخیره شده در آن فراهم می کند.
سومین مولفه سیستم بازیابی اطلاعات، زبان است که می تواند “زبان طبیعی یا یک واژگان کنترل شده” باشد . آخرین مولفه ی سیستم بازیابی اطلاعات ، رابط کاربری است. این مرحله نقطه تعامل بین کاربر و سیستم است. کاربر پسند بودن آن در بسیاری از موارد تمایل کاربران به استفاده از آن را تعیین خواهد کرد.
دسته بندی سیستم های بازیابی اطلاعات
سیستم های بازیابی اطلاعات در دسته بندی های زیر قرار می گیرند. مبتنی بر متن(Text-Based)، رسانه های مبتنی بر تصویر (images based media)، برنامه های رسانه ای جریان دار (Streamed Media Applications)و برنامه های چندرسانه ای
(Mutimedia Applications)وجود دارد. موارد مبتنی بر متن از کلمات به عنوان حالت اصلی ذخیره اطلاعات استفاده می کنند. رسانه های مبتنی بر متن در این مجموعه شامل اشعار ، دست نوشته های مربوط به هنرهای نمایشی و جراید روزنامه هستند. برنامه های مبتنی بر تصویر برای ذخیره اطلاعات به عناصر تصویر متکی هستند. هر عنصر تصویری که پیکسل نامیده می شود ، دارای ماهیت متفاوتی است که رنگ و شدت آن را توصیف می کند ، که وقتی به طور جمعی با پیکسل های دیگر ترکیب می شود ، یک تصویر مشخص را توصیف می کند. برنامه های مبتنی بر تصویر در این مجموعه شامل ، مواد عکاسی نگهداری شده رسانه های ذخیره سازی مانند CD و یا هارددیسک ها هستند.
سیستم های بازیابی مبتنی بر متن
سیستم بازیابی متن محور به بازیابی رسانه های متنی کمک می کند. مطالب مبتنی بر متن موجود در مجموعه به دیجیتالی شدن احتیاج دارند. مزیت اصلی بازیابی مبتنی بر متن این است که این فناوری بالغ است و از این رو از درجه استاندارد سازی لازم برخوردار است. مشکلات سازگاری کمتری بین انواع مختلف نرم افزار را نشان می دهد. در صورت بروز این مشکل ، گزینه های متعددی برای تبدیل وجود دارد که امکان بازیابی در قالب دلخواه را دارد. ضعف آن استفاده از حروف و کلمات به عنوان واحد ذخیره و بازیابی اطلاعات اصلی است.
تاکنون ، بسیاری از روشهای بازیابی موجود برای بازیابی متن ، عناصر معنایی یک جستجو را در نظر نمی گیرند. آنها به تطابق کلمات متکی هستند و از این رو بیشتر سیستم های جستجو ممکن است محتوای مربوطه را بر اساس معنی آنها بازگردانند ، اما محتوایی را که با عبارت استفاده شده به عنوان پرس و جو (Query) جستجو مطابقت دارد باز می گردانند. سیستم های پیشرفته امکان جستجوی زمینه ای را فراهم می کنند که عناصر معنایی جستجو را بهبود می بخشند.
سیستم های بازیابی چندرسانه ای
سیستم های بازیابی چندرسانه ای از روش های مختلفی برای شناسایی اطلاعات متناسب با یک پرس و جو (Query) استفاده می کنند. یک سیستم بازیابی اطلاعات چندرسانه ای به راحتی درخواست های جستجو برای برنامه های مبتنی بر تصویر و برنامه های رسانه ای جریانی را کنترل می کند. پرس و جوهای جستجوی چندرسانه ای از عناصر قابل استفاده برای هر یک از برنامه های مبتنی بر تصویر و برنامه های رسانه ای جریانی استفاده می کنند.
مدل های مختلف بازیابی اطلاعات چیست؟
مدلهای بازیابی اطلاعات را می توان در مدلهای (ساده) Classic ، (ساختارمند) Structuredو Browsing دسته بندی کرد. مدل های کلاسیک شامل مدل های Boolean ، Vector Space و توزیع احتمالی هستند. در مدل Boolean از عبارات منطقی چون AND, OR, NOT با توجه به نیاز کاربر در پرس و جوها می توان استفاده کرد.
مدل های فضایی برداری (Vector Space) از بردارها برای نقشه برداری از اسناد ، عبارات یا اصطلاحات استفاده می کنند. کلمات یا اصطلاحات را می توان با توجه به ابعاد بردار سند ، به وزنهای با قدرت تفکیک زیاد یا پایین دسته بندی کرد. این امر به کشف موارد مثبت یا منفی یا مشابه و مخالف و بازیابی اطلاعات کمک می کند.
مدل های توزیع احتمال برای کشف شباهت بین اسناد از انواع مختلف توزیع استفاده می کنند. این مدل می تواند یکی از این دو نوع باشد: مبتنی بر شباهت و مبتنی بر سودمندی .
تکنیک های اساسی که در بازیابی اطلاعات استفاده می شوند:
فرض کنید یه پرس و جو عبارت “پردازش شده” را دارد. یک تطابق دقیق برای این کلمه اسنادی را که حاوی انواع مختلفی مانند “پردازش” و “روند” است ، کنار می گذارد. ریشه یابی کردن این مسئله را حل می کند اما مشکلات خاص خود را ایجاد می کند.. فرض کنید کاربر به دنبال ‘فشار خون بالا’ باشد. سیستم بازیابی اطلاعات همچنین ممکن است “فشار خون بالا” و “فشار خون بالا ، کلیوی” را جستجو کند. به این گسترش پرس و جو (query) می گویند..
هنگامی که یک پرس و جو چندین اصطلاح دارد ، ممکن است برخی از اصطلاحات از سایر موارد مهم تر باشند. این کار با وزن دهی عبارتی انجام می شود. برای بهبود عملکرد بازیابی اطلاعات ، می توان از بازخورد مرتبط بودن ، معمولاً در Vector Space Model استفاده کرد. مجموعه کوچکی از اسناد بازیابی به کاربر نشان داده می شود تا درباره آنچه مرتبط است و غیر آن بازخورد دارد. سپس سیستم بازیابی اطلاعات، پرس و جو را برای بهبود عملکرد اصلاح می کند.
معرفی یکی از نرم افزارهای بازیابی داده
Kroll Ontrack EasyRecovery
نرمافزار Ontrack EasyRecovery به عنوان قدرتمندترین نرمافزار بازیابی اطلاعات شناخته می شود. با شباهت طراحی رابط کاربری به رابط کاربری نرمافزار Stellar Phoenix، بهرهمندی از قدرتمندترین نرمافزار بازیابی اطلاعات بیش از پیش راحتتر شده است. این تغییر پیچیدگی کار با آن را به میزان زیادی کاهش داده است و آن را بسیار کارآمد می کند.
مزایا
- بازیابی اطلاعات سریع و دقیق
- دارای گزینه های تخصصی و پیشرفته
- پشتیبانی از SSD، هارد دیسک و پیکربندی RAID
- قابلیت توقف موقتی و از سر گیری فرآیند بازیابی
- سازگار با سیستمهای فایلهای HFS ،HFS+ ،FAT ،ExFAT و NTFS
معایب
- فاقد preview فایلهای بازیابی شدهبرر