در بسیاری از برنامه های کاربردی که با داده های بدون ساختار مقابله نیاز به دسترسی به محتوای متن از اسناد فرمت شده و یا مشخص شده-است. سازمان هایی که اسناد آرشیو اغلب نیاز به دسترسی به محتوای متنی به اسناد قابل جستجو و فعال تجمع محتوا، گزارش و معدن آرشیو سند. جستجو و برنامه بازیابی همچنین نیاز به استخراج و tokenize متن از فرمت های فایل های مختلف.
یک مکانیسم استاندارد برای دسترسی و استخراج متن از اسناد توسط IFilter پلاگین در رابط مورد استفاده در موتورهای جستجو مایکروسافت ارائه شده است. چند پیاده سازی IFilter توسعه یافته توسط مایکروسافت و فروشندگان دیگر را که تحت پوشش فرمت های مختلف فایل وجود دارد. کیفیت استاندارد و یا قابلیت اطمینان و متن استخراج در سراسر چندگانه توسعه دهندگان IFilter متفاوت است.
فیلترها متن Opait برنامه ابزار کوچک با یک رابط کاربری ساده به IFilters که در حال حاضر بر روی کامپیوتر میزبان و همچنین چند فیلتر استخراج متن سفارشی که به طور مستقیم کار با فرمت های فایل و بهبود بر پیاده سازی پیش فرض IFilter نصب شده است.
رابط کاربری برای استخراج متن است که توسط یک کتابخانه کلاس کوچک به نام Opait.Filters است که شامل و می تواند مورد استفاده قرار گیرد به ادغام فیلتر متن را به برنامه های دات نت ارائه
مورد نیاز:.
دات نت چارچوب 4.5
نظر یافت نشد