Apache Tika 1.4

در آپاچی Tika ابزار منبع باز طراحی شده برای شناسایی و استخراج ابرداده، و همچنین به عنوان محتوای متن ساختار از چند اسناد، با استفاده از چیزی جز موجود کتابخانه های تجزیه کننده است.آپاچی Tika پشتیبانی از فرمتهای زیر سند: زبان نشانه گذاری ابرمتن (HTTP)، XML و مشتق فرمت، مایکروسافت آفیس فرمت سند، ساختار. (ODF)، فرمت سند...