در بسیاری از برنامه های کاربردی که با داده های بدون ساختار مقابله نیاز به دسترسی به محتوای متن از اسناد فرمت شده و یا مشخص شده-است. سازمان هایی که اسناد آرشیو اغلب نیاز به دسترسی به محتوای متنی به اسناد قابل جستجو و فعال تجمع محتوا، گزارش و معدن آرشیو سند. جستجو و برنامه بازیابی همچنین نیاز به استخراج و tokenize متن...