ASPseek

نرم افزار تصویر:
ASPseek
جزئیات نرم افزار:
نسخه: 1.2.10
ها تاریخ: 3 Jun 15
توسعه دهنده: SWsoft
پروانه: رایگان
محبوبیت: 4

Rating: nan/5 (Total Votes: 0)

در ASPseek نرم افزار موتور جستجوی اینترنتی توسعه یافته توسط SWSOFT و دارای مجوز به عنوان نرم افزار آزاد تحت GNU GPL است.
ASPseek شامل یک ربات نمایه سازی، یک شبح جستجو، و ظاهر جستجوی CGI. این می تواند صفحه اول به عنوان بسیاری از چند میلیون URL و جستجو برای کلمات و عبارات، نویسه عام استفاده، و انجام یک جستجو منطقی. نتایج جستجو را می توان به مدت زمان داده می شود، سایت و یا فضای وب (مجموعه ای از سایت های) طبقه بندی شده اند و توسط ارتباط محدود (رتبه استفاده می شود) و یا تاریخ.
ASPseek برای سایت های مختلف بهینه سازی (شاخص رشته ای، متغیر DNS کالاهای کابل، گروه بندی نتایج را با سایت، فضاهای وب)، اما می تواند برای جستجوی یک سایت و همچنین استفاده می شود. ASPseek می تواند با چندین زبان / کدگذاری در یک بار (از جمله کدگذاری چند بایتی مانند: چینی) با توجه به یونیکد حالت ذخیره سازی کار می کنند. ویژگی های دیگر عبارتند stopwords و پشتیبانی ispell، مجموعه نویسه و زبان guesser، قالب HTML برای نتایج جستجو، گزیده ای، و کلماتی برجسته.
ASPseek در C ++ نوشته شده است با استفاده از کتابخانه STL، و با استفاده از ترکیبی از پایگاه داده SQL و فایل های باینری برای ذخیره سازی.
در اینجا برخی از ویژگی های کلیدی "ASPseek" عبارتند از:
قابلیت شاخص و جستجو از طریق چندین میلیون از اسناد
 
· با استفاده از ASPseek، شما می توانید یک پایگاه داده ایجاد و جستجو از طریق بسیاری از سایت ها، و نتایج برای هر پرس و جو خواهد شد سریع بازگشت حتی اگر شما چند میلیون اسناد نمایه میشود. البته این بستگی به سخت افزار، بنابراین انتظار نداریم "خوب قدیمی" ماشین i486 که مسئولیت رسیدگی به هر سایت در دامنه مورد علاقه. همه چیز بستگی به CPU (بازدید کنندگان)، حافظه، سرعت دیسک و غیره. بنابراین از انجام آزمایشات خود را قبل از خرید سخت افزار اختصاص داده.
 
· این واقعیت که ASPseek برای حجم های بالا بهینه سازی شده باید شما را از استفاده از آن برای جستجو در سایت خود را که شامل چند صد اسناد متوقف نمی - کار می کند نیز وجود دارد.
 
ارتباط بسیار خوبی از نتایج
 
· هدف از موتور جستجو می باشد برای پیدا کردن آنچه کاربر می خواهد. می تواند وجود دارد هزاران نفر از URL ها در بر داشت به عنوان یک نتیجه از پرس و جو جستجو، اما همه می توان آن را بی ربط، بنابراین کاربر ناراضی خواهد بود.
 
· نتایج خروجی در ASPseek توسط ربط (یا رتبه) طبقه بندی شده اند، اما محاسبه مرتبه است کار آسانی نیست. توسعه دهندگان سعی خود را به ترکیب بزرگترین و آخرین تکنیک را به موتور ASPseek در حالی که حفظ سرعت جستجو خوب است.
 
پشتیبانی Ispell
 
· هنگامی که ASPseek با پشتیبانی ispell استفاده می شود، searchd (1) می تواند به صورت اختیاری تمام اشکال برای همه کلمات مشخص شده را پیدا (به عنوان مثال: ایجاد -> ایجاد یا ایجاد شده و یا ایجاد). بنابراین، آن را اجازه می دهد تا شما برای پیدا کردن کلمه در تمامی اشکال مختلف.
 
حالت ذخیره سازی یونیکد
 
· ASPseek می توانید اطلاعات در مورد اسناد در یونیکد ذخیره، بنابراین ساخت ممکن است برای پیاده سازی یک موتور جستجو چند زبان. بنابراین، شما می توانید فهرست و جستجو اسناد به زبان انگلیسی، روسی و حتی چینی، همه در یک پایگاه داده است.
 
HTTP، HTTPS، HTTP پروکسی، FTP (از طریق پروکسی) پروتکل
 
· به عنوان ASPseek یک موتور جستجو وب است، آن را با استفاده از پروتکل HTTP سایت های شاخص. ASPseek همچنین پشتیبانی از HTTPS امن: // پروتکل. پروتکل FTP به طور مستقیم پشتیبانی نمی شود، اما شما می توانید پروکسی (مانند ماهی مرکب) و سایت های FTP از طریق صفحه پروکسی استفاده کنید.
 
· پشتیبانی از ASPseek "مجوز عمومی" از ویژگی های HTTP بنابراین شما می توانید مناطق محافظت شده با پسوردم صفحه اول (به عنوان مثال اطلاعات خصوصی در اینترانت خود را).
 
متن / HTML و متن / ساده پشتیبانی انواع سند
 
· ASPseek می توانید اسناد نوشته شده در HTML، و اسناد متنی ساده را درک کنید. این محبوب ترین فرمت های در اینترنت می باشد.
 
· فرمت های دیگر مانند PDF، RTF، و غیره، می توان با کمک هر برنامه / اسکریپت خارجی است که قادر به تبدیل فرمت های که به HTML یا متن ساده پشتیبانی می کند.
 
طراحی چند رشته ای، کالاهای کابل DNS برطرف و غیره
 
· ASPseek با استفاده از موضوعات POSIX، که بدان معنی است که یک فرایند داشته موضوعات بسیاری از در حال اجرا در موازی. بنابراین اسناد صفحه اول از بسیاری از سایت ها، و فرآیندهای شبح جستجو بسیاری از جستجو نمایش داده شد به طور همزمان. این امر نه تنها کمک می کند تا ASPseek به مقیاس به خوبی در سیستم های SMP (چند)، بلکه باعث بهبود سرعت نمایه سازی، چرا که در مورد یک موضوع ترین زمان خواهد شد در انتظار اطلاعات از شبکه به سر برد.
 
· یکی از چیزهایی که فرایند نمایه سازی آهسته زیادی DNS مراجعه (روند تعیین آدرس IP با استفاده از نام سرور) است. برای جلوگیری از تاخیر، متغیر ناهمزمان (مراجعه توسط فرآیندهای جداگانه انجام می شود) و کش آدرس IP اجرا می شوند.
 
Stopwords
 
· Stopwords کلمات که هیچ معنای به خودی خود می باشد. مثال: می شود، در این. جستجو برای در بی فایده است، بنابراین چنین کلمات از پرس و جو جستجو حذف شدند. Stopwords نیز از پایگاه داده در طول نمایه سازی از مطالعه حذف، بنابراین پایگاه داده های کوچکتر و سریعتر می شود.
 
· هیچ "ساخته شده است در" stopwords در ASPseek وجود دارد، آنها در طول راه اندازی از فایل های لود می شود. بسیاری از فایل های stopword از زبان های مختلف همراه با ASPseek.
 
نویسهگان guesse
 
· برخی از سرویس دهنده شکسته و یا بد انجام مشتریان نویسهگان که در آن ارائه محتوای آن ندارد. اگر شما در حال نمایه سازی مانند سرورها، یا با استفاده از ASPseek به سرورهای صفحه اول FTP (پروتکل FTP نمی داند هیچ چیزی در مورد charsets)، guesser مجموعه نویسه را می توان مورد استفاده قرار گیرد به مقابله با آن. guesser نویسهگان با استفاده از جداول فراوانی کلمه (به نام langmaps) را برای تعیین جدول نویسه درست باشد.
 
استاندارد ربات خروج (robots.txt را) پشتیبانی
 
· ASPseek به طور کامل پشتیبانی این استاندارد. این است که برای نویسندگان وب سایت برای گفتن ربات در نظر گرفته شده (به عنوان مثال، شاخص ASPseek (1)) به جست و خیز نمایه سازی برخی از دایرکتوری سایتهای خود.
 
· برای کسب اطلاعات بیشتر مراجعه کنید http://www.robotstxt.org/wc/robots.html
 
تنظیمات برای کنترل استفاده از پهنای باند شبکه و سرورهای وب بار
 
· شما دقیقا می توانید کنترل پهنای باند شبکه که شاخص (1) استفاده می کند. دقیقا، شما می توانید پهنای باند (بیان شده در بایت در ثانیه) با استفاده از شاخص (1) با توجه به زمان برای از روز مورد استفاده قرار محدود می کند. به عنوان مثال، شما می توانید پهنای باند در ساعات کسب و کار محدود تا مردم در دفتر خود خواهد اینترنت آهسته تجربه نمی کنند.
 
· شما همچنین می توانید در کمترین زمان بین دو نمایش داده شد به وب سرور همان، پس از آن داده نمی شود و پربار کردم به پایین را به زانو در حالی که شما صفحه اول اجرا (1).
 
زمان واقعی نمایه سازی ناهمزمان
 
· بعضی از موتورهای جستجو مستلزم آن است که جستجو باید برای زمان به روز رسانی پایگاه داده متوقف شد. ASPseek به آن نیاز نیست، بنابراین شما می توانید بدون توقف را جستجو کنید.
 
· مطالب بیشتر در به می گویند، یک حالت خاص از نمایه سازی به نام "زمان واقعی" نمایه سازی وجود دارد. شما می توانید آن را برای تعداد کمی از اسناد استفاده کنید، و تا آنجا که چنین سند دریافت و پردازش، تغییرات بلافاصله در رابط جستجو قابل مشاهده است. این قابلیت کمک بزرگی است اگر شما در حال ایجاد موتور جستجو برای صفحات با سرعت در حال تغییر محتوا مانند اخبار آنلاین و غیره.
 
· توجه داشته باشید که تعداد اسناد در "زمان واقعی" پایگاه داده محدود است. این حدود 1000 بر روی سخت افزار ما (مسافت پیموده شده شما ممکن است متفاوت باشد)، و اسناد بیشتر شما را در "زمان واقعی" پایگاه داده داشته باشد، کندتر خواهد شد سرعت نمایه سازی به آن (و تنها آن) پایگاه داده باشد. این کار سرعت جستجو تاثیر نمی گذارد هر چند.
 
· اسناد از "زمان واقعی" پایگاه داده ها به پایگاه داده نرمال پس از اجرا صفحه اول (1) در یک راه طبیعی نقل مکان کرد.
 
مرتب سازی نتایج بر اساس ارتباط یا براساس تاریخ
 
· موتورهای جستجو معمولا نتایج مربوطه را برای اولین بار باز می گرداند. اما اگر شما به دنبال برای همه صفحات، شما می توانید بگویید ASPseek برای مرتب کردن نتایج اساس تاریخ آخرین اصلاح، بنابراین به تازگی اصلاح شده (یا ایجاد) صفحات خواهد شد برای اولین بار نمایش داده میشود.
 
گزیده، کلماتی برجسته
· گزیده ای است یک تکه از سند یافت با کلمات جستجو شده برای برجسته، فقط برای دادن یک ایده از آنچه در سند است در مورد. شما می توانید تعداد گزیده ای نمایش و طول خود را سفارشی. اگر شما گزیده ای غیر فعال کردن، آغاز از سند نمایش داده خواهد شد.
 
· هر سند در بر داشت با "حافظه پنهان" لینک همراه است. ASPseek نگه می دارد یک کپی محلی فشرده از هر سند پردازش، بنابراین کاربر می تواند کل سند با (اختیاری) کلماتی را که برای دیدن جستجو شدند برجسته، حتی اگر از آن شده است از سایت اصلی برداشته (که اتفاق می افتد گاهی اوقات).
 
گروه بندی نتایج را با سایت
 
· نتایج حاصل از یک سایت را می توان با هم گروه بندی شوند. اگر گروه بندی شده توسط سایت های روشن است، تنها دو نتیجه از همان محل به طور پیش فرض نمایش داده و کاربر می تواند صفحات دیگر از همان سایت های زیر "نتایج بیشتر از ..." لینک ها را ببینید.
 
کلونها
 
· کلونها اسناد یکسان در مکان های مختلف می باشد. آنها تشخیص داده می شوند و با هم گروه بندی، بنابراین کاربر خواهد شد با یک صفحه کامل از URL ها را به اسناد یکسان ارائه نمی شود.
 
· تشخیص کلون است که معمولا توسط یک سایت (تا اسناد یکسان از سایت های مختلف به عنوان کلون شمارش نیست) محدود است، اما شما می توانید این کار را با کامپایل مجدد ASPseek با --disable-کلون-های-سایت گزینه را تغییر دهید.
 
فضاها و زیر مجموعه
 
· فضایی مجموعه ای از سایت های است. بنابراین، اگر شما می خواهید برای ارائه به جستجو تنگ به برخی از منطقه، شما می توانید یک فضای ایجاد و جستجو در آن فضا. تنها سایت کل (به عنوان مثال http://www.mysite.com/) مجاز به در فضا گنجانده شود.
 
· زیر مجموعه همچنین می تواند مورد استفاده قرار گیرد برای محدود کردن جستجو. شما می توانید زیر مجموعه ایجاد و قرار دادن ماسک URL (مانند http://www.mysite.com/mydir/٪) به آن، و سپس دامنه جستجو را به زیر مجموعه تنها داده شده است.
 
· شما می توانید دامنه جستجو را به نه تنها یکی بلکه چندین زیر مجموعه و یا فضاهای محدود.
 
HTML قالب برای نتایج جستجوی آسان به سفارشی
 
· شما می توانید صفحات جستجوی خود را سفارشی، به طوری که آنها خواهد شد شبیه و به صورت یکپارچه با بقیه سایت خود را یکپارچه شده است. این است که توسط ویرایش ساده از قالب جستجوی فایل انجام می شود.
نصب
از gzip -dc aspseek-1.2.10.tar.gz | تار XF -
سی دی aspseek-1.2.10. / پیکربندی
ساخت
سو
را نصب کنید

نرم افزار های دیگر از توسعه دهنده SWsoft

OpenVZ kernel
OpenVZ kernel

2 Jun 15

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

Plesk for Windows
Plesk for Windows

22 Sep 15

نظرات به ASPseek

نظر یافت نشد
اضافه کردن نظر
روشن کردن تصاویر!