فی دوو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

فی دوو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

پروژه کاوش وب و تکنیک ها و کاربردهای آن. doc

اختصاصی از فی دوو پروژه کاوش وب و تکنیک ها و کاربردهای آن. doc دانلود با لینک مستقیم و پر سرعت .

پروژه کاوش وب و تکنیک ها و کاربردهای آن. doc


پروژه کاوش وب و تکنیک ها و کاربردهای آن. doc

 

 

 

 

نوع فایل: word

قابل ویرایش 81 صفحه

 

مقدمه:

برای پیداکردن اطلاعات در وب، دو مسئله اساسی حرکت  و جستجو  مطرح می باشد[25] . بیشتر کاربران وب معمولاً از مرورگر وب برای حرکت در بین سایتهای وب استفاده می کنند و معمولا ً از صفحه اصلی سایت شروع کرده و روی لینکهای ارتباطی  متناسب با علایقی که در ذهن خود دارند، کلیک کرده و به جستجوی نیازهای اطلاعاتی خود می پردازند. از طرف دیگر تعداد اطلاعات قابل دسترسی که در وب وجود دارد، بسیار زیاد است و هر ساله به حجم این اطلاعات افزوده می شود . بنابراین یکی از مسائل مهم در چنین مجموعه های بزرگ از اسناد (سایتها یا صفحات وب ) سازمان دهی اسناد به نحوی است که بتوان آنها را بصورت کارا بازیابی کرد. مسئله مهم دیگر این است که باید بتوان از اطلاعات کاربران قبلی که در وب به حرکت و جستجو می پردازند، استفاده کرد تا بتوان کاربران جدید را در امر حرکت و جستجو یاری کرد[27].

زمانی که کاربران چندین بار با توالی های مشخص به صفحات وب مراجعه می کنند، نشان دهنده یک نوع ارتباط بین آنها صفحات است. این نوع توالی ها را الگوهای حرکتی کاربران  می گویند. این کاوش منجر به کشف ساختار ارتباطی اسناد وب می شود. کشف ساختار ارتباطی اسناد وب، باعث پیدا کردن اسناد مشابه بهم شده و می توان به وسیله آن به خوشه بندی  و رتبه بندی اسناد وب پرداخت که درنتیجه سرعت جستجو و حرکت برای کاربران بعدی برای ادامه حرکت، به صورت آسان تری انجام می شود، هدف ازکاوش وب، استخراج اطلاعات از اسناد وب، به وسیله تکنیکهای داده کاوی است.  داده کاوی عبارت است از فرآیند خودکار کشف دانش واطلاعات از پایگاههای داده ای برخی از ابزارهای داده کاوی عبارت اند از: هپیوندی، طبقه بندی الگوهای ترکیبی و خوشه بندی. به سبب علاقه افراد به جستجوی اطلاعات مختلف، کاوش وب امروزه در ابعاد وسیعی انجام می شود و منابع اطلاعاتی قابل دسترس روی وب رشد چشمگیری کرده است.

 

فهرست مطالب:

فصل اول: مقدمه

 مقدمه انواع کاوش وب

 ساختار پروژه

فصل دوم: کاوش استفاده از وب در موتور های جستجو      

 مقدمه

 مقدمات کاوش استفاده از وب

 قانون zipfs

 فایلهای وارونه

 کاربرد موتور جستجو

 شاخص های مبتنی بر توزیع جستجو

 طرح اولیه

 بهبود زمان پاسخ دهی به پرس و جو

 رتبه بندی براساس پرس و جوی کاربران و انتخاب ها

 الگوریتم Masel

فصل سوم: بهره گیری از کاوش وب برای پیمایش الگو های مسیر

 مقدمه

 فرموله کردن مساله

 تشریح پیمایش الگوهای مسیر

 کارهای انجام شده

 پیدا کردن حداکثر ارجاعات به جلو

 جلسات

 ساختلر های داده

 یافتن حداکثر ارجاع به جلو از طریق فاصله زمانی بین جلسات

 یافتن حداکثرارجاع به جلو از طریق شکاف جلساتی

 تجزیه وتحلیل عملکرد

 ویژگیهای حداکثر ارجاعات به جلو

 الگوریتمی برای پیدا کردن حداکثر ارجاع به جلو

 الگوریتم MF

 پیدا کردن ارجاع متوالی تکرار شونده

 الگوریتم FS

 Shllow درخت پسوندی تعمیم یافته

 کاوش پیمایش الگو های مسیر تکرار شونده

 الگوریتم کاوش SbSfX

 الگوریتم کاوش HbSfx

 تجزیه وتحلیل عملکرد

فصل چهارم: کاوش استفاده از وب الگوریتم ها و نتایج

 مقدمه

 مراحل کاوش استفاده از وب

 مرحله: پیش پردازش

 مرحله: کاوش

 مرحله: اجرای نتایج کاوش

 کارهای انجام شده

 الگوریتم TRANSACTIONIZATION

الگوریتم های کاوش

فصل پنجم: خوشه بندی گراف وب برای جستجو وحرکت

 مقدمه

 خوشه بندی

 راهکارهای خوشه بندی گراف وب

 الگوریتم

 اجزای تشکیل دهنده فرآیند خوشه بندی

 تکنیکهای خوشه بندی

 الگوریتم های افراز

 الگوریتم خوشه بندی به روش KMeans

 الگوریتم های سلسله مراتبی

 

فهرست اشکال:

شکل2-1 : کلمات درون یک فرهنگ لغت

شکل 2-2 : فراوانی کلمات جستجو شده در یک گراف loglog

شکل 2-3 : کلمات جستجو شده تکراری

شکل 2-4 : دیاگرام حالت حرکت کاربران در موتور جستجوی

شکل2-5  : تفاوت بین ترتیباکتشافی و اتفاقی

شکل3-1 : پیمایش الگوهای مسیر

شکل 3-2 : الگوریتم ISMFR

شکل3-3 : مراحل و الگوریتم GSMFR

شکل 3-4 : مقایسه کارایی الگوریتم های ISMFR وGSMFR

شکل 3-5 : توزیع متراکم در الگوریتمMFR

شکل 3-6 : الگوریتمSbSfXMiner

شکل 3-7 : الگوریتم HbSfXMiner

شکل 3-8 : مقایسه کارایی الگوریتم های SbSfXMiner و HbSfXMinerبا  Ukknonenو electivScan

شکل 4-1 : الگوریتم Transactionization

شکل 4-2: الگوریتم WTBD

شکل 5-1 : الگوریتم پیدا کردن گره های تصادفی

شکل 5-2: الگوریتم گروه بندی گره ها به وسیله جستجوی محلی

شکل 5-3 : شبه کد الگوریتم K_Means

شکل 5-4 : نمودار دندوگرام

 

فهرست جداول

جدول 1-1 : انواع کاوش وب

جدول 2-1: مقایسه بینموتور جستجوی متفاوت

جدول 2-2: پرس و جوی های رایج درونموتور جستجو

جدول 4-1: نونه ای از یک لاگ فایل

جدول 4-2 : تراکنش های استخراج شده از جدول

واژگان

مراجع

 

منابع و مأخذ:

  [1]: Zipf, G. (1932). Selective studies and the principle of relative frequency in language. Cambridge, MA: Harvard University Press.

[2]: Baeza-Yates, R., and Saint-Jean, F. (2003a). Query analysis in a search engine and its application to rank Web page (in Spanish), BID 10, Barcelona, Spain

[3]: Spink, A., Jansen, B.J., Wolfram, D., and Saracevic, T. (2002). From e- sex to e-commerce: Web search changes. IEEE Computer, 35(3), 107-109.

 [4]: Wolfram, D. (2002). A query-level examination of end user searching behavior on the Excite search engine. Proceedings of the 28 Annual Conference Canadian Association for Information Science.

 [5]:  Baeza-Yates, R., and Saint-Jean, F. (2003b). A three level search engine index based in query log distribution. SPIRE 2003, Manaus, Brazil.

 [6]: Zhang, D., and Dong, Y. (2002). A novel Web usage mining approach for search engine. Computer Network, 39(3), 303-310.

[7]: Cooley, R., Mobasher, B., and Srivastava, J. (1997b).Web mining : information

and pattern discovery on the World Ward Web. Proceedings of the IEEE International Conference Tools with AI, (pp. 558-567).

 [8]: Chen, M.S., Park, J.S., and Yu, P.S. (1998). Efficient data mining for path traversal patterns. IEEE Transactions on Knowledge and Data Engineering, 10(2), 209-221.

 [9]: Ukkonen, E. (1995). On-line construction of suffix trees. Algorithmica, 14(3), 249-260. Data preparation for mining.

[10]: Cooley, R., Mobasher, B., and Srivastava, J. (1999).World Wide Web browsing patterns. Journal of Knowledge and information Systems, 5-33

[11]: Chen, Z., Flowler, RH., and Fu, A. (2003). Linear time algorithms for finding maximal forward references. Proceedings of the IEEE International Conference on Information Technology: Coding and Computing, (pp. 160-164).

 [12]: Berendt, B., Mobasher, B., Spiliopoulou, M., and Wiltshire, J. (2001). Measuring the accuracy of sessionizers for Web usage analysis. Proceeding of the Workshop on Web Mining at the First SIAM International Conference on Data Mining, (pp. 7-14).

 [13]: Weiner, P. (1973). Linear pattern matching algorithms. Proceedings of the 14th IEEE Annual  Symposium on Switching and Automata Theory, (pp. 1-11).

 [14]: Gusfield, D. (1997). Algorithms on strings, trees, and sequences. Cambridge University Press.

 [15]: Chen, Z., Fowler, R.H., Fu, A., and Wang, C. (2003). Fast construction of generalized suffix trees over a very large alphabet. Proceedings of the Ninth International Computing and Combinatorics Conference, Lecture Notes in computer Science LNCS 2697, (pp. 284-293).

[16]: Pitkow, J. (1997). In search of reliable usage data on the WWW. Proceedings of the International World Wide Web Conference, Santa Clara, California, 451-463.

[17]: Cooley, R., Mobasher, B., and Srivastava, J.

(1997a). Grouping Web page references in to transaction for mining World Wide Web browsing patterns. Proceedings of the IEEE International Kawledge and Data Engineering Workshop, Netport Beach, CA, 2-9.

[18]: Byrne, M.D., John, B.E., Wehrle, N.S., and Crow, D.C. (1999). The tangled Web we wove: A taskonomy of WWW use. Proceedings of the International Conference on Human Factors in Computing Systems, Pittsburgh, Pennsylvania, 544-551.

[19]: Cockburn, A., and Mckenzie, B. (2001). What do Web user do ? An empirical analysis of Web use. International Journal of Human-Computer Studies, 54(6), 903-922.

[20]: Woon, Y.K., Ng, W.K., and Lim, E.P. (2002). Online and incremental mining of separately grouped Web access logs. Proceedings of the 3rd  International Conference on Web Information Systems Engineering, Singapore.

[21]: Hartigan, J. (1975). Clustering algorithms. John Wiley.

[22]: McQueen, J. (1967). Some methods for classification and analysis of multivariate observation. Preceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, (pp. 281-297).

[23]: Jain, A.K, Murty, M.N, and FLYNN,P.J. (1999). "DataClustering:AReview," ,ACM Computing Surveys,Vol.31,  No.3.

[24]: Minh, D.L.(2000). "Applied probability models," Duxbury, Thomson Learning, ISBN 0-534-38157-x.

[25]: Jianhan, zhu. (2003). "Mining Web Site Link Structures for Adaptive Web Site Navigation and Search," Ph.D Thesis, university of ulster at jordanstown.

[26]: O, Etzioni. (1996). The world wide web: Quagmire or goldmine.

Communication of the ACM, 39(11): 65-68

[27]: اناری، ب.، "الگوریتمهایی مبتنی بر اتوماتاهای یادگیر برای تعیین ساختار اسناد وب و کاربردهای آنها" پایان نامه کارشناسی ارشد،دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد اراک.


دانلود با لینک مستقیم


پروژه کاوش وب و تکنیک ها و کاربردهای آن. doc

مقاله ابزار کاوش اینترنت

اختصاصی از فی دوو مقاله ابزار کاوش اینترنت دانلود با لینک مستقیم و پر سرعت .

مقاله ابزار کاوش اینترنت


مقاله ابزار کاوش اینترنت

دانلود مقاله ابزار کاوش اینترنت 34 ص با فرمت WORD 

 

 

 

 

 

بسیاری از ما اولین تجربه استفاده از اینترنت را از طریق ابزارهای کاوش کسب کرده ایم اما براستی ابزارهای کاوش اینترنت کا روزانه میلیون ها نفر د رسراسر جهان از آن استفاده می کنند ، چه ویژگیها و امکاناتی دارند ؟ و چگونه کار می کنند ؟

ابزار های کاوش : اینترنت ، پایگاههای اطلاعاتی قابل جستجو2 یا مرور3 هستند که با استفاده از آنها می توان به « بخشی » از اطلاعات موجود را اینترنت دست یافت . این ابزارها به دو شیوه « جستجوی کلید واژه ها » یا « مرور وانتخاب » پیوند های فرامتنی 4کاربران را به سوی اطلاعات مورد نظر ، هدایت می کنند .

ابزارهای کاوش اینترنت را می توان به دو نوع اصلی تقسیم بندی کرد : راهنمای موضوعی 5و موتورهای کاوش6 . موتورهای کاوش اینترنت و راهنمای موضوعی نسبت به یکدیگر مزایا و محدودیتهایی دارند و رویکرد آنها برای انتخاب گرد آوری و نمایه سازی اطلاعات در محیط اینترنت ، متفاوت است در این کتاب ، اصطلاح «ابزارهای کاوش اینترنت » بر دو مفهوم موتور کاوش و راهنمای موضوعی دلالت می‌کند .


2 Searchable

3 borowsable

4 hypertnt links

5 Subject dire ctories

6 search engines


دانلود با لینک مستقیم


مقاله ابزار کاوش اینترنت

کتاب بی نظیر و ارزشمند اسرار کاوش .برای شما که بدنبال معنی و مفهوم نشانه ها هستید

اختصاصی از فی دوو کتاب بی نظیر و ارزشمند اسرار کاوش .برای شما که بدنبال معنی و مفهوم نشانه ها هستید دانلود با لینک مستقیم و پر سرعت .

کتاب بی نظیر و ارزشمند اسرار کاوش .برای شما که بدنبال معنی و مفهوم نشانه ها هستید


کتاب بی نظیر و ارزشمند اسرار کاوش .برای شما که بدنبال معنی و مفهوم نشانه ها هستید

این کتاب که مجموعه ای کامل و ارزشمند است در مورد تمام نشانه ها و معنی و مفهوم آنها به صورت دقیق و با زبانی ساده توضیح داده است .

معانی آثار و علائم دفینه و گنج ها : تفسیر و توضیح علائم و نشانه های مهم دفینه در علم باستان شناسی شامل :علائم و نشانه های مهم دفینه را بشناسیم ، نشانه های دفینه چگونه رمز گشایی می شوند ، معانی آثار و علائم دفینه: ماهی ، درختان کهنسال ، بت خانواده ، شیر ، جای پا ، شکل چارق یا کفش ، …

با امید به اینکه برای شما عزیزان مفید و موثر واقع شود.


دانلود با لینک مستقیم


کتاب بی نظیر و ارزشمند اسرار کاوش .برای شما که بدنبال معنی و مفهوم نشانه ها هستید

دانلود مقاله ابزار کاوش اینترنت

اختصاصی از فی دوو دانلود مقاله ابزار کاوش اینترنت دانلود با لینک مستقیم و پر سرعت .

 

 

 

ابزار کاوش اینترنت1 چیست ؟
بسیاری از ما اولین تجربه استفاده از اینترنت را از طریق ابزارهای کاوش کسب کرده ایم اما براستی ابزارهای کاوش اینترنت کا روزانه میلیون ها نفر د رسراسر جهان از آن استفاده می کنند ، چه ویژگیها و امکاناتی دارند ؟ و چگونه کار می کنند ؟
ابزار های کاوش : اینترنت ، پایگاههای اطلاعاتی قابل جستجو2 یا مرور3 هستند که با استفاده از آنها می توان به « بخشی » از اطلاعات موجود را اینترنت دست یافت . این ابزارها به دو شیوه « جستجوی کلید واژه ها » یا « مرور وانتخاب » پیوند های فرامتنی 4کاربران را به سوی اطلاعات مورد نظر ، هدایت می کنند .
ابزارهای کاوش اینترنت را می توان به دو نوع اصلی تقسیم بندی کرد : راهنمای موضوعی 5و موتورهای کاوش6 . موتورهای کاوش اینترنت و راهنمای موضوعی نسبت به یکدیگر مزایا و محدودیتهایی دارند و رویکرد آنها برای انتخاب گرد آوری و نمایه سازی اطلاعات در محیط اینترنت ، متفاوت است در این کتاب ، اصطلاح «ابزارهای کاوش اینترنت » بر دو مفهوم موتور کاوش و راهنمای موضوعی دلالت می‌کند .
در حال حاضر ، تقریبا کلیه ابزارهای کاوش اینترنت به منظور جستجو وبازیابی اطلاعات در محیط شبکه جهانی وب طراحی می شوند ودر دسترس قرار می گیرند به همین دلیل ، از آنها به عنوان « موتورهای کاوش وب » و«راهنماهای موضوعی وب » نیز نام برده می شود یکی از راهنماهای ابزارهای کاوش اینترنت به نام Search Engine Guide مدعی است که تاماه جولای 2001 بیش از 2500 راهنمای موضوعی و موتور کاوش را در زمینه های مختلف ، شناسایی وبه صورت موضوعی ،تقسیم بندی کرده است ( 10 ) از آنجا که ابزارهای کاوش اینترنت ، تنها راه رویارویی با حجم فزاینده ی اطلاعات در محیط وب هستند ، دور از انتظار نخواهد بود که چنین ابزارهایی بسرعت رشد وتوسعه پیدا کنند .

 

راهنماهای موضوعی : رویارویی انسان با محیط وب
راهنماهای موضوعی وب : پایگاههایی هستند که اطلاعات صفحات یا سایت های وب منتخب را توسط نیروی انسانی در پایگاه خودنمایه می کنند در راهنماهای موضوعی وب فرایند شناسایی بررسی ، تجزیه و تحلیل ، ارزیابی و نمایه سازی صفحات یا سایت های وب توسط نیروی انسانی و براساس معیارهای از پیش تعیین شده انجام می شود راهنماهای موضوعی وب برای در دسترس قرار دادن اطلاعات
صفحات یا سایت های وب اغلب از نظام سلسله مراتب موضوعی استفاده می کنند .
درسال 1994 اولین راهنمای قابل جستجوی وب ، تحت عنوانEINET Galaxy با این ویژگی ها در دسترس عموم قرار گرفت و کمی پس از آن ابتکار و دانشجو در ارائه یک فهرست موضوعی از سایت های منتخب ، باعث پدید آمدن ( www. Yahoo . com ) yahoo شد که هم اکنون یکی از رایج ترین و پر استفاده ترین ابزارهای کاوش اینترنت بشمار می آید . ( 14 :ص 290)
راهنماهای موضوعی ، اغلب از طریق ویراستاران یا متخصصان موضوعی به تجزیه وتحلیل محتوایی ، ارزیابی و گزینش صفحات یا سایت های وب می پردازند با اینکه راهنماهای موضوعی وب در مقایسه با موتورهای کاوش ، بخش کمی ازاطلاعات موجود در اینترنت را پوشش می دهند اما از آنجا که فرایند گرد آوری و تجزیه و تحلیل اطلاعات توسط نیروی انسانی انجام می شود اغلب کیفیت و ارزش نسبت بالایی دارند برای نمونه بیش از 40 هزار ویراستار و متخصص و داوطلب در سراسر جهان با راهنمای موضوعی ( http // moz ) open Directory جهت شناسایی ، انتخاب و ارزیابی صفحات یا سایت های وب همکاری دارند و راهنمای موضوعی! yahoo برای انجام فعالیتهای مشابه از بیش از 150 نفر ویراستار و متخصص موضوعی استفاده می کند ( 3) راهنماهای موضوعی وب اغلب توضیح مختصری درباره محتوای صفحات یا سایت های وب موجود در پایگاه خود که توسط ویراستاران تهیه و تنظیم شده است ارائه می دهند همین موضوع باعث می شود تا به سهولت بتوان از موضوع و محتوای صفحات یا سایت های وب آگاهی یافت دو نوع راهنمای موضوعی را می توان شناسایی کرد : راهنمای موضوعی عمومی1 : که تقریبا کلیه موضوعات و حوزه های دانش بشری را پوشش می دهند ، مانند( www . look smart . com ) look smart , open Directory , yahoo ! وراهنمای موضوعی خاص 2که منحصرا برای دسترسی به اطلاعات حوزه خاصی مانند فیزیک ، شیمی ، زیست شناسی ، کتابداری و .. ارائه می شوند برای مثال ( www . iranhoo . com ) Iranhoo یک راهنمای موضوعی به زبان فارسی مختص سایت های ایران است .
راهنماهای موضوعی ، ساختار موضوعی و سلسله مراتب منطقی دارند به طوری که از طریق موضوعات کلان می توان به موضوعات خاص تر دسترس پیدا کرد برای مثال راهنماهای موضوعی , yahoo ! دارای 14 بخش موضوعی کلان نظیر هنر و علوم انسانی ،آموزش و پرورش ، کامپیوتر و اینترنت ، علوم ، علوم اجتماعی و .. است که با انتخاب هر یک از آن ها می توان به صورت سلسله مراتبی به موضوعات خاص تر است دست یافت نمونه ساختار سلسله مراتب موضوعی برای دسترسی به مجلات حوزه کشاورزی در شکل زیر نمایش داده شده است .
Yahoo scienc > Agriculture > journals - Micro Soft Internet Explorer
File Edit View Favorites Tools Help
Address | http : // dir . yahoo . com Go
Yahoo ! compaa Help - check Email
Jobs yahoo ! careers
Search

 


در مثال زیر ساختار سلسله مراتبی راهنمای موضوعیyahoo !برا ی دسترسی به صفحات یا سایت های وب در زمینه برنامه های درسی و گروههای کتابداری دانشگاهها نشان داده شده است .
Socil science
Library and In formation Science
Education College and university
Depar tments and programs
بسیاری را راهنماهای موضوعی وب علاوه برساختار سلسله مراتب موضوعی امکاناتی هم برای جستجوی کلیه واژه ها در نظر گرفته اند تا مانند موتورهای کاوش بتوان در پایگاه آنها به جستجوی کلیه واژه های مورد نظر پرداخت حتی برخی از راهنماهای موضوعی نظیر yahoo ! open Directory امکاناتی برای جستجوی کلیه واژه ها در بخشهای موضوعی خاص پیش بینی شده است این قابلیت در راهنمای open Directory از طریق گزینه category only this قابل دسترسی است فرض کنید به دنبال اطلاعاتی درباره تجهیزات چشم پزشکی هستند شما می توانید به ترتیب پس از وارد شدن به بخش موضوعی بهداشت ، پزشکی ، تخصص های پزشکی و درنهایت چشم پزشکی کلیه واژه های مرتبط با تجهیزات چشم پزشکی را درکادر جستجو تایپ و گزینه category only this را انتخاب کنید به این ترتیب کلیه واژه های فقط در بخش موضوعی چشم پزشکی مورد جستجو قرار می گیرند وتا حدود بسیار زیادی از بازیابی اطلاعات نامرتبط ( مربوط به بخشهای موضوعی دیگر ) جلوگیری می شود .

 

نقش کتابداری در طراحی راهنماهای موضوعی :
یکی ازدلایل موفقیت راهنمای موضوعی yahoo! که هم اینک پر مراجعه ترین ابزار کاوش اینترنت به شمار می آید استفاده از دانش چندین ساله علم کتابداری در سازماندهی سلسله مراتبی اطلاعات بود ه است .
متولیان اصلی yahoo ! در نخستین روزهای تاسیس آن یک کتابدار با تجربه را به خدمت گرفتند تا بتوانند اطلاعات گرد آوری شده را در قالب سلسله مراتب موضوعی سازماندهی کنند ودر دسترس استفاده کنندگان قرار دهند کتابداران سالیان متعادی و طیفه نقد و بررسی ونیزانتخاب و سفارش منابع چاپی را برعهده داشتند بنابراین دور ا ز انتظار نیست که امروز مسئولیت اصلی ارزیابی و تجزیه وتحلیل محتوای منابعی اطلاعاتی دروب را نیز برعهده بگیرند درحال حاضر ، بسیاری از راهنماهای موضوعی وب در حوزه های مختلف توسط کتابداران تهیه و گرد آوری می شود .
برای نمونه راهنمای موضوعی ( http // infoine edu ) Infomine که اطلاعات بیش از 23 هزار سایت علمی را پوشش می دهد توسط کتابداران راه اندازی شده است . بسیاری از کتابداران بویژه درکتابخانه های دانشگاهی و تحقیقاتی وظیفه اصلی طراحی راهنماهای موضوعی به منابع اطلاعاتی در وب را بر عهده دارند زیرا آنها از یک سو با نیازهای اطلاعاتی استفاده کنندگان آشنا هستند واز سوی دیگر برای تجزیه وتحلیل محتوا و ارزیابی اعتبار وصحت و کیفیت اطلاعات دانش و تجزیه لازم را دارند ( www. Lit ory ) librarian Indento Internet یکی از مهمترین راهنماهای موضوعی است که توسط کتابداران و متخصصان موضوعی دردسترس همگان قرار گرفته است .

 

موتورهای کاوش : تقابل ماشین به محیط وب
موتورهای کاوش : پایگاههای اطلاعاتی قابل جستجویی هستند که از طریق برنامه
های کامپیوتری به شناسایی و نمای سازی خود کار صفحات وب می پردازند موتورهای کاوش برخلاف راهنماهای موضوعی برنامه های خود کاری هستند که هیچ گونه وابستگی به نیروی انسانی ندارند به تعبیر دیگر ، فرایند شناسایی ، انتخاب و نمایه سازی اطلاعات وب توسط برنامه های کامپیوتری انجام می شود .
هر موتور کاوش منفرد ، دارای سه جزئی اصلی است روبات ها ،پایگاه اطلاعاتی و نرم افزار بازیابی اطلاعات که فرایند جستجو و بازاریابی اطلاعاتی از طریق ارتباط متقابل میان آنها صورت می پذیرد .
1- روبات ها1 : بارشد روز افزون شبکه جهانی وب ، این موضوع روشن شد که از طریق نظامهای نمایه سازی ودستی ومبتنی بر نیروی انسانی نمی توان باحجم فزاینده ای از اطلاعات در این محیط روبرو شدن به همین دلیل برنامه های خودکاری برای شناسایی ، گرد آوری ونمایه سازی صفحات وب تحت عنوان روبات ها توسعه یافتند در برخی متون به جای روبات ها از اصطلاحاتی مثل عنکبوت ها 2، خزندها 3،یا کرمها4 استفاده شده است روبات ها برنامه های خودکاری هستند که به طور پیوسته در فواصل زمانی معین ، (اغلب یک یا چندماه ) فضای اینترنت را مبتنی بر ساختار فرا پیوندی وب مورد جستجو قرار دهند وبه شناسایی ونمایه سازی صفحات وب جدید یا اصلاح اطلاعات موجود در پایگاه اطلاعاتی موتورهای کاوش می پردازند .
با وجود اینکه روبات ها یکی از مهمترین اجزای تشکیل دهنده موتورهای کاوش هستند ، ولی برخی از موتورهای کاوش برای ارائه نتایج اصلی جستجو از پایگاههای اطلاعاتی دیگر ابزارهای کاوش استفاده می کنند برای مثال ، ابزارهای کاوش Northern light Google Encite Altavista دارای روبات های و Lgcos با مبتنی بر اطلاعات موجود در پایگاه های اطلاعاتی دیگر ابزارهای کاوش است .
2-پایگاه اطلاعاتی : هر گونه اطلاعاتی که روبات ها از صفحات وب جمع آوری می کنند به بخش دوم موتورهای کاوش یعنی پایگاه اطلاعاتی افزوده می شود در برخی از متون اصطلاح فهرست یا نمایه به جای پایگاه اطلاعاتی موتور کاوش به کار رفته است پایگاه اطلاعاتی موتور کاوش شامل فهرست نظام مندی از صفحات وب است که اطلاعات مربوط به صفحات وب در آنجا ذخیره می شود .
3- نرم افزار بازیابی اطلاعات :نرم افزار بازیابی اطلاعات : درواقع واسط جستجو و برنامه ای است که از طریق وارد کردن کلیه واژه های در فیلد های مختلف می توان در میلیونها صفحه وب نمایه شده در پایگاه اطلاعاتی موتورهای کاوش به جستجوی اطلاعات موردنظر بپردازد .
به طور کلی همه موتورهای کاوش فرایند جستجو وبازیابی اطلاعات را از طریق برقراری ارتباط میان سه جزء اصلی تشکیل دهنده خودیعنی روبات ها ، پایگاه اطلاعاتی ونرم افزار بازیابی اطلاعات انجام می دهند مهمترین :
مراحل این فرایند عبارتند از :
1- شناسایی و نمایه سازی اطلاعات صفحات یا سایت های وب توسط روبات ها
2- انتقال ودرج اطلاعات گرد آوری شده در پایگاه اطلاعاتی موتور کاوش
3- جستجوی اطلاعات در پایگاه اطلاعاتی از طریق نرم افزار بازیابی اطلاعات
4- بازیابی ، رتبه بندی ونمایش اطلاعات مبتنی بر اطلاعات موجود در پایگاه اطلاعاتی

 

مزایا راهنماهای موضوعی نسبت به موتورهای کاوش
طبق بررسیهای به عمل آمده پیش از 41 درصداز کاربران اینترنت در امریکا از راهنمای موضوعی yahoo! برای دسترسی به اطلاعات استفاده می کنند این راهنما رایج ترین و پر استفاده ترین ابزار کاوش وب محسوب می شود در حالی که بزرگترین موتور کاوش از لحاظ جامعیت اطلاعات یعنی Google تنها توسط حدود 14 درصد از کاربران از اینترنت درامریکا مورد استفاده قرار میگیرد برخی عقیده دارند که هم که اسم yahoo! یکی از دلایل مهم مراجعه بسیار زیاد کاربران به این سایت است اما آیا واقعا این تنها دلیل موفقیت این راهنمای موضوعی وب در میان انبوهی از ابزارهای کاوش است یا باید به دنبال عوامل تاثیر گذار دیگری نیز بود ؟
• دسترس بهتر به اطلاعات مرتبط : رویکرد نمایه سازی انسانی در راهنماهای وب و همچنین گنجاندن اطلاعات در قالب تقسیمات موضوعی باعث شده است تا ریزش کاذب ( بازیابی اطلاعات غیر مرتبط یاناخواسته ) آنها نسبت به موتورهای کاوش ، بسیار کمتر باشد از طریق تقسیمات سلسله مراتب موضوعی را در راهنماهای موضوعی می توان به طور یکپارچه به اطلاعات موردنظر درهمان زمینه موضوعی که قبلا توسط ویراستاران مورد ارزیابی و تجزیه وتحلیل قرار گرفته است نیز یافت .
• صرف زمان کمتر برای دسترسی به اطلاعات : ساختار موضوعی و سلسله مراتبی در راهنماهای موضوعی وب با استفاده کنندگان امکام می دهد با انتخاب موضوعات اصلی وسپس فرعی از وجود یا عدم وجود اطلاعات مورد نظر درراهنماهای موضوعی آگاه شوند وزمان نسبتا کمتری را در مقایسه باموتورهای کاوش ضرب بازیابی اطلاعات کمتر جستجو از طریق موتورهای کاوش اغلب منجر به بازیابی صدها یاهزاران پیوند فرامتنی به صفحات وب می شود که بررسی کلیه آنها برای استفاده کنندگان نهایی ، بسیار وقت گیر یا امکان ناپذیر است .
• سهولت مرور و بازیابی اطلاعات : ساختار سلسله مراتبی راهنماهای موضوعی وب در بسیاری از موارد به استفاده کنندگان امکان می دهد با انتخاب موضوعات کلان و سپس خاص تر ، اطلاعات را به آسانی مرور و بازیابی کنند برخلاف موتورهای کاوش ،استفاده کنندگان نیازی به دانستن مهارت و امکانات پیچیده جستجو و عملکردهای بول ،جستجوی عبارتی ، نزدیک یابی و .. ) ندارند .
باوجود این بسیاری از راهنماهای موضوعی وب مانند yahoo ! open Directory, علاوه بر ساختار موضوعی و سلسله امکان جستجوی کلیه واژه ها را نیز در پایگاه اطلاعاتی خود در اختیار قرار می دهند .

 

محدودیتهای راهنماهای وب نسبت به موتورهای کاوش
با اینکه راهنماهای موضوعی ، یکی از پر استفاده ترین ومهمترین ابزارهای کاوش به وب هستند اغلب اطلاعات پالایش شده مرتبط وبا کیفیت مناسب در اختیار استفاده کنندگان خود قرار می دهند اما محدودیتهایی نیز دارند که باید مد نظر داشت . برخی از مهمترین محدودیتهای راهنماهای موضوعی وب نسبت به موتورهای کاوش عبارتند از :
• پوشش کم اطلاعات موجود در وب : وابستگی تنگاتنگ راهنماهای موضوعی وب به نیروی انسانی در گرد آوری و ارزیابی محتوایی صفحات وب باعث شده است که آنها نتوانند بارشد شگفت آور و فزاینده اطلاعات در وب همگام باشند از آنجا که روزانه بیش از 7 میلیون صفحه به فضای وب افزوده می شود شناسایی و بررسی این حجم اطلاعات خارج از توان نیروی انسانی است به همین دلیل ، پوشش اطلاعات موجود در وب درراهنماهای موضوعی نسبت به موتورهای کاوش ، بسیار کمتر است بزرگترین راهنماهای موضوعی وب یعنی open Directory تا ماه سپتامبر 2001 در حدود 8/2 میلیون صفحه وب در پایگاه خود پوشش داده بود .
• روز آمد نبودن اطلاعات : هنگامی که ویراستاران راهنماهای موضوعی توانایی بررسی و ارزیابی سایت های وب جدید را در مدت زمان کوتاه نداشته باشند بدیهی است پایگاه اطلاعاتی روز آمدی نیز می توان در اختیار استفاده کنندگان قرار داد به این ترتیب روز آمد سازی اطلاعات توصیفی ارائه شده برای هر مدخل نیز دشوار خواهد بود زیرا ممکن است محتوای صفحات یا سایت های وب در مدت زمان کوتاهی تغییر کنند درحالی که موتورهای کاوش از طریق روبات های خود تا حدود بسیاری زیادی می تواند این مشکل را حل کند .
تغییر نشانی صفحات یا سایت های وب به هر دلیل ، یکی دیگر از مشکلات اساسی راهنماهای موضوعی برای روز آمد سازی نشانی های جدید است به همین دلیل پیوندهای کور ( نشانی های از طریق آنها نمی توان صفحات وب را مشاهده کرد ) در پایگاه اطلاعاتی راهنماهای موضوعی وب بیشتر از موتورهای کاوش است .
• نیاز به آگاهی از ساختار سلسله مراتب موضوعی علوم : یکی دیگر ا زمحدودیتهای استفاده از راهنماهای موضوعی وب این است که کاربران باید تا حدودی از سلسله مراتب موضوعی علوم ، اگاهی داشته باشند برای نمونه . فرض کنیم به دنبال اطلاعاتی درباره« علم ژنتیک »هستند آیا می دانید با انتخاب کدام بخش موضوعی کلان ( نظیر علوم انسانی ،علوم ،علوم اجتماعی و .. ) در راهنمای open Directory می توانید به اطلاعات مورد نظر دسترسی پیدا کنید ؟ از طرف دیگر تقسیم بندی موضوعی در راهنماهای موضوعی مختلف ممکن است با یکدیگر تفاوت داشته باشد برای مثال موضوع در علوم کتابداری و اطلاع رسانی در راهنمای! yahoo در بخش Social Science ودر راهنمای open Directory در بخش Social Science ودر راهنمای open Directory در بخش Refernce > Libraries آورده شده است بنابراین ، استفاده مناسب از قابلیت مرور در راهنماهای موضوعی تا حدود زیادی مستلزم داشتن آگاهی کافی از تقسیمات موضوعی دانش بشری است .

 

راهنمای موضوعی یا موتور کاوش : کدام بهتر است ؟
هم اینک جامعیت و مانعیت به عنوان دو معیار ارزیابی توام های بازیابی اطلاعات در ارزیابی کارایی راهنمای موضوعی و موتور کاوش موردتوجه قرار گرفته اند راهنماهای موضوعی وب از لحاظ پوشش اطلاعات موجود در محیط وب جامعیت کمتری دارند ولی تا حدود بسیار زیادی امکان دسترسی به اطلاعات مرتبط در زمینه های موضوعی مختلف را فراهم می کنند . در نقطه مقابل موتورهای کاوش وب هستند که حجم بسیاری از اطلاعات در اینترنت را پوشش می دهند اما دقت یا مانعیت بسیار کمتری در بازیابی اطلاعات مرتبط دارند .
بسیاری از متخصصان اطلاع رسانی نظیر لنکستر1 عقیده دارند که دستیابی بیشتر2 به معنای دستیابی بهتر3 به اطلاعات نیست زیرا استفاده کنندگان نهایی به دنبال دسترسی به اطلاعات با کیفیت بالا هستند و ابزارها یا افرادی راترجیح می دهند که قادر به تفکیک موضوعات مشابه و پالایش کیفی اطلاعات باشند .
اگر راهنماهای موضوعی وب ، بخوی تهیه و تنظیم شده باشند ، تا حدود بسیار زیادی دارای چنین خصوصیاتی هستند به طور کلی در کلیه متون نگاشته شده درباره روش های جستجوی اطلاعات در شبکه جهانی وب این نکته مورد تاکید قرار گرفته است که برای دستیابی به اطلاعات مختلف درباره ی یک زمینه ای موضوعی کلان ( نظیر شیمی ، دامپزشکی ، ستاره شناسی ، بیوتکنولوژی و .. ) ازراهنماهای موضوعی وب استفاده شود زیرا اغلب آنها اطلاعات گسترده و متنوعی ( نظیر سازمان ها ، دانشگاه ها مراکز تحقیقاتی ،انتشارات ،کتابها و .. ) درباره یک حوزه موضوعی ارائه می دهند .
در حالی که ،اغلب توصیه می شود برای دسترسی به موضوعات خاص تر ( نظیر آلودگی آبهای خلیج فارس ، دستگاه های تقطیر یا اقتصاد ژاپن در سال 2000 ) ازموتورهای کاوش استفاده شود زیرا آنها حجم نسبتا بیشتری از اطلاعات موجود در اینترنت را پوشش می دهند واحتمال دسترس به اطلاعات خاص از طریق آنها بیشتر است .
آنچه مسلم است ،نمی توان گفت کدام یک از ابزارهای کاوش ( راهنماهای موضوعی یا موتورهای کاوش ) به طور مطلق بهتر از دیگری است زیرا هر یک از آنها جایگاه کاربرد خود را در فرایند اطلاع یابی در اینترنت دارند وکاوشگران برای انجام جستجوهای موفق باید منطبق با نیازهای خود ودر زمان مناسب از هریک از آنها بهره گیرند .

 

ابزارهای کاوش ترکیبی یا دو وجهی : 1
این ابزارهای کاوش ،ویژگی های راهنماهای موضوعی و موتورهای کاوش را در قالبی واحد ویکپارچه ارائه می دهند . برای مثال موتورهای کاوش HotBot , Alta vista , Google از امکانات راهنماهای موضوعی نیز برای دسترسی به اطلاعات بهره می گیرند .

 

بخش راهنماهای موضوعی در موتور کاوش HotBot
این ابزار کاوش علاوه بر ویژگی های موتورهای کاوش از ساختار موضوعی و سلسله مراتبی راهنماهای موضوعی نیز برای برطرف کردن نقاط ضعف خود استفاده می کند . موتورهای کاوش Alta vista , Google نمونه های دیگری از چنین ابزارهای کاوش هستند که به آنها ابزارهای کاوش ترکیبی یا دو وجهی نیز می گویند .
ابر موتورهای کاوش 2
ابر موتورهای کاوش ، به منظور بالا بردن کارایی و افزایش جامعیت جستجوی اطلاعات در شبکه جهانی وب ابداع شدند . طبق بررسیهای به عمل آمده بزرگترین موتور کاوش یعنی Google مدعی است که حال تامارس 2002 اطلاعات حدود 1/2 میلیارد صفحه در محیط وب را در پایگاه خود نمایه کرده است حال آنکه طبق مطالعات آماری صورت گرفته تا اوایل سال 2001 بیش از 2/4 میلیارد صفحه درشبکه جهانی وب وجود داشته است .
بنابراین حتی بزرگترین موتورکاوش منفرد ، صرفنظر از وب نامرئی – که در بخش های آتی به آن خواهیم پرداخت فقط توانسته اند تقریبا نیمی از اطلاعات موجود در وب را پوشش دهند از این ، رو برای انجام جستجوهای جامع ، فناوری و ابزاری مورد نیاز است که از طریق آن بتوانیم حجم بیشتری از اطلاعات محیط وب را بازیابی کرد که از آن تحت عنوان ابر موتور کاوش نام برده می شود ( شکل زیر ) .

 

روش جستجو و بازیابی اطلاعات توسط ابر موتورهای کاوش
ابر موتورهای کاوش کلیه واژه های مورد جستجو را به طور همزمان به پایگاه های اطلاعاتی چند ابزار کاوش ارسال می کنند بدین ترتیب برخلاف موتورهای کاوش و راهنماهای موضوعی که برای بازیابی اطلاعات فقط از پایگاه اطلاعاتی خودشان استفاده می کنند از طریق چندین پایگاه اطلاعاتی دیگر به جستجو و بازیابی اطلاعات می پردازند .

 

 

 

 

 

 

 

ابر موتورهای کاوش با فهرست یکپارچه یا واحد
یکی از اولین ودرعین حال شناخته شده ترین ابر موتورهای کاوش ( www . meta crawler . com) Metacrawler نام دارد که می تواند در پایگاه 12 ابزار کاوش منفرد جستجو کند برخی از ابرموتورهای کاوش مثل Metacrawler و profusion فهرست واحد یکپارچه ای از ترکیب اطلاعات موجود در پایگاه های ابزارهای کاوش منفرد ارائه می دهند که به آنها ابرموتورهای کاوش با فهرست یکپارچه با واحد گفته می‌شود.
این نوع ابر موتورهای کاوش ،نتایج تکراری بازیابی شده ازچند ابزار کاوش منفرد را حذف می کنند و به همین دلیل ، کاربرد فراوانی دارند .

 

ابر موتورهای کاوش profusion
با استفاده از این ابر موتورهای کاوش می توان از طریق یک واسط جستجو ، به طور همزمان در پایگاه های اطلاعاتی 12 ابزار کاوش منفرد به جستجو پرداخت .

 

ابر موتورهای کاوش با فهرست چند گانه
ابر موتورهای کاوش دیگری نیز هستند که در یکپارچه سازی و حذف نتایج جستجوی تکراری از ابزارهای کاوش منفرد نقشی ندارند و تنها به طور جداگانه فهرست چند گانه نتایج جستجو از هر ابزار کاوش منفرد را نمایش می دهند این نوع ابرموتورهای کاوش ، نتایج جستجو را د ر قالب صفحات جداگانه بر گرفته از ابزارهای کاوش منفرد ارائه می کنند . به این ترتیب ، پس از جستجو صفحات جداگانه متعلق به ابزارهای کاوش منفرد نمایش داده می شوند و استفاده کنندگان باید هریک از آنها را به طور جداگانه بررسی کند . این ابر موتورهای کاوش ابر موتورهای کاوش با فهرست چند گانه نامیده می شوند که کاربرد کمتری دارند و فقط از مراجعه جداگانه به ابرازهای کاوش منفرد جلوگیری می کنند .

 

مزایای استفاده از ابر موتورهای کاوش
برخی از مهمترین مزایای استفاده ا ز ابرموتورهای کاوش عبارتند از : 1) افزایش جامعیت در بازیابی اطلاعات 2) صرفه جویی در زمان ، جستجو در ابزارهای کاوش منفرد و 3) حذف نتایج تکراری از پایگاه ابزارهای کاوش مختلف .

 

محدودیتهای استفاده از ابرموتورهای کاوش
مهمترین محدودیتهای استفاده از ابر موتورهای کاوش عبارتند از بازیابی بیش از حد اطلاعات ، امکانات کاوش محدوده سرعت کم بازیابی اطلاعات ، کاوش سطحی در پایگاه های اطلاعاتی .

 

نرم افزارهای کاوش
برای جستجو در محیط وب ،برنامه هایی وجود دارد که برای استفاده از آنها ابتدا باید نرم افزار کاوش را بر روی کامپیوترشخصی خود نصب کرد چنین برنامه هایی ، برخلاف ابزارهای کاوش رایج که ا ز طریق محیط وب ، قابل دسترس و دارای نشانی مشخصی هستند ( نظیر www . altavista . com) هیچ گونه وابستگی به محیط وب ندارند و برنامه کاوش بر روی کامپیوتر شخصی ، نصب واجرا می شود .
اغلب نرم افزارهای کاوش ،

 

فرمت این مقاله به صورت Word و با قابلیت ویرایش میباشد

تعداد صفحات این مقاله  56 صفحه

پس از پرداخت ، میتوانید مقاله را به صورت انلاین دانلود کنید


دانلود با لینک مستقیم


دانلود مقاله ابزار کاوش اینترنت

تحقیق در مورد تاریخچه شرکت نساجی کاوش گلدشت

اختصاصی از فی دوو تحقیق در مورد تاریخچه شرکت نساجی کاوش گلدشت دانلود با لینک مستقیم و پر سرعت .

تحقیق در مورد تاریخچه شرکت نساجی کاوش گلدشت


تحقیق در مورد تاریخچه شرکت نساجی کاوش گلدشت

لینک پرداخت و دانلود *پایین مطلب*

 

فرمت فایل:Word (قابل ویرایش و آماده پرینت)

  

تعداد صفحه1

 

فهرست مطالب ندارد

در سایر زمینه ها نیز این شرکت هرگز دست از تلاش و تحقیق و توسعه بر نداشته و با توسعه حوزه فعالیت خود هم اینک این شرکت عضو گروه شرکت کاوش بوده و در شرکت کاوشگران وب ساز زاینده رود اقدام به ارائه سرویس و خدمات به سایر شرکتها در زمینه طراحی وب سایت و سی دی های مولتی مدیا و پایانه های اطلاع رسانی و سامانه های تجارت الکترونیک نموده است . و با تاسیس شرکت کاوش کالا (در شرف تاسیس ) در زمینه تهیه و ارائه انواع کالا ها ، مواد اولیه و ماشین الات کلیه صنایع و صادرات شروع به فعالیت خواهد نمود .

 


دانلود با لینک مستقیم


تحقیق در مورد تاریخچه شرکت نساجی کاوش گلدشت