فال

قالب وبلاگ

قالب وبلاگ

اس ام اس عاشقانه

نمایه


نمایه
 
پيوند ها

محل درج آگهی و تبلیغات
 
نوشته شده در تاريخ سه‌شنبه ٢٥ تیر ۱۳۸٧ توسط نمایه


نوشته شده در تاريخ سه‌شنبه ٢٥ تیر ۱۳۸٧ توسط نمایه

هوش مصنوعی و سیستم های خبره و کاربرد آن ها

در کتابداری و اطلاع رسانی

نوشته : علی شاه شجاعی

دانشجوی دکتری کتابداری و اطلاع رسانی

 

کلید واژه ها : هوش مصنوعی /سیستم های خبره /یادگیری / نظام های رایانه ای/ پایگاه های اطلاعاتی

چکیده: هوش مصنوعی زیر نظام علوم رایانه است که بر درک و اجرای فرآیندهایی همچون منطق، و بادگیری مهارت های جدید و تطبیق با شرایط موجود و حل مسائل ،استوار است . این عمل با استنتاج روش هایی که از قبل به سیستم داده شده صورت می گیرد.

 

      نقطه آغاز ایجاد هوش مصنوعی اندکی بعد از جنگ جهانی دوم می باشد . در آن زمان (نوربرت واینر) (1) با توجه به مسایل سیبرنتیک ، زمینه را برای پیشرفت هوش مصنوعی به وجود آورد . در سال 1950 ( آلن تیورینگ )(2)   آزمایشی مبنی بر این که آیا ماشین قادر است با قراآیندهای مغز انسان رقابت نماید، مطرح کرد.در سال 1956درکالج دارتموت  (3)

 جلسه ای برگزار شد که تحقیقات وسیع بر روی هوش مصنوعی با تشویق می نمود .

دهه 1960 به عنوان دهه توسعه و پیشرفت تحقیقات در زمینة هوش مصنوعی شناخته می شود . برنامه های بازی شطرنج و روبوت ها ، زمینه های انسانی تحقیقات هوش مصنوعی قلمداد می شدند .

فنونی که برای محدود کردن راهبردهای جستجو و طراحی روش های میان بر به منظور تصحیح پاسخ ها به کار می رفت تقش بارزی در پیشرفت استفاده از هوش مصنوعی ایفا کردند .

دو زبان به نام های prolog و Lisp در این زمینه ها در آمریکا و اروپا متداول است . Lisp زبانی است که بیش تر در ایالات متحده از آن استفاده می شود و prolog (برنامه ریزی در منطق ) بیش تر توسط اروپاییان و ژاپنی ها مورد استفاده قرار می گیرد . prolog یزان سطح بالا است و Lispدارای انعطاف بیش تری است .

سیستم خبره ، زیر مجموعة هوش مصنوعی است و اساسا" در برنامه های رایانه ای که از دانش و فرایند های استنتاجی برای حل مسائلی که نیازمند دانش انسان می باشد استفاده می کنند ، به کارگرفته می شدند . سیستم خبره باید دارای توانایی (اندیشیدن )،و به دانش انسان نزدیک باشد . در اینجا مزایای استفاده از سیستم خبره _که تا اندازه ای پدیدة جدیدی می باشد _را در کتابخانه ها مورد تحث قرار می دهیم . توانایی بالقوة این سیستم که براساس دانش می باشد ، نامحدود است هیچ فن آوری تا کنون نتوانسته همچون سیستم های خبره ، خدمات کتابخانه ها با چنین تغییر دهد.

 

 

ساختار سیستم های خبره

تعداد سیستم های خبرة کتانخانه ای قابل خرید اندک است و اکثر این سیستم های کنابخانه ای به صورت داخلی طراحی می شدند . در خلال مراحل اولیة ساخت سیستم های خبره ، کتابدار میباید با مهندس سیستم همکاری نزدیک داشته باشد. مهندس سیستن می تواند پیشنهادهای مفیدی را در طراحی و حمایت از سیستم های هوشمند ارائه کند . (هیز ) و همکاران (4)  پنج مرحله رادر روش شناسی ساخت و طراحی سیستم های هبره ذکر می نمایند :

شناسایی_ شناسایی عبارت است ار شناخت مسائل و محدوده ، و قبل از آن که اهداف و مقاصد ساخت سیستم های خبره تبیین شود,  صورت می گیرد . در این مرحله باید منابع مشخص شوند و همچنین برآوردی از منابع برای کارکنان د رایانه صورت گیرد .

تجسم یا مفهوم سازی (5) _در این مرحله جنبه های اساسی پیشنهادی برای سیستم های خبره مورد بحث و فحص قرار می گیرند و سؤالاتی به قرار زیر مطرح می شوند :

_آیا سیستم خبره مورد نیاز است ؟

_آیا با استفاده از روش های جاری می توان به اهداف و مقاصد سازمان دست یافت ؟

_چه کسانی از سیستم خبره استفاده خواهند کرد؟

_چه کسانی سیستم را آموزش خواهند داد ؟

_هزینه / فایده استفاده از سیستم خبره چه مقدار خواهد بود ؟

3.رسمی کردن (6) _این مرحله , مرحلةبین تجسم و اجرا می باشد . در این زمان است که تصمیم گرفته میشود چه راهبردها ,وسائل و تجهیزات , و زبان برنامه نویسی مورد استفاده قرار گیرد . در این مرحله مهندس سیستم می تواند نظرات ارزشمندی ارائه کند.

4.اجرا_ این مرحله مشخص مس کند که سیستم خبره تا چه حد به نیازهای کاربر پاسخ می دهد . ارزیابی باز خورد استفاده کاربران از سیستم در تصحیح سیستم بسیار با اهمیت است . کاربران به کتابدار و مهندس سیستن خواهند گفت که روش های اعمال شده تا چه حد کاربرد دارند و تا چه اندازه واسط ارتباطی (7) دستگاه راحت و مؤثر می باشد .

5.ارزیابی _در مرحلة ارزیابی ،کتابدار و مهندس سیستم به سؤالاتی همچون چه چیزی خطا و چه چیزی  صحیح بوده ، پاسخ می گویند و آن ها را مورد ارزیابی قرار می دهند . باید به یادداشت که سیستم خبره باکار آمد بدتر از آن است که هیچگونه سیستم خبره ای نداشته باشیم . بهتر است ارزیابی به صورت منظم صورت گیرد تا مشخص شود که آیا نیاز های کاربران محقق شده است یا خیر؟ در این زمینه باید کتابدار و متخصص سیستم به استانداردها نیز توجه هاص مبذول دارند.

در شکل زیر مثالی از یک سیستم خبره که به شکل سلسله مراتبی طراحی شده نشان داده می شود:

 

 

 

در حال حاضر با پیشرفت علوم و فن آوری , دیگر لازم نیست که انسان به طراحی نرم افزار بپردازد زیرا نرم افزارهایی در بازار موجود است که به این نیاز ها پاسخ می گویند . از جمله این نرم افزارها می توان به (شل)(8) اشاره کرد . نرم افزار شل برای ایجاد نوع بخصوصی از سیستم های خبره طراحی شده و برای قوانین متعددی استوار است که اساس آن (اگر _پس)کس باشد.در حال حاضر 5 نوع نرم افزار شل برای سیستم های خبره موجود و قابل نصب برروی رایانه های شخصی می باشد.(تاینی آنشتاین )(9),(گورو)(10)  و (نالج پرو )(11)  از جملة این نرم افزارها هستند .

 

کاربرد سیستم های خبره در کتابخانه ها

کاربرد سیستم های خبره و هوش مصنوعی در امور کتابخانه هنوز در مراحل اولیه است . چند پروژه در زمینه های کتابداری و خدمات اطلاع رسانی به مراجعان تحت بررسی قرار گرفته و در این زمینه خوش بینی زیادی مبنی بر به کارگیری سیستم های خبره در اکثر حوزه های کتابداری و اطلاع رسانی وجود دارد . مشکل اساسی که در حال حاضر وجود دارد ایجاد (پایگاه دانش ) است .(12) مثلا "سیستم هبره را می توان برای حوزة بخصوص از خدمات مرجع ایجاد نمود , اما این سیستم قادر نیست (پایگاه دانش ) به وجود آورد که در برگیرندة کلیة فعالیت های بخش مرجع باشد .

در اینجا این سؤال مطرح است که چه دلایلی برای به کارگیری سیستم های خبره درکتابخانه وجود دارد ؟ آیا این سیستم ها کار روزانة کتابداران را بهبود می بخشند ؟به عنوان مثال ,یک سیستم خبره می تواند به کتابدار در شناخت و بهبود کارایی اموری چون خدمات فنی , جستجو در پایگاه های پیوسته و خدمات دادن به مراجعان بیش تر یاری رساند . اگر یک سیستم خبره خوب برنامه ریزی شده باشد باعث افزایش کیفیت خواهد شد . این سیستم اشتباهاتی را که گاهی از انسان سر می زند مرتکب نخواهد شد و می تواند در فراهم آوری اطلاعات تکراری سودمند باشد . حوزه هایی که سیستم خبره می تواند در آن فعالیت کند عبارت اند از :فهرستنویسی, جستجو در پایگاه های اطلاعاتی , نمایه سازی , مدیریت و مرجع.

 

فهرستنویسی

از آنجا که فهرستنویسی بر اساس قوانین بسیاری طراحی شده ،سیستم خبره در این زمینه سازگاری زیادی دارد .

(فنلی)(13) معتقد است که بهتر ین استفاده که می توان از سیستم خبره در کتابخانه کنگره آمریکا نمود ،بهبود وضع مشاوره در زمینه فهرست توصیفی و تحلیلی است .

کار بر روی فروست ها (14) یکی از مشکل ترین امور فهرستنویسی بوده و همواره مشکل زا است ،فروست ها دارای قئانین متعدد و پیچیده ای هستند . سیستم خبره در این حوزه می تواند کمک های شایان توجهی بنماید. معمولا" با جا به جایی کارمندان ،اطلاعات آن ها نیز با آنان می رود ،در صورت استفاده ا ز سیستم خبره می توان این نقیصه را بر طرف نمود . کتابداران همئاره در آرزوی استفاده از سیستمی بوده اند که به آن ها در به کارگیری قدانین آنگلو آمریکن (AACR2) کمک کند ،اما این موضوع به دلیل پیچیدگی های قوانین مزبور با مشکلاتی مواجه بوده است :در زیر نمونه ای از نرم افزار (امی سین )(15) که برای فهرستنویسی توصیفی به کار برده شده آورده می شود:

اگر                 _سند دارای نویسنده مشخصی نیست ،

                    _ سند دارای تنالگان (سازمان مسئول ) نیست ،

                    _ سند دارای ویراسدار یا گروه ویراسداران نیست ،

                    _ سند اثری دارای نویسنده ای ناشناخته است ،

پس :              قطعی است که سر شناسة سند , (عنوان ) است .

 

جستجو در پایگاه های اطلاعاتی

سیستم خبره می نواند جستجو در پایگاه های پیوسته را بهبود بخشد . یک سیستم خبره می تواند به استفاده کننده از کتابخانه در زمینه های زیر کمک کند :

مشخص کردن جستجوی کاربر ؛

شناسایی پایگاه های اطلاعاتی بالقوه ؛

شناسایی عناصر مفهومی در جستجو ؛

بیان ساخت مفهومی ئر زمینه های انتخاب پایگاه ، کاید واژه ها ، توصیفگر ها و منطق بولی ؛

دستیابی به پایگاه اطلاعاتی با استفاده از توافقنامه های ارتباطی ؛

ورود به منطق جستجو ؛

تحلیل نتایج جستجو ؛

اصلاح راهبرد جستجو ؛

وسیع تر کردن جستجو ؛

محدود کردن جستجو ؛

پایان دادن به جستجو و گذاشتن نتایج در اختیار کاربر .

باید اذعان داشت که سیستم مطلوب ، سیستمی است که بتواند در هر زمان پاسخگوی استفاده کننده باشد و توضیحی در هد فرایند جستجو در اختیار کاربر قرار دهد . به عقیدة (میگو و اسمیت )(16)  یک سیستم خبره مطلوب را که آسان و کاربر پسند باشد ... سیستمی است که به تمامی منابع در یک کتابخانه یا مرکز اطلاع رسانی دسترسی دارد؛ به عبارت دیکر به فهرست پیوسته ،اسناد و مدارک در حال گردش ،نظام امانت بین کتابخانه ای ، به پایگاه های معینی از برگه های مستند مؤلف کتابخانه کنگره ، و به کتاب های زیر چاپ با متن کامل دسترسی داشته باشد.

همچنین این سیستم قادر است به دسته ای از پایگاه های اطلاعاتی تجاری ، با این توان که به طور خودکار به پایگاه های اطلاعاتی و کلمات عبور آن ها دسترسی داشته باشد ،وصل شود.

 

نمایه سازی

نمایه سازی خود کار اسناد و مدارک مدتها مطرح بوده است . تا کنون متخصصان موفق شده اند به شکل هوشمند به خودکار کردن اسناد و مدارک مبادرت ورزند و در این زمینه تلاش های زیادی با استفادهاز سیستمهای خبره صورت گرفته است . به طور مثال استفاده از سیستم خبره در نمایه سازی اسناد و مدارک پزشکی (کتابخانة ملی پزشکی آمریکا ) را می توان نام برد که چندان موفق نبوده است .

اما تلاش هایبسیاری در زمینة استفاده از این سیستم در نمایه سازی نشریات صورت گرفته است . این سیستم می نواند در موارد زیر سود مند باشد و نمایه ساز را در نمایه سازی کمک کند:

شناسایی مفاهیم مورد بحث در مقالات نشریات ؛

ترجمة مفاهیم به شگل شفاهی و کلامی ؛

ترجمة اشکال شفاهی و کلامی به توصیفگری موضوعی و زیربخش های آن ها ؛

به کار بردن قوانین مناسب در تعیین توصیفگرهای موضوعی ؛

تعیین توصیفگرهای موضوعی و زیربخش های آن در ارتباط با مقاله .

 

مدیریت

تعدادی از سیستم های خبره برای اهداف مدیریت در کتابداری د اطلاع رسانی مئرد استفاده قرار گرفته اند . در صورتی که مدیران از این سیستم ها بیش تر استفاده کنند،نیاز به این نرم افزارها بیش تر خواهد شد و در نتیجه رشد روزافزانی را در این سیستم ها در آینده شاهد خواهیم بود .

حوزه هایی که مدیریت اطلاع رسانی می تواند از این سیستم استفاده کند عبارت اند از :

برنامه ریزی برای نیروی انسانی و استخدام افراد؛

توسعه مجموعه ها ؛

ساخت و طراحی ساختمان های جدید ؛

بهره گیری مناسب باز فضای موجود؛

حسابداری و حسابرسی و بودجه بندی ؛

برنامه ریزی راهبردی .

 

مرجع

در نظر اول ، انسان ممکن است به این مسئله بیندیشد که می توان سیستم های خبره با جایگزین بخش مرجع کرد . تحقیق این امر در آینده نزدیک محال است و به نظر می رسد که هیچگاه نمی توان ماشین را جایگزین کتابداران مرجع نمود و تعامل بین کتابدار مرجع و استفاده کننده متضمن مسائل نامترقبه و غیر قابل پیش بینی بسیار است ؛با این حال سیستم های خبره و محصولات دیگر هوش مصنوعی در کتابداری به طور روزافزونی مورد استفاده قرار می گیرند و امروزه جزء جدایی ناپذیر این امود واقع شده اند . (دول)(17)و(کروز)(18)

برای استفاده از سیستم های خبره د ربخش مرجع مزایایی را بر می شمرند :

زمانی که کتابدار مرجع حضور ندارد یا زمانی که بخش مرجع باز نیست یا کتابدار مرجع کار زیادی دارد ،سیستم های خبره می توانند به مراجعان و استفاده کنندگان درامور مشاوره کمک کنند .

با استفاده از سیستم خبره می توان خدمات مرجع را نه فقط در میز مرجع بلکه در سراسر کتابخانه به خدمت گرفت .

سیستم های خبره می توانند د رآموزش استفاده کننده برای خدمات مرجع مورد استفاده واقع شدند با امور تکراری و خسته کننده را از سر راه کتابدار مرجع بر دارند .

کتابدار مرجع ،مرجع اطلاعات معتنابهی از مجموعه کتابخانه ،مراجعان به بخش مرجع ، سازمان هایی که مشغول به کار هستند ،امئر مربوط به پژوهش و منابع قدیمی و جدید مرجع می باشد .سیستم های خبره می توانند این اطلاعات را در خود ذخیره نمایند و زمانی که کتابدار مرجع به جایی دیگر منتقل می شود یا استعفا می دهد ، در اختیار دیگران قرار دهند.

سیستم های خریه در ساعاتی که بخش مرجع شلوغ است می توانند به تعداد زیادی از مراجعان سرویس دهند و رضایت بیش تر آن ها را فراهم سازند .

 

چرا سیستم های خبره این قدر معروف شده اند ؟

ما نباید به سیستم های خبره به عنوان دارویی که همة بیماری ها را شفا می دهد بنگریم . سیستم های خبرةکنونی دارای محدودیت ها و موانع جدی هستند که مهم ترین ِآن ها ،میزان و حد (پایگاه دانش )است . همچنین در اصطلاحات و مفاهیمی که به یکدیگر نزدیک و متقارن همتند دچار مشکلات زیادی هستند .

با این حال،بعضی از دلایلی را که سیستم های خبره با چنین اقبالی در سطح بین المللی مواجه شده اند می توان به قرار زیر برشمرد :

باپیشرفت هایی که صورت گرفته ،سیستم های خبره توانسته اند در سطوح عملیاتی دانش ،یعنی از داده پردازی و پردازش اطلاعات به (پردازش دانش و مدیریت )،تحولاتی به وجود آورند .

در مقیاس محدود و در اموری که وابسته به کامپیوتر و هوش مصنوعی می باشد ،عملکرد این سیستم ها بهتر از انسان بوده است . از طرفی این سیستم ها با مشکلات جدی مواجه هستند ؛به عنوان مثال یک کودک به راحتی می تواند قلمی را از زمین بر دارد ، اما این عمل برای روبوت ها و وسایل مکانیکی مستلزم نوشتن برنامه هایی بسیار پیچیده و مسئله زا است .

در دینای تجارت ،سیستم های خبره به عنوان وسایلی که برای سازمان ها و شرکت ها ،در آمدزا و با صرفه هستند ، بسیار اهمیت یافته اند . موفقیت در یک شرکت مستلزم سرمایه گذاری بر روی منابع انسانی ماهر می باشد . این افراد ممکن است بعد از آموزش ،برای یافتن شغلی بهتر ، آن شرکت یا سازمان را ترک کنندو در عین حال با این کار خود بسیاری از تجارب و دانش خود با که در طی زمان خدمت و آموزش به دست آورده اند با خود ببرند. سیستم های خبره می توانند حافظ این اطلاعات و اندوخته ها باشند . این مسئله باعث شده که سرمایه گذاری های کلان برای سیستم های خبره ،هوش مصنوعی و غیره صورت پذیرد . به هر حال تا تحقیق نیاز های انسان توسط سیستم های خبره راه بسیار دشواری باقی است .

 

 

پی نوشت ها

1-Norbert Wiener

2-Alan   Turing

3-Dort Mouth

4-Hayes _Roth et al

5-Conceptualization

6-Formalization

7-Interface

8-Shell

9-Tiny Einstein

10-Guru

11-Knowledge Pro

12-Knowledge Base

13-Fenley

14-Series

15-EMYCIN

16-Micco & Smith

17-Dowell

18-Crews

 

منابع

1-Information Technology Design and Applications /edited by Nancy D. Lane of Margaret E.Chisholm,Boston: G.K.Hall & Co.,1994.

2.Nilsson , Nils J.,Principles of Artificial Intelligence, Narosa publishing House , New Delhi, 1990.

 

 

 


نوشته شده در تاريخ سه‌شنبه ۱۸ تیر ۱۳۸٧ توسط نمایه

نمایه سازی همارا:  پیش همارا و پس همارا

 

شیدا نجفی نیا

دانشجوی کارشناسی ارشد کتابداری و اطلاع رسانی دانشگاه الزهرا

 چکیده:
  به علت حجم فراوان مدارک و فشردگی محتوای اطلاعاتی آنها دسترسی فوری به مندرجات آنها احساس گردید، تا بدین وسیله مطالب آنها حتی المقدور ساده  تر و خلاصه تر در اختیار محققین قرار گیرد، بنابراین نمایه سازی انجام این امر را هموار ساخت.

  در این پژوهش قصد بر آن است که پس از شرحی بر نمایه و نمایه سازی، به بسط یکی از انواع آن، یعنی نمایه سازی همارا (پیش همارا و پس همارا) پرداخته شود. در واقع منظور از همارایی،ترکیب واژه ها در زمان نمایه سازی ( نمایه سازی پیش همارا ) و نیز ترکیب واژه ها برای بازیابی در زمان جستجو (نمایه سازی پس همارا) می باشد.

 کلید واژه ها : نمایه، نمایه سازی، نمایه سازی همارا، نمایه سازی پیش همارا، نمایه سازی پس همارا


مقدمه
افزایش سریع حجم مدارک در توسعه رشته های علمی موجب پیدایش روشهای گوناگونی برای ضبط محتوای اطلاعاتی آنها شده است. برای محققانی که در زمینه های گوناگون علمی دست درکار پژوهش هستند، مطالعه کلیه مدارکی که در زمینه تخصص آن ها منتشر شده است، امکان پذیر نیست. حتی در بسیاری از تحقیقاتی که در نقاط مختلف جهان بعمل آمده و نشانه ای از آنها در دست نیست. با توجه به موارد فوق و به منظور جلوگیری از دوباره کاری و ایجاد سرعت و دقت درفعالیتهای پژوهشی، صاحبنظران دانش اطلاع رسانی برآن شدند تا با استفاده از وسائل متعدد از هر مدرک علمی، نشانی به دست دهند. در واقع، از هر مدرک علمی می توان به طریق گوناگون نشانه هایی به دست داد که مؤلف، عنوان سازمان تحقیقاتی یا ناشر، چکیده راهنما و یا چکیده تمام نماو ... از آن جمله اند.

به علت حجم فراوان این قبیل مدارک و فشردگی محتوای اطلاعاتی آنها از طرفی و لزوم دسترسی فوری به مندرجات آن از طرف دیگر، باید نشانه هائی را که در بالا به آن اشاره کردیم، حتی المقدور ساده تر و خلاصه تر در اختیار محققین قرار گیرد. (12)

 
تاریخچه
تا چند قرن پیش، مجموعه دانشهای ثبت شده، بسیار کم بود. تعداد کمی کتاب نوشته شده بود که هر کدام در یک یا دو موضوع از مجموعه دانشهای بشری کشف شده قابل گنجانیدن بود.

   همانطور که می دانیم، قرن هیجدهم برای دنیا تغییرات زیادی را همراه داشت که قسمت مهمی از آن پیدایش مفهوم رده بندی در طبیعت بوده است. فهرست نویسی و رده بندی یکی از هدفهای مهم و با اهمیت علوم شد و امید به آنکه روزی تمام دانشهای لازم برای شناخت جهان مادی کامل شده و بتواند در سیستم های رده بندی طبیعی و ساخت بشر جای گیرند، یکی از رویاهای قرن شد. در واقع، نمایه سازی سنتی با شکلی ساده، اساسی ترین کلمات متن را جمع آوری  می کند، آنها را برحسب حروف الفبا مرتب می  نماید و با هرکلمه شماره صفحه یا صفحات حاوی اطلاعات موردنظر را مشخص می سازد. در حقیقت، این ساده ترین سطح نمایه سازی است که صرفاً به جمع آوری کلمات می پردازد و خواننده را به صفحات مورد نظر ارجاع می دهد. در صورتی که از این سطح فراتر رویم و جنبه های علمی نمایه سازی را مورد توجه قرار دهیم، آنگاه نمایه سازی را می توانیم به شکل زیر تعبیر کنیم:

«استخراج محتوای اطلاعاتی، ثبت محتوای اطلاعاتی ، کاربرد روشهای گوناگون ذخیره وبازیابی اطلاعات و ایجاد یک بایگانی متناسب». (12)

 
تعریف نمایه

   طبق استاندارد نمایه سازی بریتانیا « نمایه»، سیاهه نظام یافته مدخل هایی است که به منظور کمک به استفاده کنندگان در جایابی اطلاعات یک مدرک ساخته می شود. در زبان فارسی امروز واژه «نمایه» توسط فرهنگستان زبان و ادب پارسی از معنای واژه انگلیسی «Index » انتخاب شده است و واژه «Index » در اصل از واژه لاتینی «Indicate » به معنای نشان دادن و خاطرنشان کردن، مشتق شده است. (13) ، (14)

 
نمایه سازی

قسمت اول : جنبه های نظری نمایه سازی

1.تعریف نمایه سازی:

    از نمایه سازی تعاریف متعددی شده است که با تلفیق و ترکیب آنها می توان یک تعریف جامع و مانع از نمایه سازی دست داد. نمایه سازی عبارتست از« ثبت و ضبط محتوای اطلاعاتی مدارک با استفاده از روشهای گوناگون به منظور سازمان دادن اطلاعات به قصد سهولت بازیابی»، بنابراین این تعریف شامل چندین فعالیت گوناگون است:

«ثبت و ضبط اطلاعات، سازمان دادن و بازیابی».

2.دلایل تهیه نمایه:

 ایجاد مراکز گوناگون علمی و پژوهشی موجب گسترش فعالیت های علمی شده است و توسعه مراکز آموزشی و تخصصی، این قبیل فعالیت ها را در مسیر افزایش دائمی قرار داده است. نتایج تحقیقات و بررسی های این گروه عظیم پژوهنده موجب شده است که دائماً بر مجموعه اطلاعات علمی افزوده شود وانعکاس آن به شکل گزارشها، مقاله ها، تک نگاری ها و انواع دیگر در سطوح گوناگون عرضه گردد، از طرف دیگر در هر پژوهش علمی باید در وهله اول مطمئن شد که چنین فعالیتی در گذشته در زمینه موردنظر انجام نگرفته و در وهله دوم از کلیه فعالیت هایی که می تواند در همین زمینه موثر واقع شود، استفاده گردد. بنابراین اطلاع از وجود مدارک علمی در زمینه های گوناگون و آگاهی ازمحتوای اطلاعاتی آنها را می توان یکی از عوامل مهم پیشرفت های پژوهشی دانست. این فعالیت تا حدود زیادی در قلمرو نمایه سازی قرار می گیرد، بطوری که تعریف نمایه سازی نیز در تأیید همین مطلب می باشد.

3.مراحل تهیه نمایه:

مرحله اول: آشنایی

مرحله دوم: تحلیل

مرحل سوم: ارزیابی

مرحله چهارم: توصیف

قسمت دوم: جنبه های عقلی نمایه سازی

   با توجه به قسمت اول این بحث، برای تهیه نمایه از یک مدرک علمی، به شرح زیر عمل می شود:

1. ابتدا اطلاعات کتابشناختی مدرک بر روی برگه مخصوص نمایه سازی یادداشت می شود.

2. مدرک باتوجه به عنوان اصلی و سایر عناوین فرعی آن و همچنین چکیده، نتیجه و بررسی های مندرج در آن مطالعه می گردد.

3. اساسی ترین مفاهیم مدرک بدون توجه به عناوین اصلی و فرعی آن بر روی برگه های مخصوص نمایه سازی یادداشت می گردد.

4.  برای مفاهیم استخراج شده از متن کلید واژه تهیه می شود.  تعداد این واژه ها برای هر مدرک بطور معمول بین 5 تا 10 واژه است.

  
جامعیت و مانعیت

-         جامعیت

   نمایه ساز باید قادر به تشخیص همه مفاهیم یک مدرک که برای استفاده کننده ارزش بالقوه دارد، باشد. نکته مهم آن است که در نمایه سازی نباید موضوع مدرک اصلی خیلی محدود تعبیر شود، گرچه گاهی نمایه سازی برای یک گروه استفاده کننده خاص انجام می شود، اما غالباً این نمایه ها برای سایر گروههای استفاده کننده نیز مـورد مراجعه قــرار می گیرد، خصوصاً با ایجاد ارتباطات بین رشته ای از یک سو و رشد شبکه های اطلاع رسانی از سوی دیگر، باید استفاده کنندگان بالقوه و به دنبال آن محتوای مدرک را از هر جنبه در نظر گرفت. در انتخاب هر مفهوم، بایستی ارزش بالقوه آن به عنوان یک عامل مهم در بازیابی مدارک در نظر گرفته شود. نمایه ساز باید سوال هایی را که ممکن است مطرح شود، در نظر داشته باشد و مفاهیم به عنوان کلیدهای بازیابی مورد استفاده قرار گیرند و در مورد تعداد اصطلاحات یا توصیفگرهای معرف محتوای یک مدرک نیز لازم نیست محدودیتی قائل شد، زیرا هر نوع محدودیت ما را از هدف نمایه سازی دور می کند و جامعیت بازیابی را به خطر می اندازد، بنابراین منظور از جامعیت «بازیابی مدارک مفید » می باشد.

-         مانعیت

   به عنوان یک قاعده، مفاهیم باید هر قدر که ممکن است بطور اخص تهیه شوند. درجه خاص بودن یک مفهوم ناشی از اهمیتی است که نویسنده برای آن مفهوم قائل شده است، به عبارت دیگر میزان اطلاعاتی که درباره آن مفهوم ارائه گشته است. چنانچه نمایه ساز تشخیص دهد که یک ایده کاملاً پرورانده نشده و یا بصورت تصادفی یا گذرا به آن اشاره شده است، باید بطور اخص به آن بپردازد تا به خوبی پرورانده شود، در غیر اینصورت بهتر است آن را انتخاب ننماید، بنابراین منظور از مانعیت «پرهیز از بازیابی مدارک غیر مفید» می باشد.

 
انواع نظام های همارایی در نمایه سازی همارا
   Co-orinate Indexing

   قبلاً باید متذکر شد که نظام های نمایه سازی، رویه و روش های (ماشینی و غیر ماشینی) برای تهیه نمایه نامه ها یا سایر ابزار جستجو هستند، به عبارت روشن تر نظام نمایه سازی، همان طور که قبلاً هم شرح آن رفت، عبارت است از «مجموعه ای از روش های از پیش تعیین شده برای سازماندهی، بازیابی و اشاعه اطلاعات». نظام های نمایه سازی را برحسب روشی که در نمایه کردنِ موضوع دارند، به دو گروه مستقل پیش همارا و پس همارا تقسیم می کنند.

بطور کلی، در گروه اول، واژه ها و مفاهیم واصطلاحات در موقع نمایه سازی با یکدیگر ترکیب می شوند (درون داد) و در گروه دوم، این کار در موقع بازیابی صورت می گیرد (برون داد)، که به تفسیر هر یک بطور مفصل می پردازیم.(2)

نمایه سازی پیش همارا Pre-Co-ordinate indexing    تعریف ـ نمایه سازی پیش همارا نظامی است که در آن واژه ها در زمان نمایه سازی مدرک با هم ترکیب می شوند و این ترکیب در سر عنوان ها نشان داده می شود.

   در عین حال، در رده بندی شناخته شده « فهرست سرعنوان های موضوعی کتابخانه کنگره آمریکا » و « نظام نمایه سازی پرسی»(Precis:Preserved Context Index System) که در کتابشناسی ملی انگلیس از آن استفاده می شود، آخرین شکل در سلسله نمایه های پیش همارا هستند.(15) در واقع پیش همارایی در نظام همارا به شیوه ای اطلاق می شود که در آن، گاهی واژه ها و اصطلاحات در موقع نمایه سازی با هم ترکیب می شوند: صادرات نفت به جای صادرات / نفت. (2)

ـ سیستم های نمایه سازی پیش همارا

  نمایه های پیش همارا از نظر فرمت فیزیکی به مشخصه بخصوصی احتیاج ندارد. اکثر نمایه هائی که اصول نمایه سازی پیش همارا را منعکس می سازد، نمایه های چاپی می باشند. بعضی از این نمایه ها کاملاً مستقل از  رایانه‌ بوده، اما بعضی دیگر از توانائیهای  رایانه‌ در شکل دهی و نمایش مدخل ها استفاده می کنند. اصول نمایه سازی پیش همارا تا حدی در سیستم های بازیابی اطلاعات  رایانه‌ای آن ـ لاین Online (پیوسته)و آف لاین Offline(نا پیوسته) (جستجوی گروهی) نیز بکار می رود.

در تمام نمایه های پیش همارا دو مسأله وجود دارد:

 نخستین مسأله با توصیف یکدست موضوع ها سروکار دارد. با در نظر گرفتن سر عنوان ها یا شناسه های بی شمار، یکدستی را باید هم در اصطلاحات و هم در نظم و ترتیب آنها بکار برد. قبل از آن که بتوان به یک روش یکدست استنادی ( اطلاعات کتابشناختی) دست یافت، باید بعضی از اصول مربوط به این روش را ایجاد و بر سر آن توافق نمود. در هر مورد ممکن است به سادگی درباره روش هر موضوعی که مطرح می شود، تصمیم گیری کرد و سپس آن را مراعات نمود یا برای ترتیب اصطلاحات یا مفاهیم ممکن است بعضی قواعد را به وجود آورد. پایه نظری برای روش استنادی باید یک سیستم بسیار ساخت یافته ای ایجاد کند که هدف آن رسیدن به روش استنادی یکدست میان موضوعات شبیه به هم باشد. در صورتی که بعضی دلایل اساسی و منطقی برای سبک و روش تعیین شده باشد، توصیف یک موضوع به وسیله سرعنوان مختلف با اصطلاحات و روش استنادی متفاوت، احتمال کمتری دارد که نادیده گرفته شود. با این حال، سیستم های نمایه سازی بسیاری در طول قرن گذشته بوجود آمده، و اصول خود را در زمانی پایه گذاری کرده اند که ذکر مشخصات مفصل موضوعات غیر ضروری بود. نمایه هایی که مبتنی بر فهرست سرعنوان های موضوعی معمول و متدوال می باشند، از یک روش استنادی کم ساخت یافته ای استفاده می کنند، چرا که از یک طرف، نیازی به این نیست که روش های استنادی میان موضوع ها شبیه به هم بوده، و از طرف دیگر هیچ مجموعه کاملی از اصولی که روش استنادی را مشخص نماید، وجود ندارد. با این وجود، این نمایه ها بعضی از قواعد مربوط به ساختار سرعنوان ها را مورد توجه قرار می دهند.

   مسأله دوم که باید مورد توجه نمایه سازان باشد، تأمین نیازهای دستیابی استفاده کنندگان به موضوع هایی است که از طریق یکی از مفاهیم «ثانویه» صورت می پذیرد. در روش استنادی مقرر، فقط یک اصطلاح می تواند در محل اصلی قرار گیرد. روش استنادی مرجّح باید روشی باشد که با رهیافت بسیاری از استفاده کنندگانی که انتظار می رود اطلاعات مربوط به موضوع را بازیابی کنند، مطابقت داشته باشد. هر روش استنادی هر قدر هم به خوبی پایه گذارده شده باشد، برای هر جستجوگری مناسب نخواهد بود. ارجاعات و معرفهای اضافی باید مکمل سرعنوان اولی یا معّرف اصلی باشد و دستیابی را از جهات دیگر نیز امکان پذیر سازد. حداقل، یک ارجاع یا معّرف اضافی معمولاً از هریک از مفاهیم «ثانویه»، در روش مرجّح ضروری می باشد. به همان طریقی که روش های استنادی ممکن است از پایه های تئوریکی کمتر یا بیشتری برخوردار باشد، بطور یکسان، تولید ارجاع ممکن است از یک الگوی از پیش تعیین شده ای پیروی کند، یا ارجاع یا معّرفهای اضافی موردنظر ممکن است براساس یک روش خاصی برنامه ریزی شود. بعضی الگوها وجود دارند که معمولاً از آنها برای تولید ارجاعات اضافی استفاده می شود تا تعداد ارجاعات کمکی در یک سطح قابل قبول حفظ شود. همچنین اگر الگوریتم ساده ای را بتوان برای تولید مدخل های نمایه معین کرد، آنگاه مدخل ها و ارجاعات اضافی را با استفاده از رشته  نمایه اصلی به عنوان داده های ورودی، می توان بوسیله  رایانه‌ چاپ نمود. در واقع، مسائل دوگانه مطرح شده به این علت رخ می دهند که سیستم های پیش همارا اساساً سیستم های تک ـ موردی(One- Place system) هستند. سیستم های تک موردی در موقعیت هائی مناسب هستند که بخواهیم برای هر مدرکی فقط یک معّرف اصلی داشته باشیم. این سیستم ها ممکن است برای جستجوگر مزایائی نیز داشته باشد. تعدادی از جستجوها را با ردیابی مدخل ها ذیل سر عنوان های مشابه می توان به طور همزمان انجام داد. همچنین در جائی که فقط پالایش یاتغییرات جزئی در واژه های موضوعی مقتضی می باشد، استراتژی جستجو را نسبتاً می توان به آسانی تغییر داد. (3)

 
نمایه سازی پس همارا
     Post-co-ordinate indexing  

روش ویژه ای در نمایه سازی مدارک وجود دارد که در آن، هنگام بازیابی در مراحل بعد، از ترکیب یا در واقع از همارایی اصطلاحات از پیش تخصیص یافته استفاده می شود و عمدتاً بر نظریه مجموعه ها و منطق بول که ذکر آن خواهد رفت، قراردارد. در این صورت نام اصلی این روش، نمایه سازی پس همارا است.

تعریف ـ نمایه سازی پس همارا را شیوه ای از نمایه سازی برای منابع و مدارک کتابخانه ای است که در آن نمایه ساز، سرشناسه ها را از مفاهیم بسیار ساده انتخاب می کند و تعدادی شناسه نیز زیر هر یک اضافه می نماید و در پی آن، تدابیری برای پیوستن آنها با یکدیگر به دست می دهد تا به وسیله آنها، جوینده بتواند موضوع مرکب مورد نظر خود را بیابد. قابل ذکر است که «پیکابو»(Peek –a- boo) و «نمایه سازی تکواژه ای »(Uniterm Indexing ) از این نوع نمایه سازی می  باشند. (15)

   در واقع، در نظام های پس همارا، همارایی در مرحله جستجو صورت می پذیرد، بدین معنی که هنگام نمایه سازی، موضوع های ترکیبی و پیچیده به مفاهیم ساده تر تجزیه می شوند و به هنگام جستجو موضوع های پیچیده از طریق همارایی مفاهیم ساده بدست می آیند. این روش به خاطر امکان عرضه ترکیب های متعددی از واژه ها، به نظام انعطاف می بخشد.

 
- تاریخچه و اصول

    در دوران پس از جنگ جهانی دوم حجم انتشارات، خصوصاً انتشارات علمی و تخصصی به طور فوق العاده افزایش یافته است. در هر موضوع صدها کتاب، مجله و گزارش انتشار می یابد و پدیده ای را به وجود آورد که گاه «انفجار انتشارات» و گاه «انفجار اطلاعات » نامیده می شود، در واقع، دیگر تنها نوشته، برای ثبت اطلاعات و انتقال آن کافی نیست بلکه انواع وسایل چون فیلم ، میکروفیلم، صفحه، نوار، ... برای ثبت و انتقال اطلاعات به کار گرفته می شود. یکی از نتایج این امر آن است که روش های قراردادی طبقه بندی، بطور عمده به کار تنظیم کتاب در قفسه کمک می کند و سرعنوان های موضوعی نیز بطور کلی برای کتاب مناسب است. این روش ها در مورد فهرست کردن موضوعات بسیار ریز و جزئی با محدودیت های روبرو است که مانع نمایه سازی دقیق مدارکی که غیر از کتاب هستند، می شود.

   از مشکلات دیگر به کار بردن روش های قراردادی طبقه بندی و سرعنوان های موضوعی، رشد سریع حجم فهرست است که در نتیجه آن یک سلسله مسائل چه از نظر نگهداری و چه از نظر جستجو در آن به وجود می آید. رج کردن برگه های تازه در فهرست و مراجعه به آن، الفبایی کردن، تقسیمات فرعی، سرعنوان های چند پاره و نیز لزوم داشتن برگه های راهنما، همه مسائلی است که استفاده ازفهرست قراردادی جستجو در آن را، مشکل می سازد.

بدین ترتیب، نیاز به یک نوع نمایه سازی که بتواند پژوهندگان را به عمق محتوای مدارک رهنمون باشد، در سال های بعد از جنگ، سبب پیدایش روش جدیدی شد که آن را نمایه سازی همارا «Coordinate Indexing » نام گذاشته اند. (3) با توجه به آنچه گفته شد، نمایه سازی پس همارا این گونه شکل گرفت که اوایل دهه 1950 (حدوداً بین سالهای 1953-1950 ) شخصی به نام مارتیمرتاب «Mortimer Taube  » که تصدی مقامی را در مرکز اسناد وزارت دفاع آمریکا برعهده داشت، روش نمایه سازی همارا را برای بررسی گزارشهای نظامی و مدارک دیگر ابداع کرد. تاب دریافت که اگر دگرگونی جدیدی در تجزیه و تحلیل مدارک ایجاد کند به بعد تازه ای دست می یابد و آن، جایگزین کردن مفهوم حقیقی هر مدرک در جای قالب موضوعی است که بر مفهوم حقیقی مدرک تحلیل شده است. وی در سیستم خود از تکواژه یا واژه هایی که بیانگر یک مفهوم بودند، استفاده کرد. بنابراین از نظر سابقه تاریخی، معرفی نمایه سازی همارا تا حدود زیادی مدیون «مارتیمرتاب» است، هرچند قبل از وی عده دیگری هم بودند که در نمایه سازی از این شیوه استفاده می کردند، از جمله «باتن» در انگلستان و «کوردوینه» در فرانسه.

   در واقع، اوایل دهه 1950، وقتی «تاب» برای اولین بار از این روش برای تنظیم یک دسته از مدارک ASTIA (مرکز اطلاعات فنی نیروی مسلح) استفاده کرد، واژگان محدود بکار برد که از اصطلاحات یک کلمه ای به نام «تکواژه» تشکیل شده بود. تکواژه ها از متن خود مدارک گرفته می شدند و هیچ نوع کنترل واژگانی صورت نمی گرفت. در واقع فرض بر این بود که محتوای مدرک را می توان در قالب چند مفهوم اصلی ریخت و مفاهیم بدست آمده را به کمک تکواژه ها بیان کرد. مدارک رسیده به جای آنکه بر پایه یک فهرست از پیش ساخته و مرکب از سرعنوان های موضوعی، تجزیه و تحلیل شوند و با مفاهیم واقعی مدارک در قالب داده های موضوعی از پیش ساخته بیان شود، بر اساس شناخت نمایه ساز یا متخصص موضوعی دیگری که مفاهیم مدارک را تجزیه و تحلیل می کند، استوار می شود. از این روی، نیاز به فهرست های از پیش ساخته نیست، بلکه قالب های مفاهیم به تدریج ساخته می شوند و زمینه ای قرار می گیرند برای انتخاب و وضع اصطلاحات دیگر.

  مطابق این سیستم مدارکی که باید نمایه شود، به ترتیب خاصی شماره گذاری می شوند و آنگاه مورد بررسی قرار می گیرند و موضوع آنها، بطور متوسط با حدود 7 تا 15 تکواژه توصیف می شود، سپس زیر هر تکواژه شماره ثبت مدرک قید می گردد. کسی که بخواهد موضوعی چند واژه ای را جستجو نماید باید تمام تکواژه های مربوط به موضوعش را پیدا کند و شماره های ثبت مدارک را با هم منطبق نماید، یعنی مدارکی که شماره آنها زیر تمام تکواژه ها ثبت شده باشد، لذا مرحله انطباق با همارایی تکواژه ها در مرحله جستجو صورت می گیرد. وجه تسمیه این روش  نمایه سازی هم ظاهراً در همین خاصیت همارایی است. در نهایت می توان نتیجه گرفت که نمایه سازی پس همارا یا در واقع نمایه سازی همارا (همان طور که قبلاً هم متذکر شدیم) روش ویژه ای در نمایه سازی مدارک است که در آن، به هنگام بازیابی در مراحل بعد، از ترکیب یا در واقع از همارایی اصطلاحات از پیش تخصیص یافته استفاده می شود و عمدتاً بر مبنای نظریه مجموعه ها و منطق بول به وجود آمده است، اما برخلاف این شیوه (نمایه سازی پس همارا) که در آن «مارتیمرتاب» عقیده داشت که تمام توصیفگرها باید در مرحله بازیابی اطلاعات همارا شوند، در پیش همارایی همان طور که قبلاً هم شرح آن رفت، توصیفگرها اجزای تشکیل دهنده یک مفهوم، قبل از بازیابی با یکدیگر ترکیب می شوند تا از ابهام و نارسائی در هنگام پس همارایی جلوگیری شود، مثلاً در مورد واژه های «فلسفه» و «تاریخ» اگر منظور «فلسفه تاریخ» است که از همان آغاز، واژه «فلسفه تاریخ» را به عنوان توصیفگر می پذیریم تا از بازیابی بعدی به صورت «فلسفه تاریخ» یا «تاریخ فلسفه» جلوگیری شود یا به جای دادن دو توصیفگر «ریشه کنی» و «مالاریا»، در موقع نمایه سازی آن را بصورت «ریشه کنی مالاریا» انتخاب می کنیم.

پیش همارایی اگرچه برای کم کردن ریزش کاذب موثر است ولی از خاصیت بعد همارایی که مزیت نمایه سازی همارا است، کم می کند. مثال دیگری از پیش همارایی «مدیریت کتابخانه دانشگاهی» است که نمایه پس همارای آن می شود: مدیریت /کتابخانه / دانشگاه، بدین معنی که در نظام پس همارا، کل مدارک را باید دید تا مشخص شود هر سه واژه دانشگاه / کتابخانه / مدیریت با هم به چه مدارکی اختصاص یافته است. در واقع، بسیاری از زبان های نمایه ای اصطلاحنامه ای که اصطلاحات مورد نیاز نظام پس همارا را فراهم می کنند، دارای اصطلاحات ترکیبی هستند و لذا باید آنها را پیش هماراسته تلقی کرد. (2)

   بنابراین همارایی به مفهوم تمام کلمه، یعنی ترکیب دو یا چند واژه برای به وجود آوردن یک رده موضوعی که با دیگر رده های موضوعی که با همان واژه ها اما بطور منفرد نشان داده شده باشند، یا حاصل نوع دیگری از ترکیب واژه های مزبور باشند، تفاوت داشته باشد. در واقع در این نظام، واژه های نمایه غالباً از ترکیب دو واژه یا بیشتر جهت توصیف موضوع های خاص بدست می آید. این واژه های پیش هماراسته، در همان شکل که نمایه ساز به آنها اختصاص داده است و بدون دستکاری اضافی به عنوان واژه های جستجونیز بکار می روند. (3)

 
ـ منطق جستجوی بولی در نظام همارائی (نمایه سازی پس همارا)

در واقع، نظام های نمایه سازی همارای امروزی به تدریج از مفهوم اولیه خود (روش مارتیمرتاب) نشأت گرفتند. این نظام ها، دیگر منحصراً بر اصطلاحات تکواژه ای مبتنی نیستند و از واژه هایی که حاصل ترکیب دو کلمه یا بیشتر باشد هم آزادانه استفاده می شود. این کلمه های مرکب را می توان واژه های پیش هماراسته دانست که در حین جستجو به روش همارا با هم ترکیب می شوند. واژگان آزاد به تدریج جای خود را به واژگان های کنترل شده ای می دهند که در اصطلاحنامه ها طبقه بندی شده و ساخت زبان نمایه را نشان می دهند.

انواع زبان های نمایه که در نظام های نمایه سازی همارا بکار می رود، اغلب شامل ارتباطهای پیچیده اصطلاحات است و از این رو جستجوهای تخصصی بغرنج را میسر می کند. جستجوهای تخصصی بغرنج با ظهور نظام های  رایانه‌ای هم میسر شد، در حالی که نظام های نمایه سازی همارای دستی، از جمله «پیکابو» تا حد زیادی محدود به استفاده از ضرب منطقی هستند و این اساساً حاصل محدودیت هایی است که در روش های آنها موجود است.

منطق جستجو که در اکثر نمایه های پس همارا به کار می رود، بر اساس منطق ریاضی جرج بول ریاضیدان انگلیسی قرار دارد. البته جای بحث منطق بول در منطق ریاضی و ریاضیات جدید است. در واقع، اصطلاح بولی کردن در نمایه سازی به معنی منطقی کردن کار موردنظر و به کار بردن روابط منطقی بین رده های موضوعی یا اعمال این روابط برای ایجاد رده ها و یا مفاهیم ترکیبی جدید است. با منطق بولی، بستگی های مفاهیم مندرج در پرسشها نشان داده می شوند، مثلاً گاهی لازم است که چندین مفهوم جستجو با هم ارتباط داده شوند. ادات منطقی بول عبارت اند از: و (and ) ، یا (or  ) و علامت نفی (نا،نه) not . شکل  های مطرح شده در صفحات بعد، کاربرد و معنی این ادات را نشان می دهد، این شکل ها به نمودارهای ون Vann diagrams معروف است. بنابراین برای درک بیشتر، اصطلاحات (مثل ضرب، جمع و تفریق منطقی) در زیر تنظیم شده است:

مثلاً اگر یک مجموعه ازمدارک درباره «نمایه سازی ماشینی» باشد (مجموعه A ) و مجموعه دیگر درباره «مجلات شیمی» (مجموعه B )، در این صورت، ضرب منطقی این دو (A×B ) جستجوی آن دسته از مدارک نظام را که «A » و «B» توصیفگر آنهاست، یعنی مدارک مربوط به «نمایه سازی ماشینی مجلات شیمی» را مشخص می کند. قسمت هاشورزده نشانه مجموعه مدارکی است که هر دو توصیفگر A و B به آنها داده شده است. (A/A×B وB )



      تفریق منطقی این دو (B A-) مدارکی را تعیین می کند که «A» توصیفگر آنهاست اما «B» نیست و این یعنی مدارکی که موضوع آنها « نمایه سازی ماشینی» است، به جز مدارکی  که در آنها از «نمایه سازی ماشینی مجلات شیمی» بحث    می شود. قسمت هاشورزده، نشانه مجموعه مدارکی است که توصیفگر A به آنها اختصاص یافته ولی توصیفگر B را ندارد. (A منهای A/B نه B )


 
     جمع منطقی این دو که بیانگر شمول است (A+B )، مدارکی را نشان می دهد که «A »یا «B » و یا هر دو توصیفگر را شامل می شود، یا به عبارت دیگر مدارکی را نشان می دهد که به موضوع «نمایه سازی ماشینی» یا موضوع «مجلات شیمی» و یا «نمایه سازی ماشینی مجلات شیمی » پرداخته اند.

قسمت های هاشورزده، نشانه مجموعه مدارکی است که توصیفگر «A » یا توصیفگر «B » (یا هر دوی آنها) به آنها اختصاص دارد. (A/A+B یا B )



    از منطق بول هم در برگه های جدول (ده ستونی) و برگه های انطباق پذیر نوری (که شرح آنها بطور مفصل در صفحات بعد داده خواهد شد) و هم در  رایانه‌، می توان استفاده کرد. در واقع، می توان گفت که کاربرد اصلی منطق بول در نظام های  رایانه‌ ذخیره و بازیابی اطلاعات است. در این نظام ها، پرسشهایی که از  رایانه‌ می شود، همه در قالب عبارت هایی است که شامل عملکردها و علامت های منطق بولند. (4)

 
ـ ریزش کاذب(
False - drop)

بازیابی ناخواسته در اصطلاح نمایه سازی همارا، «ریزش کاذب» خوانده می شود، این امر به ویژه در نمایه سازی پس همارا مشکلاتی را ایجاد می نماید، مثلاً مدرکی با سه توصیفگر فعالیت گرایی/ دانش آموزان/ معلمان، نمایه شده است. مدرک درباره «فعالیت گرایی دانش آموزان» بحث کرده، ولی به دنبال یک جستجو، ممکن است« فعالیت گرایی معلمان» نیز بازیابی شود و این چیزی نیست مگر ریزش کاذب، یا واژه های «فلسفه» و «تاریخ»، هم به صورت «فلسفه تاریخ» و هم «تاریخ فلسفه» ممکن است بازیابی شود. بدین ترتیب به مرور که نظام های نمایه سازی همارا بیشتر شناخته شدند و بطور گسترده مورد استفاده واقع شدند، بعضی محدودیت ها که خاص پس همارایی نمایه ها بود، خودشان را نشان دادند. امکان ترکیب نامحدود توصیفگرها که گمان می رفت، امتیاز نظام همارا باشد، ثابت کرد که در خیلی از موارد زیان آور است. در مراکز اسناد، کوشش همواره بر این بوده که با استفاده از روش های گوناگون حداکثر استفاده از بازیابی با حداقل صرف وقت و هزینه صورت گیرد. یکی از راههای کم کردن ریزش کاذب، پیش همارایی توصیفگرهایی است که ممکن است در مرحله بازیابی دچار این مشکل شوند. چنانکه قبلاً هم ذکر شد، پیش همارایی، اگر چه ریزش کاذب را کم می کند ولی به ویژگی بعد همارایی نمایه سازی لطمه می زند. هرگاه میانگین جستجو در بانک اطلاعاتی منتج به دسترسی به حدود 10 مدرک باشد، حتی اگر درصد ریزش کاذب زیاد باشد، باز هم می شود گفت که مشکل اساسی وجود ندارد، زیرا حذف چند مدرک ناخواسته از مجموع حدود 10 مدرک وقت زیادی نمی گیرد. مع هذا، اگر ریزش کاذب مشکل اساسی باشد، می توان راههای دیگری را نیز امتحان کرد که شاخص ها یا نشانه های نقش (Role ) و رابط (Link )از آن جمله اند، بدین معنی که برای جلوگیری از همارائیهای ناخواسته، «رابطها» به کار می روند، و برای نشان دادن عمل یا کارکرد یک واژه معین در یک توصیف نمایه ای، «نقشها» به کار می روند، به عبارت دیگر «رابط» نشانه یانمادی قراردادی است که به منظور پیوند دادن موضوع ها و مفاهیم توصیفگرهای یک مدرک بخصوص به کار می رود، «نقش»نیز نشانه ای است که کاربرد یک توصیفگر را در یک مدرک بخصوص مشخص می سازد. بنابراین قابل ذکرخواهد بود که رابطها و نقشها، همراه با توصیفگرها و شماره های مدارک مربوط به آن توصیفگرها می آیند تا ریزش کاذب را کم کنند، مثالی در مورد رابطها:

   اگر مدرکی درباره «آگهی تلویزیونی وسایل دید و شنودی» و«آگهی مطبوعاتی وسایل آموزشی» بحث نماید، نشانه های رابط به ترتیب زیر، در کنار شماره مدرک هر برگه ظاهر می شوند:

توصیفگرها شماره مدرک رابط

آگهی تلویزیونی     25  الف

آگهی مطبوعاتی     25   ب

وسایل دید و شنودی     25  الف

وسایل آموزشی     25   ب

   با این تدبیر، اگر جستجویی در مورد «آگهی تلویزیونی وسایل آموزشی» صورت گیرد، ارتباط کاذب به وجود نمی آید، زیرا ارتباط بین مفاهیم این مدرک روشن شده است، اما علی رغم اینکه رابطها می توانند از اختلال در امر بازیابی جلوگیری کنند، شاید مانع بعضی از همارائیهای بالقوه سودمند هم بشوند و این مورد را می توان با مثال مارتیمرتاب نشان داد و آن مدرکی است که موضوع آن، «پوشش سربی برای لوله های مسی» است. برای جلوگیری از همارایی کاذب بین «سرب» و «لوله ها» می توان به ترتیب از رابط بین «سرب» و «پوشش» از یک طرف و «مس» و«لوله ها» از طرف دیگر استفاده کرد. هرچند که این کار، احتمال ریزش یا همارایی کاذب را از میان می برد، ولی از همارایی بلالقوه مفیدی ، جلوگیری می کند و آن، ترکیب دو توصیفگر «پوشش» و «لوله ها» است که پاسخ مناسب به جستجو احتمالی در مورد «پوشش» و «لوله ها» خواهد بود. (2)

   از طرفی، با تمام این اوصاف، موضع یک اصطلاح در همه موضوعات یکسان نیست، یک کلمه در یک جا موضع «الف» و در یک جا موضع «ب» دارد و این مشکل ترین چیزی است که برای ماشین به وجود می آید، بنابراین در این میان، راه میانبر آن است که از این همارایی تکواژه ای عدول کرده و بصورت پیش همارا بعضی از واژها را استفاده نماییم.

-       سیستم های نمایه سازی پس همارا

-         پایگاه های اطلاعاتی  رایانه‌ای و سیستم برگه ای

   نخستین سیستم های نمایه سازی همارا مبتنی بر انواع مختلف برگه ها و دیگر سیاهه ها بود.

این سیستم ها اکنون بطور کلی بوسیله نمایه ها و سیستم های بازیابی همراه پایگاههای اطلاعاتی  رایانه‌ای کنار گذاشته شده اند. تسهیلات بازیابی ارائه شده در این محیط بستگی به ماهیت پایگاه اطلاعاتی (برای مثال، واژه های موضوعی و فیلدها) و نیز بستگی به نرم افزاری دارد که برای ایجاد، نگهداری و بازیابی اطلاعات از پایگاه اطلاعاتی به کار می رود. سیستم های  رایانه‌ای طیف وسیعی از استراتژی های جستجو را عرضه می کنند، همچنین سیستم های  رایانه‌ای استراتژی های جستجو را که در سیستم های برگه ای لیکن خسته کننده می باشد، آسان و بسیار موثر ارائه می دهند. سیستم های  رایانه‌ای برای جستجوی موضوعات اخص و عنوان هایی که از نظر توصیف به یک رشته از اصطلاحات مرکب احتیاج دارند، دارای گزینه های بسیار است.

 چرا پایگاه های اطلاعاتی  رایانه‌ای جایگزین سیستم های برگه ای می شود؟

  بسیاری از سیستم های برگه ای توانائی محدودی دارند، در واقع، یا برحسب تعداد مدارکی که بوسیله سیستم نمایه سازی می شود، یا برحسب تعداد واژه های موضوعی که بوسیله سیستم  پذیرفته می شوند، می باشند.این توانایی محدود، بدان معنی است که سیستم های برگه ای مناسب شرایطی می باشند که در آن نمایه فقط برای یک رشته موضوعی به خصوصی یا برای مجموعه کوچکی از مدارک یا اطلاعات مورد استفاده قرار می گیرد. بدین ترتیب، نمایه های پس همارای برگه ای اساساً در کتابخانه های اختصاصی از جمله کتابخانه های صنعتی، کتابخانه های هنری، و کتابخانه های تحقیقاتی و دولتی، و در مجموعه های خاص کتابخانه های بزرگتر کاربرد دارند، همچنین فرمت فیزیکی نمایه های پس همارای برگه ای، استفاده از آنها را در بخشهایی که در آن کتابداران و کارشناسان اطلاع رسانی به عنوان واسط میان نمایه و استفاده کنندگان از آن عمل می کنند، محدود می سازد. نمایه های پس همارای برگه ای برای استفاده کنندگانی که با سیستم آشنائی ندارند و ممکن است در اثر کمی تجربه و مهارت سازمان برگه ها را بهم بریزند، وسیله کارآمدی نمی باشد. سیستم های  رایانه‌ای با مقیاس وسیعتری جایگزین سیستم های برگه ای شده اند. هرچه میکرومینی  رایانه‌ها و نرم افزارهای بازیابی اطلاعات ارزان تر و استفاده از آن آسان تر شود، گرایش به سوی سیستم های محلی بازیابی اطلاعات  رایانه‌ای، تقویت می گردد. علاوه بر آن، برخی از این سیستم ها در موقع خود، به سیستم ها و شبکه های بزرگ آن ـ لاین (پیوسته) وصل می شوند. سیستم های بازیابی اطلاعات  رایانه‌ای که از بعضی از اصول نمایه سازی پس همارا استفاده می کنند، نه تنها در مجموعه ها و نمایه های خاص بلکه در سیستم های جستجو آن ـ لاین ( پیوسته) تجاری نیز کاربرد فراوان دارند. سیستم هایی مانند Dialog ، Irs ،Orbit ،Blaise ممکن است به وسیله کتابخانه ها و مراکز اطلاع رسانی در دسترس باشند.

 
- نمایه های مبتنی بر برگه

بررسی مفصل سیستم های نمایه سازی پس همارا را با شرح مختصری از بعضی از نمایه های برگه ای شروع می کنیم . این شرح ارزش تاریخی دارد، اما از نظر ارائه مفاهیم مربوط به نمایه سازی پس همارا وسیله موثری نیز به حساب می آید. نمایه های برگه ای (در واقع نوع سنّتی سیستم های نمایه سازی پس همارا) را می توان به دو صورت یعنی نمایه های Item Record و نمایه های Term Record تقسیم کرد.

 یک فایل Item Record فایلی است که درآن رکوردها به طور سریال بوسیله شناسه (Identifier) یا شماره مدرک مرتب می شود. هر مدخل یا رکورد، تمام اطلاعات مربوط به یک مدرک را، از قبیل رفرانس و واژه های موضوعی که در سیستم موجود می باشد، ذخیره می کند، برعکس یک فایل Term Record فایلی است که برحسب واژه های موضوعی مرتب گردیده و با هر مدخل یک واژه موضوعی واطلاعات مدرک همراه با آن اصطلاح نوشته می شود.

  یک نمایه پس همارای Item Record ممکن است چندین فرم فیزیکی داشته باشد. فرم فیزیکی محدودیت هایی را بر نوع اطلاعات یا داده ها که ممکن است ذخیره سازی شوند و بر شیوه ای که نمایه را می توان جستجو کرد، اعمال می کند:

1-      فهرستی از اصطلاحات :  روی جلد یا صفحه اول مدرک، ساده ترین فرم نمایه Item Record راتشکیل می دهد. آشکارا، این یک نوع نمایه کاملاً رضایت بخش نیست، زیرا برای اینکه نمایه را مورد جستجو قرار داد، تمام فهرست واژه های موضوعی که به هریک از مدارک تخصیص داده شده است، باید به خاطر بازیابی آن مدارک با گروهی از واژه های موضوعی دلخواه مورد بررسی و مرور قرار گیرد.

2-     برگه های فهرست : که با هر برگه یک مدرک، اصطلاحات واطلاعات کتابشناختی آن ارائه می شود و پیشرفت اندکی نسبت به گزینه اول دارد.  

3-    برگه های لبه منگنه(Edge Notch Cards): احتمالاً  معمول ترین نمایه غیر ماشینی Item Record می باشد. هر برگه به عنوان نماینده یا جانشینی برای یک مدرک عمل می کنند و واژه های موضوعی مدرک دورلبه برگه کد گذاری می شود. برگه های لبه منگنه یک رشته سوراخ در پیرامون خود دارد و تکه برگه میان سوراخ و لبه برگه را ممکن است با استفاده از یک منگنه، برای تشکیل یک بریدگی، برداشت. نقش بریدگیها و سوراخها در امتداد لبه یک برگه، ذخیره سازی واژه های موضوعی است که به مدرک تخصیص یافته است. عمل جستجو با داخل کردن یک سوزن در محل سوراخ یا سوراخهای یک دسته از برگه ها که نشان دهنده اصطلاح مورد جستجو است، انجام می گیرد. برگه های دندانه دار که مدارک مربوط را نشان می دهد، از سوراخ افتاده و از دسته برگه ها جدا می شوند. اصطلاح ریزش کاذب که در دیگر جنبه های بازیابی اطلاعات روی می دهد، می تواند اصل واساس خود را در برگه های لبه منگنه پیدا کند. ریزش کاذب به برگه هایی اطلاق می شود که به واقع مدراک مربوط به موضوع جستجو را نشان نداده و از سوزن پائین نمی افتند. در ارتباط با داخل کردن سوراخ در دسته برگه ها فرض کنید که در یک نمایه شامل «آموزش و پرورش» لازم است تمام مدارک نمایه سازی شده ذیل اصطلاح «مدارس متوسطه» را تعیین کنیم. اگر «مدارس متوسطه» در زبان نمایه سازی بکار رفته در نمایه، اصطلاح باشد، ممکن است کدگذاری شده و بوسیله یک سوراخ که شماره 8 به آن داده شده است، نشان داده شود، وقتی سوزن را در محل 8 قرار دهیم تمام برگه ها دسته با سوراخ 8 از سوزن خواهد افتاد. بدین ترتیب، تمام برگه های مربوط به مدارکی که حاوی مطالبی درباره «مدارس متوسطه» است از دسته برگه ها برداشته می شوند.

4- برگه های روزنه دار(Aperture Cards): نوع خاصی از برگه است که ذخیره سازی تمام مدرک را در مرکز برگه امکان پذیر می سازد. یک میکروفرم افزوده که حاوی متن کامل مدرک نمایه سازی شده است به برگه الصاق می شود. نمایه ای که از برگه های روزنه دار استفاده می کند، بیش از یک نمایه می باشد. این نمایه مجموعه کامل مدارک است و برگه ها برای خواندن مدارک باید برداشته شوند. درواقع، با این عمل می خواهیم خواننده خود درباره امتیازات نسبی چنین فرمتی اندیشه کند.  برای ذخیره سازی نقشه های، فنی، فرم استانداری به حساب می آید و در ارتباط با ثبت نامه ها نیز بکار می رود. مدارک ممکن است بوسیله کدگذاری پیرامون لبه برگه بازیابی شوند و جدا از میکروفیش افزوده، شبیه به سایر برگه های لبه منگنه می باشد.

نمایه های برگه ای Term Record نیز فرم های فیزیکی مختلفی دارد:

1-  برگه اصطلاح (Term Card): ساده ترین فرمتی است که در یک نمایه Term Record مورد استفاده  قرار می گیرد. نمایه ای که بر اساس برگه اصطلاحات ایجاد می شود و بطور سطحی، کمی متفاوت از یک نمایه برگه ای معمولی می باشد. اگر چه در جستجوی آن باید دانست که این نمایه در واقع یک نمایه پس همارا می باشد. در این  نمایه، هر واژه موضوعی یک برگه به خود اختصاص می دهد، و بر روی آن برگه، شماره های مدرک یا رفرانسهای بسیار مختصری از مدارکی که برای آن واژه موضوعی به خصوص اختصاص یافته است، نشان داده می شود.

2- برگه های جدولی یا ده ستونی (Terminal Digit Cards): نوع به خصوصی از برگه اصطلاح است . برگه ده ستونی که گاهی به نام برگه اصطلاح خوانده می شود، شماره های مدرک را بر روی هر برگه وارد کرده و به ترتیبی تنظیم می شود، که مرور و مقایسه لیست شماره را آسان می سازد. شماره مدرک در ستونی از برگه بر حسب آخرین  شماره وارد می شود، بدین ترتیب هر برگه ده ستونی عمودی به ترتیب از 0 تا 9 تقسیم می شود. به دلیل کاربرد فراوان این نوع از برگه ها، در این پژوهش بطور مفصل راجع به آنها و چگونگی نحوه بازیابی شان بحث می شود. (3)

- بازیابی اطلاعات در نمایه سازی پس همارا (از طریق برگه های جدولی یا ده ستونی )

اطلاعات شناسنامه هر مدرک روی کارتی ترجیحاً به اندازه 24×15 ثبت می گردد. شماره ترتیب قرار گرفتن مدرک در قفسه که همان شماره بازیابی است، روی کارت نوشته می شود.




  اگر برگه بزرگ باشد، قسمت فهرست تحلیلی را در پایین برگه  و در غیراینصورت در پشت برگه  یادداشت می کنیم. (اخیراً فهرست تحلیلی را در پشت آن می نویسند و در بخش پایین آن در صورت وجود جا، چکیده را می نویسند). به هر حال، این بخش همیشه در یک محل مشخص باید نوشته شود. به این برگه، برگه مادر می گویند که بر اساس شماره بازیابی (ثبت) مرتب می گردند. در مرحله بعد به تعداد موضوع هایی که در قسمت تحلیلی یادداشت است (چه این موضوع ها از سرعنوان موضوعی استخراج شده باشد، چه از یک تزاروس ( اصطلاحنامه) و بصورت کلیدواژه)، از روی کارت اصلی یا برگه مادر، تکثیر می شود. بعد هر کدام از موضوع ها در بالای کارت های تکثیر شده، با فاصله در ردیف شماره بازیابی نوشته می شود. لازم به ذکر است که در گذشته به دلیل کمبود وجود تزاروس از سرعنوان های موضوعی نیز برای تعیین  موضوع استفاده می شد، اما امروزه تنها از تزاروس استفاده می شود.

نمونه ای از این کارت های موضوعی را در زیر مشاهده می کنید:

 

   این برگه ها در برگه دان موضوعی به ترتیب الفبایی بایگانی می شوند. چنانچه چند برگه دارای موضوع واحد بودند به ترتیب شماره از کوچک به بزرگ مرتب می شوند، ولی همان طور که قبلاً هم گفته شد برگه های مادر، در برگه دان دیگر به ترتیب شماره بازیابی (ثبت) مرتب می شوند. حال چنانچه مراجعه کننده ای در پی تحقیق در مورد «برنامه های درسی» باشد، برگه دان موضوعی در محل الفبایی «برنامه های درسی» تعداد مدارکی که با این موضوع در آرشیو وجود دارند، نشان می دهد. شماره های سمت راست بالای کارت نیز محل قرار گرفتن مدرک در ققسه ها را نشان می دهد. این روش برای آرشیو کوچک مناسب است و اگر تعداد مدارک زیاد شود، حجم برگه دادن ها سریع اشغال شده و تعداد برگه دان ما زیاد می شود که در این صورت هم جاگیر و هم جستجو گیج کننده می شود. برگه های 0 تا 9 این مشکل را تا حد زیادی حل می کنند. این برگه ها در اندازه 5/12 × 5/7 و 24× 15 تهیه می شوند که شاهد نمونه ای از آن ها هستید:

 

 

9

8

7

6

5

4

3

2

1

0

 

 

 

 

 

 

 

 

 

 

 
   برای استفاده از این برگه ها، به این ترتیب عمل می کنیم که پس از آماده شدن برگه مادر، به تعداد موضوع های در نظر گرفته شده برای هر مدرک که در برگه مادر ثبت شده است، برگه 0 تا 9 تهیه می کنیم. موضوع را در قسمت بالای برگه می نویسیم و بعد شماره مدرک، بر اساس آخرین رقم سمت راست در ستون مربوط به آن رقم نوشته می شود. به برگه های مربوطه در زیر و صفحات بعد توجه نمایید.


 

مدارس ابتدایی  

9

8

7

6

5

4

3

2

1

0

 

 

67

 

 

 

 

 

 

 

 

آموزش و پرورش

9

8

7

6

5

4

3

2

1

0

 

 

67

 

 

 

 

 

 

 

 

نظام جدید آموزشی  

9

8

7

6

5

4

3

2

1

0

 

 

67

 

 

 

 

 

 

 

 

     به این ترتیب، چهار برگه برای موضوع های مربوط به مدرک شماره 67 تهیه شد. چنانچه هر کدام از این موضوع ها قبلاً در مدرک دیگری وجود داشت وبرای آن موضوع برگه 0 تا 9 تهیه شده بود، حال برگه دیگری تحت همان موضوع تهیه نمی شد، فقط کافی بود که شماره 67 در ستون 7 همان برگه قبلی ثبت شود. در مورد مدارک بعدی نیز به همین ترتیب عمل می شود. چنانچه برای موضوع های در نظر گرفته شده برگه ای وجود داشته باشد، شماره مدرک جدید را در ستون مربوطه وارد می کنیم وچنانچه برگه 0 تا 9 تحت موضوع مربوطه وجود نداشته باشد، برگه جدیدی برای آن موضوع تهیه می شود. برگه های 0 تا 9 به ترتیب الفبایی در برگه دان مرتب می شوند، بنابراین داریم:

- آموزش و پرورش

- برنامه های درسی

- مدارس ابتدایی

- نظام جدید آموزش و پرورش

بنابراین برگه های 0 تا 9 موضوعی طبق نظام الفبایی فوق مرتب می گردند. درضمن یادآوری می شود که در برگه 0 تا 9 حداقل 100 مدرک را می توان ثبت کرد.

 
- تعیین موضوع

مراحل تعیین موضوع عبارت است از:

1.       تشخیص محتوای مدرک یا به عبارت دیگر هدف نویسنده یا تهیه کننده

2. تعیین و تشخیص مفاهیمی که این منظور و محتوا را نشان دهد، یعنی پس از بررسی مدرک، نمایه ساز به شکلی منطقی به انتخاب مفاهیمی که موضوع را بیان می کند، می پردازد. برای انتخاب درست مفاهیم بهتر است از اصطلاحنامه های موضوعی استفاده نمائیم و نیز باز هم بهتر است برای هر موضوع، از اصطلاحنامه مخصوص آن حوزه استفاده نمود، مثلاً برای مدرک پزشکی از اصطلاحنامه پزشکی ویا برای متون کتابداری از اصطلاحنامه کتابداری.

3. انتخاب مفاهیم، یعنی اینکه ضرروتاً نمایه ساز همه مفاهیمی را که در بررسی مدرک بدست آورده است بکار نمی برد، بلکه انتخاب مفاهیمی که باید پذیرفته یا رد شود، بستگی به هدف نمایه سازی دارد، مثلاً آیا هدف، تهیه نمایه الفبایی چاپی است یا هدف، ذخیره عناصر نمایه سازی برای بازیابی  رایانه‌ای (ماشینی) یا گونه ای دیگر است.

- تعیین نوع مدرک

برای اینکه نوع مدرک مشخص شود، از دو روش می توان استفاده کرد:

1. رنگ: به این ترتیب که برای هر نوع مدرک یک رنگ در نظر گرفته شود، سپس مدرک بر روی برگه مادر و همچنین برگه های 0 تا 9 ، با رنگ در نظر گرفته شده، نوشته می شود.

2. نام مدرک: در زیر شماره مدرک، بر روی برگه مادر و برگه های 0 تا 9 ، نام مدرک یا علامت خاصی که به جای نام مدرک در نظر گرفته شده است، یادداشت می شود. به این ترتیب، با دیدن شماره های مربوطه به یک موضوع می توان متوجه شد که در آن موضوع چند مدرک و از چه نوع وجود دارد.

3. برگه های تطابق نوری( Optical Coincidence Cards) : مشهورترین فرم فیزیکی برای نمایه سازی پس همارا است. این برگه به نام های «پیکابو» و «باتن»(Batten) -که ذکر آن گذشت- نیز خوانده می شود. تمام برگه ها در بالا محلی برای کلید واژه دارند و نمایه بر حسب «الفبایی» کلید واژه ها مرتب می شود. سطح هر برگه از خانه های شطرنـجی که بسیاری از قسمت های برگه را می پوشاند تشکیل شده وبدین طریق کد گذاری شماره های مدارک انجام می گیرد. وقتی که شماره مدرکی مربوط به یک واژه موضوعی موردنظر برروی برگه ذخیره می شود، سوراخی در محلی  که نشان دهنده آن شماره می باشد، منگنه می شود. جستجو نه تنها مستلزم خواندن کدی است که با محل سوارخها برابری می کند، بلکه مقایسه سوراخهائی را نیز که در بیش از برگه تکرار می شود، بوسیله تطابق نوری ایجاب می نماید. برگه ها به دقت یکی بر روی دیگری در یک ردیف قرار می گیرند. بررسی و رسیدگی، محلهائی را بر روی برگه ها نشان می دهد که نور از آنها عبور می کند. این کار به کمک یک جعبه نور انجام می گیرد. این محلها برابر با مدارکی است که ذیل هر یک از واژه های موضوعی نمایه سازی شده و از نمایه انتخاب گردیده است. برگه های تطابق نوری معمولاً در یک خانه که واژه های موضوعی را در بالای هر برگه نشان می دهد نگهداری می شوند، بطوری که ترتیب الفبائی را به آسانی می توان دنبال نموده و برگه های مورد نظر را به سادگی انتخاب کرد. برگه های تطابق نوری یکی از معمول ترین فرمت هائی است که در نمایه سازی پس همارا از آن استفاده می شود، زیرا این برگه ها از ظرفیت ذخیره سازی تعداد زیادی از مدارک برخوردار می باشند، بنابراین برگه های بزرگتر دارای 9999 محل کد گذاری بوده و بدین ترتیب می تواند 9999 شماره مدرک را ذخیره کند. نمونه ای از این برگه ها در صفحه بعد قابل مشاهده است.

4. برگه های لبه منگنه: این برگه ها را پیش از این رابطه با نمایه های Item Record بررسی کردیم. این برگه ها ممکن است در نمایه های Term Record نیز مورد استفاده قرار گیرند. در این کاربرد، هر برگه حاوی تمام داده های مربوط به یک واژه موضوعی مورد نظر است. محل هایی که لازم است کدگذاری شود،پیرامون منگنه می شود تا شماره مدارکی را که ذیل یک واژه موضوعی به خصوصی نمایه سازی شده است، نشان دهد.

 
مشکلات
 نمایه سازی همارا در زبان فارسی

1- کمبود متون و دستورالعمل های نمایه سازی

2- کمبود فرهنگهای کاملاً دقیق و اصطلاحنامه های فارسی که در نتیجه از برقراری یکدستی در نمایه ها جلوگیری می کند.

3- روشن نبودن دامنه معنایی بسیاری از واژه ها در زبان فارسی بطوری که گاهی انتخاب واژه ها و اصطلاحات علمی خارجی معقولتر است. این مشکل مثلاً در مورد واژه های فنی، پزشکی و علوم وابسته پزشکی محسوس است.

4- در اختیار نبودن اصطلاحنامه های متعدد چاپ خارج

5- کمبود متخصصان نمایه ساز

6- مساله واژه های مترادف و هم معنی (که البته محدود به زبان فارسی نیست )

7- احتیاج به برقراری رابطه ها ونقش ها (که این مورد نیز محدود به زبان فارسی نیست)

8- آشنا نبودن غیر متخصصان با این شیوه اطلاع رسانی و در نتیجه محدود شدن کارایی آن

9- مشکل زبان ترجمه ها که با توجه به میزان آثار خارجی، به شکل اصلی انتخاب معادل های فارسی در برابر واژه های خارجی پی برده می شود.

     روی هم رفته می توان گفت که مشکل اساسی این شیوه یافتن یک اصطلاح مناسب برای تکواژه است و این امر به خصوص هنگامی دشوارتر می شود که اصطلاح برگزیده شده، از یک کلمه بیشتر باشد. ضمناً تکواژه ها بیشتر برای موضوع های کاملاً اختصاصی مناسب اند تا برای موضوع های کلی. (2)

 
نمایه سازی در ایران

   حال با توجه به آنچه از نمایه سازی همارا دریافتیم، لازم به ذکر است که در ایران، مراکز مدارک علمی معمولاً انجام امر نمایه سازی را برعهده دارند و با در اختیار داشتن مجموعه کاملی از مدارک،پژوهشگران را در انجام کارهای تحقیقاتی یاری می دهند.

در انجام چنین کار خطیری، «مرکز اطلاعات و مدارک علمی ایران » از سال 1350، کار نمایه سازی مقالات فارسی را در زمینه های علوم و علوم اجتماعی آغاز کرد و ضمن مطالعه و بررسی و آزمایش روش های مختلف نمایه سازی، روش نمایه سازی همارا که پایه آن تجزیه و تحلیل محتوای اطلاعاتی مدارک در قالب مفاهیم بود، انتخاب کرد. ضوابط نمایه سازی بطور اعم همان بود که در مراکز اطلاع رسانی و دکومانتاسیون دنیا به کار می رفت. ضوابط و ویژگیهای خاص این نظام در ارتباط با زبان فارسی در جلسات مختلفی که با حضور نمایه سازان تشکیل می شد، بحث بررسی و احتمالا به تصویب و تأیید رسید و برای طبقه بندی مفاهیم، نظام رده بندی دهدهی جهانی (یو.دی.سی Universal Decimal Classification: UDC) به کار گرفته شد.

    بدین ترتیب در سال 1350، دو سال پیش از آنکه بخش نمایه سازی ایجاد شود، گروهی از همکاران «مرکز اطلاعات و مدارک علمی ایران» در یک دوره فشرده چهارهفته ای با اصول کلی نمایه سازان آشنا شدند و در سال 1352 نیز همکاران دیگری در کلاسی که دوباره دکومانتسیون تشکیل شده بود و مسائلی از نمایه سازی را هم در بر گرفت، شرکت کردند. بعد از مدتی، به دلیل نارسایی مفاهیم موجود در رده بندی دهدی جهانی (یو.دی.سی) و عدم شمول آن به کلیه مسائل و موضوع های جدید، به ویژه مسائل مربوطه به ایران، مفاهیم در قالب توصیفگر درآمد و ذخیره و بازیابی اطلاعات نیز براساس توصیفگرها صورت گرفت. در آغاز،  ذخیره و بازیابی اطلاعات براساس برگه های جدول (0 تا 9) یا ده ستونی انجام می گرفت، پس از مدتی به علت زیاد شدن تعداد مدارک و عدم کشش برگه های ده ستونی، برگه های میان منگنه (برگه های انطباق پذیر یا تطابق نوری) که شرح آنها قبلاً رفت، مورد استفاده قرار گرفت، که می توان گفت ظرفیت تا 14000 شماره را داشتند. از سال 1367 با رواج  رایانه‌ سیستم برگه های میان منگنه، که با نام تجاری سلکتور در مرکز مورد استفاده بود، کنار گذاشته شد و کار ذخیره و بازیابی اطلاعات و مدارک  رایانه‌ای شد. لازم به ذکر است که استفاده از کارتهای سلکتور موجب خواهد شد تا هنگام پاسخ به سئوالات، با شکستن سوال به چند واژه کلید، کارت های مربوط به این واژه را از مجموعه کارتهای سلکتور استخراج کرد و با انطباق آنها برهم به سرعت شماره های مشترک را مشخص نمود و با مراجعه به کارتهای اطلاعاتی، مدارک لازم را در اختیار مراجعه کننده قرارداد.

بخش نمایه سازی «مرکز اطلاعات و مدارک علمی ایران» ( که اینک در گروه مدیریت اسناد و اطلاعات ادغام شده است) تا سال 1358 عملاً نمایه سازی پایان نامه های دانشجویان ایرانی، فارغ التحصیلان از دانشگاههای ایران و خارج، و نیز نمایه سازی نشریات سازمان های دولتی و غیردولتی ایران را بر موارد دیگر برنامه خود، یعنی نمایه نشریات و تهیه و تنظیم اصطلاحنامه های موضوعی اولویت داده بود. آمار نمایه سازی مدارک ظرف این سال ها به حدود 3500 مدرک رسید. مسایل و مشکلات واحد برای نمایه سازی شامل:

1- فقدان ضوابط برای نمایه سازی

2- فقدان ضوابط برای ارزشیابی مدرک

3- نارسایی های تهیه مدرک مثل نفرستادن یا دیر فرستادن مدارک به مرکز

4- ناهماهنگی با نیاز مراجعان چه از نظر جنبه فنی و چه از نظر عدم بار اطلاعاتی لازم مدرک

5- عدم آشنایی کامل نمایه سازان با نظام واقعی نمایه سازی و نبودن آموزش مستمر

6- نداشتن تخصص های لازم در نمایه سازی مدارک حوزه علوم، زیرا مدارک مربوط به علوم اجتماعی، در بیشتر موارد، نمایه ساز متخصص را داشته است.

     در این جا باید یادآور شد که شیوه کار مرکز در مورد انتشارات سازمان های مختلف ایران اعم از دولتی و غیر دولتی از سال 1348 تا سال 1352 که در آن سال بخش نمایه سازی به وجود آمد، بدین ترتیب بود که این انتشارات پس از گردآوری در برگه های فروست، ثبت  شده و آنگاه به کتابخانه ارسال می شدند، سپس در کتابخانه برحسب سازمان متبوع و شماره انتشار در قفسه  جای می گرفتند. غیر از این کار و انتشار یک فهرست الفبایی از این نشریات، کار دیگری بر روی این نشریات انجام نمی گرفت. پایان نامه ها نیز بر اساس جدول کلی نظام رده بندی دهدهی جهانی (یو.دی.سی) دسته بندی و ردیف بندی شدند. طبقه بندی این مدارک در سطح جدول دوم این رده بندی بود که اصولاً محتوای اطلاعاتی مدارک را تجزیه و تحلیل نمی کرد. بعداً فهرست الفبایی موضوعی در دو جلد جداگانه در زمینه های علوم اجتماعی، پزشکی و داورسازی از این پایان نامه ها تنظیم و منتشر شد. در حال حاضر روش نمایه سازی در «مرکز اطلاعات و مدارک علمی ایران» بر اساس دو روش پیش همارا و پس همارا (نمایه سازی همارا ) و با کنترل اصطلاحنامه ها انجام می شود. توصیفگرهای جدید در شواری استاندارد مطرح نشده و از نمایه سازان نظر خواهی به عمل می آید، پس از نمایه سازی، مدارک، به واحد نمونه خوانی جهت پانچ مندرجات کاربرگه ها، تهیه نسخه کپی از فایل اطلاعات پانچ شده، ثبت مشخصات کاربرگه های پانچ شده و فایل اطلاعات در فرم مخصوص ارسال می شود. در پایان لازم به ذکر است که واحد نمایه سازی مرکز در حال حاضر فاقد مجموعه توصیفگرهای کنترل شده است. (19 )


نتیجه گیری

     همان طور که از پژوهش حاضر بر می آید، این تحقیق به بحث راجع به همارائی نمایه ها می پردازد. طبق گفته ها، معلوم شد که نظام های نمایه سازی را بر حسب روشی که در نمایه کردن موضوع ها دارند، به دو گروه مستقل پیش همارا و پس همارا تقسیم می کنند، که در روش اول، واژه و مفاهیم و اصطلاحات در موقع نمایه سازی با یکدیگر ترکیب می شوند. (درون داد یا نمایه سازی پیش همارا) و در روش دوم، این کار در موقع بازیابی صورت می گیرد (برون داد یا نمایه سازی پس همارا) که مجموع دو گروه درون داد (نمایه سازی پیش همارا) و برون داد (نمایه سازی پس همارا) روی هم نظام  همارائی را در نمایه سازی به نام «نمایه سازی همارا» مطرح می سازد.

    بین نظام های پیش همارا و پس همارا تمایز قائل شدیم، به این نتیجه می رسیم که یک نظام بازیابی اطلاعات نوین احتمالاً هم ویژگی های پیش همارا و هم قابلیت های پس همارا در بر دارد. احتمالاً در واژگان مورد استفاده در نمایه سازی نوعی پیش همارائی وجود دارد، مثلاً توصیفگر «رشد جمعیت» که از یک اصطلاحات اخذ شده است، نوعی پیش همارایی را برای اصطلاحنامه مشخصی به عنوان تقسیم فرعی استفاده نماید، بنابراین ممکن است سرعنوان زیر را تولید کند:

رشد جمعیت /آمارها

عاقبت کاوشگر می تواند آزادانه و در یک رابطه منطقی، اصطلاحات را با یکدیگر ترکیب کند، مثل «مدارکی که زیر سرعنوان «رشد جمعیت /آمارها» و نیز زیر توصیفگر « امریکای جنوبی» قرار دارند».

   بنابراین، نوعی همارایی ( در مفاهیم یا اصطلاحاتی که توصیفگرها را ارائه می کنند) در ویژگی های واژگان ایجاد گشته و نیز ممکن است همارایی بیشتری در هنگام نمایه سازی حاصل آید. این همارایی را می توان نوعی پیش همارایی قلمداد کرد که رکوردهای ورودی به پایگاه را همارایی می کند و آخرین سطح همارایی در واقع آن است که از طریق دستکاری اصطلاحات در هنگام کاوش (یعنی پس همارایی) حاصل می آید. (8)

    در واقع در این نوع نمایه سازی به گونه ای ترجیح بر استفاده از زبان طبیعی است، اما در صورت نیاز می توان از اصطلاحنامه (تزارروس) برای ایجاد زبان مصنوعی استفاده نمود. در اصل، نمایه سازی پیش همارا به ساختار سرعنوان های موضوعی نزدیک بوده و بیشتر از زبان های مصنوعی (واژه های موجود در اصطلاحنامه) بهره می برد، حال آنکه نمایه سازی پس همارا کاملاً وابسته به زبان طبیعی است و از آن جا که منظور از نمایه سازی همارا بازیابی واژه ها در هنگام جستجو (نمایه سازی پس همارا) می باشد، بنابراین استفاده از زبان طبیعی در این جا کاملاً مشهود است، چه بسا که استفاده از زبان طبیعی نیز در این نوع نمایه سازی خود موجبات بروز مشکلاتی از جمله ریزش کاذب را فراهم می سازد.

 

فهرست منابع:

1- آرتاندی، سوزان. «نمایه سازی همارا». ترجمه فیروزان زهادی. نشریه فنی مرکز اطلاعات و مدارک علمی ایران. دوره هفتم. شماره 2 . (وب سایت)

2- آقابخشی، علی (1379 ). نمایه سازی همارا. تهران : مرکز اطلاعات ومدرک علمی ایران.

3. پژوهشگاه اطلاعات و مدارک علمی ایران. ‌مروری بر سه ده فعالیت اطلاع رسانی: فعالیت های اجرایی.

(http://www.irandoc.ac.ir/about/EXecut-Act.htm)

4- راولی، جنیفر (1374 ). نمایه سازی و چکیده نویسی. ترجمه جعفر مهرداد. تهران: سازمان مدارک فرهنگی انقلاب اسلامی.

5- سلطانی، پوری؛ راستین، فرودین (1379 ). دانشنامه کتابداری و اطلاع رسانی. تهران: فرهنگ معاصر.

6- سن ویل، دوینیک ( 2536 ش= 1356 .ش. ). راهنمای نمایه سازی مدارک و گسترش اصطلاحات توسعه فرهنگی در کشورهای آسیایی. ترجمه عبدالحسین آذرنگ. تهران: مرکز اسناد فرهنگی آسیا.

7- سینایی، علی؛ میرزاده، احمد؛ هوسپیان، آنوش. «راهنمای نمایه سازی». نشریه فنی مرکز اطلاعات و مدارک علمی ایران. دوره سوم، شماره های 1 و 2 ،بهار و تابستان 1353.

http://www.irandoc.ac.ir/etela-art/JiSold/3-1&2-1.htm)
8- سینایی، علی. «نمایه سازی همارا». نشریه فنی مرکز اطلاعات و مدارک علمی ایران. دوره اول، شماره 2، دی 1351.

http://www.irandoc.ac.ir/etela-art/JiSold/1-2-2.htm) 
9- فاگمر، پیتر (1374 ). تحلیل موضوعی و نمایه سازی: مبانی نظری و توصیه های علمی. تهران:

کتابخانه ملی جمهوری اسلامی ایران.

10- لنکستر، فردریک (1384). نمایه سازی و چکیده نویسی: مبانی نظری و علمی . ترجمه عباس گیلوری. تهران: چاپار.

11- مولاپرست، فیروزه. «اصطلاشناسی و کاربرد آن در فعالیت های اطلاع رسانی». نشریه فنی مرکز اطلاعات و مدارک علمی ایران. دوره دوم. شماره های 2 و 3 . (وب سایت)

12- میرزاده، احمد. «نمایه و نمایه سازی » . نشریه فنی مرکز اطلاعات و مدارک علمی ایران. دوره دوم، شماره های 2 و 3 (http://www.irandoc.ac.ir/ETELA-ART/JiSold/2&3-2-2.htm) 
13- نوروزی، علیرضا (1380). نمایه سازی کتاب. تهران: چاپار.

14- ویکی پدیا، دانشنامه آزاد. نمایه سازی. (http://www.wikipedia.com)  

15- ـــــــــــــــــــــــــــ . نمایه سازی همارا. (http://www.wikipedia.com)

 


نوشته شده در تاريخ شنبه ۱٥ تیر ۱۳۸٧ توسط نمایه

نمایه سازی موتورهای وب  و اهمیت آن در بازیابی اطلاعات جهان مجازی

چکیده
با پیدایش دنیای مجازی شاهد ظهور انقلاب دیگری تحت نام انقلاب اطلاعات هستیم.   
 از سوی دیگر حجم انبوه اطلاعات کاربران را بر آن داشته تا به کیفیت اطلاعات بیش از کمیت آن بیندیشند. اطلاعات روز آمد، دقیق و معتبر سه ویژگی مهمی است که لازمه کار هر محقق می باشد. لذا رشد فناوری های نو ظهور، روشهای جدیدی را به منظور سازماندهی اطلاعات جهت بازیابی دقیق آن به یاری می طلبد.

با استفاده از روشهای نوین سازماندهی، اطلاعات مفید از اطلاعات سیال و ناپایدار استخراج شده و کاربر به سهولت می تواند به اطلاعات مورد نیاز خود دسترسی پیدا کند. یکی از مهمترین این راهکارها، نمایه سازی وب است. دنیای وب با مدد از این راهکار دریچه ای نو را به روی کابرانمی‌گشاید. در این مقاله می کوشیم تا با نگاهی به نمایه سازی وب، به بررسی انواع نمایه، نمایه سازی در موتورهای جستجو، ابر موتورها و ابر داده ها از جمله ابر داده دوبلین کور ، بازنمود نمایه در وب و معرفی نرم افزارهای نمایه سازی بپردازیم و بستری مناسب جهت اهمیت و نقش آن در بازیابی اطلاعات جهان مجازی فراهم آوریم.

 کلید واژه ها: نمایه[1]، نمایه سازی وب[2] ، موتور جستجو[3]، ابر موتور جستجو[4]، ابر داده[5]،دوبلین کور[6]، بازنمود نمایه

مقدمه
 
رشد تصاعدی فضای اطلاعاتی وب، آلودگی اطلاعات را دامن زده است، از سوی دیگر وجود اطلاعات میرا و سیال اهمیت نمایه سازی وب را بیش از پیش مطرح می سازد. لذا آنچه که  برای کاربران وب مهم است، دستیابی سریع و آسان به اطلاعات دقیق، روزآمد و دارای اعتبار می باشد، نه حجم انبوه اطلاعات. نمایه سازی کارآمد، به کاربر امکان بازیابی اطلاعات دقیق، صحیح و روز آمد را می دهد. به بیان دیگر نمایه سازی وب فرآیند پالایش و فیلتر  اطلاعات دنیای وب است و نمایه ساز پالاینده  اطلاعات آن. باید دانست که نمایه سازی وب مفهوم جدیدی نیست.

  
نمایه سازی وب

با گسترش حجم انبوه اطلاعات و به اشتراک گذاری آن و رویکرد روز افزون برقراری ارتباطات از طریق اینترنت بحث سازمان دادن اطلاعات به قصد سهولت در بازیابی مطرح می باشد. یکی ازکارآمدترین روشهای بازیابی، نمایه سازی وب     می باشد. نمایه وب منابعی را که از طریق  world wide webدر دسترس هستند جمع آوری و سازماندهی مینماید و نقطه شروعی برای یافتن اطلاعات می باشد. در وب نمایه ها ممکن است به روشهای گوناگونی سازماندهی شوند. شیوه سازماندهی یک نمایه با نمایه دیگر فرق میکند، نمایه ها می توانند به طور الفبایی، موضوعی (رده ای) و ... سازماندهی شوند. نمایه های موضوعی اغلب منابع شان را طبق یک نظم سلسله مراتبی از اعم به اخص مرتب می کنند.. نمایه های وب برای نشان دادن لیستهای منابع خود ازپیوندهای فرا متن استفاده می کنند، آنها این امکان را دارند تا از طریق لینک ها صدها و بلکه هزاران منبع را در بر بگیرند. عموما تمام نمایه ها یک نقطه اتصال دهنده مستقیم به منابع فهرست شده را به کاربران عرضه می کنند.

 لذا این نکته به خوبی قابل احساس است که ساختارهای وسیع و جامع یک متن برای دسترسی آسان تر نیاز به سازماندهی و نظم منطقی دارند. از دید یک محقق یا کاربرمعمولا دسترسی آسان به اطلاعات به بیش از یک استراتژی جستجو نیازمند است و نهایتا همه آنها به فرآیند سازماندهی فایلهای HTML درزیر فهرستهایی منتهی می شوند.

این زیر فهرستها هم به تهیه کننده اطلاعات و هم به کاربر وب سایت کمک می کند. در این حالت کاربر می تواند براساس یک کد، یک نام فایل،یا محتوای یک عنوان جستجو کند.به عنوان مثال یکی از راههای دسترسی به این موارد برنامه ای به نام CGI می باشد.[ http://www.cu.edu/]

 نمایه های وب برای نشان دادن لیستهای منابع خود از پیوندهای فرا متن استفاده می کنند، آنها این امکان را دارند تا از طریق لینک ها صدها و بلکه هزاران منبع را در بر بگیرند.

تعدادی از نمایه های مشهور وب به شرح ریر می باشند:[ : http://www.ext.nodak.edu/ ]

●Yahoo!TM
●The WWW Virtual Library
●Trade Wave Galaxy
فهرست خدمات اینترنتی Yanoff
●The Argus Clearinhouse
●Magellan
●Point

 دو عامل مهم در نمایه سازی وب

نمایه، یک مخزن جامع از اطلاعات در دسترس نیست اگر چه آنها می توانند هزاران منبع را فهرست کنند. در واقع نمایه های وب ما را به فهرستها و راهنماها ارجاع می دهند. این نوع نمایه ها نیاز به یک نرم افزار و یک زبان نمایه سازی خاص دارند.

الف- زبان نمایه سازی

زبان نمایه سازی آن دسته از واژگان نمایه سازی است که در نظام خاصی از ذخیره و بازیابی مورد استفاده قرار می گیرد. "زبان " می تواند طبیعی، یعنی زبان مدرک نمایه سازی شده باشد، یا ساختگی یا کنترل شده باشد(یعنی از نوعی تنظیم برخوردار باشد. (سلطانی، 1382، ص 180)

عملکرد نظام بازیابی متاثر از کیفیت زبان نمایه است. وجود نمایه سازی و جستجوی خوب نمی تواند زبان نمایه نامناسب را جبران کند به عبارت دیگر کاربران اطلاعات فقط به آن اندازه می توانند عمل نمایند که زبان نمایه مجاز می شمارد. ناتواناییهای زبان نمایه بر دو نوع است: 1-عدم توانایی به خاطر ویژگی در اصطلاحات 2-عدم توانایی به خاطر ابهام یا روابط کاذب بین اصطلاحات. (لانکاستر، 1379، ص179)

 عمدتا زبانها دو نوع هستند:

1-       زبانهای مهار شده (Controlled language)

این زبانها، حاوی اصطلاحاتی هستند که برای نمایه سازی مدارک انتخاب و پذیرفته شده اند، فهرست ها سر عنوانهای موضوعی و اصطلاحنامه ها دو شیوه متفاوت زبان نمایه سازی مهار شده است. اصطلاحنامه پس از شرح زبانهای آزاد توصیف می شود.

2-      زبانهای آزاد (Free language)

در این نوع زبانها محدودیتی ازنظر نوع واژه وجود ندارد، هر واژه یا اصطلاح می تواند بدون قید و شرط از زبان طبیعی گرفته شود، یعنی عینا از زبان مدرک نقل گردد و یا متناسب با موضوع مدرک تعیین شود. ازنمایه سازی به زبان طبیعی هم می توان در ساخت واژگان موضوع الکترونیکی و هم در تولید نمایه نامه های چاپی استفاده کرد. یکی از کاربردهای نمایه سازی به زبان طبیعی تولید نمایه هایی است که مبتنی بر واژه های عنوان می باشد. مانند: نمایه کوئیک، نمایه کووک و نمایه جایگشتی.(داورپناه،1381،ص33)

 ب- نرم افزارهای نمایه سازی وب

بسته به اینکه در وب مورد نظر چه اطلاعاتی را می خواهیم نمایه سازی کنیم (اطلاعات می توانند یک سند، یک Full text ، تصاویر و ... باشند) نرم افزارهای گوناگونی برای نمایه سازی وب موجود می باشد:

 
نرم افزارهای نمایه سازی وب

Advanced Java Tree Menu
PHP Lightning Portal (PLP)
PHP Portal Builder (PPB)
ActMon Password Recovery XP
Internet Macros Web Test Recorder

 نرم افزارهای نمایه سازی لینکها

PHP Lightning Portal (PLP)
PHP Portal Builder (PPB)
Registry First Aid
IEManager
Advanced Java Tree Menu

 نقش موتورهای جستجو در نمایه سازی وب

حجم انبوه اطلاعات وب و عدم نمایه سازی جامع، متخصصان این حوزه را برآن داشته تا با مدد از فن آوری افکار، موتورهای جستجو را بکار گیرند و راهکاری مناسب جهت نمایه سازی را فراهم آورند. از سوی دیگر برخی از وب سایت ها برای اطمینان از بازیابی بیشترین رتبه بندیهای مرتبط، از اصطلاحات کلیدی استفاده  می کنند، این در حالی است که تعدادی دیگر از نمایه سازی کور بهره می گیرند.

مشکل اصلی این نوع نمایه سازی اضافه بازیابی است که حجم زیاد اطلاعات نامرتبط را شامل می شود، لذا جهت افزایش جامعیت و مانعیت بازیابی، موتورهای جستجو به عنوان یک راهکار مطرح شدند. (دیگان، 1382، ص 161)

موتورهای جستجو، ابر موتورها و ابر داده ها در واقع ابزارهای کمکی برای نمایه سازی و ارائه اطلاعات مرتبط با موضوع مورد جستجو در اینترنت هستند.

نمایه ها اساس کار موتورهای جستجو در رتبه بندی نتایج جستجو و ترکیب منطقی واژه ها (جستجوی بولی) برای بازیابی اطلاعات در اینترنت را تشکیل می دهد. اما بزرگترین موتورهای جستجو هم قادر به نمایه سازی وب نیستند. برخی از این موتورها نظام نمایه سازی تمام متن دارند و هر واژه موجود درمتن به جز واژه های فاقد بار اطلاعاتی مانند حروف اضافه، ربط و تعریف را نمایه می کند. برخی بخشی از منبع را نمایه می کنند.برخی دیگر، سرعنوانها، عناوین فرعی و فراپیوندها را همراه 20 خط ابتدای متن و 100 کلمه ای که از بسامد بالایی برخوردار است، نمایه می کنند. (داورپناه،1381،ص 84)

از دیدگاه مدیریت نظام اطلاعاتی چهار ویژگی اصلی برای اطلاعات بازیابی شده قابل لحاظ است: دقت[7]، پیوستگی زمانی[8]، بهنگام بودن[9] و مرتبط بودن[10].(منتظر،1380، ص 31) لذا نمایه سازی باید بر مبنای چهار ویژگی مذکور انجام پذیرد. بنابراین جهت رسیدن به نمایه سازی جامع و مانع وب به نمایه سازی دقیق موتورهای جستجو نیاز داریم.

 
انواع نمایه سازی موتورهای جستجو

نمایه سازی وب می تواند از طریق روشها و ابزارهای اتوماتیک یا به وسیله نیروی انسانی انجام بگیرد. در نمایه سازی از نوع دوم اشخاص حقیقی منابع را شناسایی و جمع اوری می نمایند، سپس آنها را بازبینی، سازماندهی و طبقه بندی می کنند.

موتورهای جستجویی مانند گوگل توسط یک  web Crawler شاخص گذاری شده اند.  Web Crawler ابزاری است که در لابه لای شبکه جهانی وب می خزد و سایت های جدید را مورد جستجو قرار می دهد؛ چنانچه وب سایت جدیدی یافت شد آدرس آن به پایگاه داده اضافه می گردد.

فهرست موتور جستجوی گوگل شامل بیش از یک بیلیون URL می باشد. قلب این موتور نرم افزار Page Rank TM است، سیستمی برای رتبه بندی صفحات وب که توسط لری پیچ و سر جی برین، موسسان آن، در دانشگاه استن فورد ساخته شده است. رتبه صفحه با استفاده از ساختار لینک معتبر بر روی خاصیت دموکراتیک منحصر به فرد تکیه می کند. گوگل لینکها را از صفحه الف تا ب چک می کند و از آراهای مختلف دریافت شده برای این رتبه بندی استفاده می کند. صفحات با کیفیت بالا Page Rank TM بالاتری دریافت می کنند که گوگل بعد از هر جستجو به خاطر می سپارد. گوگل از ترکیب Page Rank TM و روشهای پیشرفته جور کردن متن برای یافتن صفحات با اهمیت و در عین حال مربوط به متن جستجو شده استفاده می کند. همچنین از تعداد تکرار کلمات متن جستجو شده پا فراتر نهاده و برای تشخیص اینکه این صفحه با کلمات مورد جستجو هماهنگی دارد، تمام وجوه محتوای صفحه و صفحات متصل شده به آن را بررسی می کند.

 موتورهای جستجوی altavista, Hotbotو Excite  برای تفسیر پایگاه داده خود از ترکیب ماشین و انسان استفاده می کنند، در صورتی که موتور جستجوی  Yahooتوسط انسان ترجمه می شود. کاربران آدرسURL وب سایت های خود را برای موتور جستجو ارسال می کنند، سپس سایت مربوطه مورد بازبینی قرار می گیرد و یک انسان سایت را طبقه بندی می کند و در مورد عبارات جستجوی مربوطه تصمیم گیری می کند. در موتور جستجوی Yahoo ابزارهای نمایه سازی چشمشها و بازوهای انسان جهت تصمیم گیری اینکه کدام کلید واژه ها و اقلام مناسب هستند و سپس نمایه سازی صحیح مطرح است.

این در حالی است که بسیاری از سایت‌های وب،  از روش «نمایه انتهای کتاب در وب» برنامه‌ای برای جستجوی سایت خود طراحی کرده‌اند. این برنامه‌ها همچون جستجو در فایل‌های تمام متن می‌تواند در نتایج جستجوی خود دارای مدارک نامرتبط و در اصطلاح همراه با ریزش کاذب باشد.اگر در چنین سایت‌هایی نمایه‌ای شبیه آنچه در انتهای کتاب‌ها دیده می‌شود به وجود آید، مراجعه‌کننده می‌تواند به سرعت و با استفاده از لیست به مدخل مورد نظر خود وارد شود و با سرعت بالا و از دست دادن زمان کمتری به مدارک مورد نیاز خود وحتی به مدارک مرتبط با آن نیز دسترسی یابد.

سایت وب شرکت نرم‌افزاری Adobe با داشتن نمایه‌ای از نوع کواک(1) و نیز موتور کاوش ویژه سایت، سعی در بالا بردن دسترس‌پذیری موثر اطلاعات سایت خود نموده است.سایت دانشگاهی جورج تاون نیز نمایه موضوعی A-Z را در قسمت ابزارهای دسترسی به اطلاعات در صفحه خانگی خود قرار داده است. (کمیجانی)

 فن آوری موتورهای جستجو

وقتی جستجویی در یک موتور جستجوگر انجام و نتایج جستجو ارایه می شود، کاربران در واقع نتیجه کار بخش های متفاوت موتور جستجوگر را می بینند. موتور جستجو اطلاعات را از پایگاه اطلاعاتی خود مورد جستجو و بازیابی قرار می دهد و اینطور نیست که همان لحظه اطلاعات را از اینترنت به دست آورد، بلکه از قبل اطلاعات را از اینترنت گرفته و در پایگاه خود ذخیره   می کند.

در ابتدا مرحله گردآوری اطلاعات صفحات وب را داریم از طریق روباتهای اطلاعاتی می توانیم به جستجوی مستمر و مداوم اطلاعات در صفحات وب بپردازیم. از جمله روباتهای اینترنت می توانیم به Spider ها و Crawler ها اشاره کنیم.

اسپایدر، اینترنت را برای اسناد جدید وب مورد جستجو قرار می دهد و آدرسهای آنها و اطلاعات مربوط به محتوا را در بانک اطلاعاتی قرار می دهد که با موتور جستجو می توان آن را در دسترسی قرار داد.( (هیئت مولفان و ویراستاران انتشارات میکروسافت،1382،ص 544) کار اسپایدر بازبینی کدهای HTML صفحات وب می باشد در حالی که کاربران وب  نتیجه حاصل از کنار هم قرار گرفتن این کدها را می بینند.


   
 
 شکل 1- نتیجه حاصل از قرار گرفتن کدها و آنچه که کاربر می بیند

 

شکل 2 - آنچه اسپایدرها می بینند


در حالی که کراولر، نرم افزاری است که به عنوان یک فرمانده برای اسپایدر عمل می کند و مشخص می کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم می گیرد که کدام یک از لینک های صفحه ای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. کراولر، ممکن است قبلا" برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال کردن لینک های یک صفحه به این بستگی دارد که موتور جستجوگر چه حجمی از اطلاعات یک سایت را می تواند در پایگاه
 داده هایش ذخیره کند و همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد.  تنظیم میزان دسترسی موتورهای جستجوگر به محتوای یک سایت توسط پروتکل Robots انجام می شود. (http://www.iranseo.com)

سپس اطلاعات جمع آوری شده توسط اسپایدر در اختیار ایندکسر قرار می گیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می گیرند و به بخش های متفاوتی تقسیم می شوند. تجزیه و تحلیل بدین معنی است که مشخص می شود اطلاعات از کدام صفحه ارسال شده است، چه حجمی دارد، کلمات موجود در آن کدام است، چندبار تکرار شده است، در کجای صفحه قرار دارند و ... . در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد می کند و تمام این پارامترها را به یک مقیاس عددی تبدیل می کند تا سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای کاهش حجم داده ها از بعضی کلمات که بسیار رایج هستند صرفنظر می کند. کلماتی نظیر a ، an ، the ، www ، is و ... . از این گونه کلمات هستند.( http://www.iranseo.com)
آنگاه داده های تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال می گردد. در این بخش داده ها گروه بندی، کدگذاری، در صورت لزوم فشرده و ذخیره می شوند.یک موتور جستجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یک موتور جستجوگر برای آن امتیاز محسوب می گردد. یکی از تفاوتهای اصلی موتورهای جستجوگر در حجم پایگاه داده آنها و همچنین روش ذخیره سازی داده ها در پایگاه داده است.(http://www.iranseo.com)

سرانجام در هنگام جستجو نرم افزار کاوش به کاربر این امکان را می دهد که از میان همه صفحات موجود در نمایه، آنچه را مورد جستجو است، یافته و بر اساس میزان تناسب و ارتباط آن با درخواست، واژه یا عبارت مورد نظر را رتبه بندی می کند. در واقع نرم افزار جستجو رابط بین کاربر و اطلاعات نمایه شده است. بخشی از این نرم افزار کار رتبه بندی اطلاعات بازیافتی را انجام می دهد.

معمولا برایی رتبه بندی دو ویژگی مهم در نظر گرفته می شود:

 محل درج کلید واژه: اینکه کلید واژه در کجای صفحات وب قرار دارد. کلید واژه ای که در عنوان قرار دارد به کلید واژه های دیگر ارجحیت دارد.

● تعداد تکرار (بسامد) اغلب موتورهای جستجو میزان تکرر کلیدواژه ها را نسبت به سایر واژه های موجود در صفحات وب می سنجند و واژگانی را که از بسامد بیشتری برخوردار باشند به عنوان واژگان دارای ارتباط و تناسب بیشتر معرفی می کنند. همچنین در برخی موتورهای جستجو مانند Excite وجود پیوندهای بیشتر در یک صفحه وب به سایر صفحات یا ایستگاههای اطلاعاتی ارجحیت دارد. (منتظر،1380)

 

شکل 3- ساختارعمومی موتورهای جستجو (منتظر،1380، ص 36)


نمایه سازی وب و ابر موتورها

از ابرداده ها برای جستجو، سازماندهی و بازیابی منابع الکترونیکی موجود در شبکه جهانی اینترنت استفاده می شود.اساس کار آنها همان نمایه سازی موتورهای جستجو می باشد. نکته مهم این است که ابر موتورها دارای پایگاه اطلاعاتی مختص به خود نیستند؛ به گردآوری اطلاعات صفحات وب نمی پردازند؛ صفحات وب را بررسی، طبقه بندی و یا نمایه سازی نمی کنند بلکه کلید واژه ها یا عبارتهای مورد جستجو را به طور همزمان به چند موتور جستجو، که در ساختار ابر موتور تعریف شده است، ارسال می کنند و نتایج را به صورت منظم و طبقه بندی شده ارائه و رکوردهای تکراری حاصل را حذف می نمایند. (منتظر،1380)

تعدادی ابر موتور جستجو در زیر آورده شده است:

Metacrawler, Metafind, Cyber 411, Inference Find, Super Seek, Dogpile

باهوشترین ابر جستجوی دنیای وب  ixquick می باشد که بسیار منطقی ومتفکر است و جوابهای بازگشتی را بر حسب مورد جستجو آنالیز و رده بندی می کند. از ویژگیهای این ابرجستجوگر به موارد زیر می توان اشاره کرد:(نائینی علی اکبری، 1380، ص299-300)

● جامعیت و صحت نتایج: هنگام جستجو این ابر موتور جسجو به طور همزمان چندین موتور جستجو را مورد کاوش قرار   می دهد

● قدرت پالایش نتایج

● سرعت بالا

● رده بندی جوابها: ixquick برای هر موتور جستجو که آن را به عنوان یکی از ده نتیجه بهتر برای جستجو انتخاب می شود یک علامت ستاره و اگر 5 موتور جستجو بر روی یک نتیجه به توافق برسند علامت 5 ستاره را نشان می دهد.

● دارای جستجو به 18 زبان زنده دنیا می باشد.

● کار با آن آسان است

● از سیزده موتور جستجو و دایرکتوری برتر دنیای وب بهره می گیرد. هر چه نمایه سازی این موتورها دقیق تر و جامعتر باشد، بازیابی و پالایش اطلاعات توسط ابرموتور نیز از جامعیت و دقت بیشتری برخوردار است. این موتورهای جستجو و دایرکتوری ها عبارتند از:

1. موتور جستجو Altavista http://www.altavista.com
2. موتور جستجو
AllTheWeb http://www.alltheweb.com
3. موتور جستجو
Ask Jeeves http://www.ask.com
4. موتور جستجو
Teoma http://www.teoma.com
5. موتور جستجو
Entire Web http://www.entireweb.com
6. پروژه
 Open Directory http://dmoz.org
7. موتور جستجو
Go http://www.gojester.com
8. موتور جستجو
LookSmart   http://www.looksmart.com/r?country=uk
9. موتور جستجو
Netscape http://www.Netscape.com  
10. موتور جستجو
Gigablast  http://www.Gigablast.com
11.موتور جستجو
Overture   http://www.content.overture.com/d
12. موتور جستجو
WiseNut  http://www.wisenut.com
13. دایرکتوری
 Yahoo http://www.yahoo.com



شکل 4- باهوشترین ابر جستجوی دنیای وب
ixquick

 
نمایه سازی وب و ابر داده ها

ابر داده در معنای وسیعش "داده ای درباره داده" می باشد: اطلاعاتی که معنای اطلاعات دیگر را انتقال می دهد.اما این اصطلاح معمولا برای داده های ساخته شده در باره منابعی به کار برده می شود که می تواند نوعی از عملیات را پشتیبانی کند. این داده، ساخته شده که در حد یک ماشین قابل فهم شود. اصطلاح ابر داده می تواند برای هر داده توصیفی به کار برده شود و در جامعه کتابداری و اطلاع رسانی می تواند برای توصیف فهرستهای کتابشناختی یا پایگاههای اطلاعاتی استفاده شود. از رکورد فهرست یک کتابخانه می توانیم به عنوان یک ابر داده نام ببریم. به طور مشابه رکودهایی که در نتیجه خدمات نمایه سازی و چکیده نویسی یک پایگاه داده حاصل میشود ابر داده هستند. به طور فزاینده اصطلاح ابرداده در جهان اطلاعات، برای تعیین کردن رکودهایی که به منابع دیجیتالی قابل استفاده در شبکه ارجاع می دهند استفاده می شود.
 ویژگی ها و کاربردهای ابرداده به شرح زیر می باشد:( محمدی، 1383)

1-تسهیل جستجو و بازیابی منابع اطلاعاتی شبکه اینترنت

2-نظم بخشیدن به منابع اطلاعاتی موجود در اینترنت

3-توصیف پایگاههای اطلاعاتی، تصاویر دیجیتالی،فایلهای صوتی و سایر منابع غیر متنی شبکه

4-تحلیل محتوا و نمایه‌سازی و سازماندهی انواع منابع اطلاعاتی شبکه

5-تطبیق، اشتراک و یکپارچه‌سازی منابع اطلاعاتی ناهمگن شبکه اینترنت

6-فراهم‌آوردن زمینه استفاده مجدد از انواع اطلاعات توزیع شده در محیط شبکه از طریق مستند سازی محتوای اطلاعات.

7-ایجاد امکان دسترسی کاربران شبکه به اطلاعات دقیق و مرتبط

8-مدیریت بر‌حجم گسترده‌ای از اطلاعات شبکه اینترنت

 ابرداده نه تنها به جستجو و بازیابی موثر منابع اطلاعاتی ناهمگن می پردازد, بلکه اطلاعاتی را که دسترسی بدان ها محدود است برای شیوه و نوع استفاده  کاربران مدیریت می کند.( مختاری نبی، 1382)

ابر داده ها، نمایه سازی طیف وسیعی از انواع اطلاعات را بدون نیاز به عرض باند شبکه فراهم می سازد. ازجمله این  ابرداده ها می توان به قالب ابرداده ای دوبلین کور اشاره کرد.اصطلاح 'Dublin Core' مختصر شده عبارت انگلیسی  " Dublin Metadata Core Element Set" می باشد. دوبلین کور یک فهرست هسته از اصول ابر داده است که در مارس 1997به توافق کارگاه ابر داده OCLC/NCSA رسیده است. این کارگاه توسط OCLC و مرکز ملی کاربرد ابرکامپیوترها (NCSA) [11]به منظور توسعه و پیشرفت یک رکورد ابر داده که اطلاعات الکترونیکی شبکه شده را توصیف می کند، تشکیل شده است.

این کارگاه پیرو جلسات و بحث های انجمن کتابداران آمریکا می باشد.استوارت ویبل[12] هدف این کارگاه را چنین بیان  می کند: (( Heery, 1996, pp. 345-373.

 
1. پروراندن یک درک مشترک از نیازها، تواناییها، کمبودها و اندیشیدن راه حلهای آنها

2. به توافق رسیدن بر روی مجموعه ای هسته از عناصر ابر داده که منابه الکترونیکی تحت شبکه را توصیف می کند.

 
طبق ویرایش منتشر شده در تاریخ 15-05-2005عناصردوبلین کور به شرح زیر می باشند:

1.عنوان[13] 2.پدیدآور[14] 3.موضوع[15] 4. توصیف[16] 5.ناشر[17] 6.همکار[18] 7.تاریخ[19]  8.نوع منبع[20] 9.قالب[21] 10.شناساگر[22] 11.منبع[23]: همه یا بخشی از منبع حاضر ممکن است ازیک منبع ردیف اول گرفته شده باشد. 12.زبان [24] 13.ارتباط[25]: منظور یک ارجاع به یک منبع رابط می باشد 14.دامنه[26] 15.حقوق منبع[27]

 


 شکل 5- عناصر پانزدگانه  دوبلین کور

 
این پانزده عنصر انتخابی، تکرار پذیر و قابل تعمیم هستند. همچنین آنها می توانند از طرق متعددی مشروط شوند مثلا محتوای فیلد موضوع می تواند داده هایی از یک طرح مانند سرعنوانهای موضوعی کتابخانه کنگره را در بر بگیرد. (http://dublincore.org)

پیاده سازی کنونی دوبلین کور در وب اغلب بر اساس ابر داده ای تحت HTML و meta tagها می باشد.

هر حال با حرکت وب به سمت XML شاید در آینده، دوبلین کور در وب ازRDF  استفاده کند.RDF مخفف عبارت Resource Description Framework می باشد.RDF یک زبان عمومی برای بیان یک ابرداده وب، یا اطلاعاتی درباره اطلاعات بر روی سایت می باشد. از طرفی واضح است که ابر داده ها علاوه بر یافتن منبع، کاربردهای بیشتری نیز دارند. برای مثال ابر داده میتواند برای کمک در اداره کردن بازیابی منابع بر اساس نیازهای تکنولوژیکی کاربران استفاده شود.هم اکنون ابر داده در فیلتر سازی اطلاعات به کاربران از طریق طبقه بندی حجم خدمات نقش دارد.ابرداده همچنین می تواند دسترسی به منابع را مدیریت کند. نقش بالقوه ابر داده در تعیین اعتبار و فرآهم کردن راه حل مشکلات مختلف حفاظت اطلاعات می باشد. اما تاکید بر این نکته که چطور ابر داده به خوبی در یک محیط دیجیتالی عمل می کند به خلق و قوت کیفیت ابر داده بستگی دارد.

شکل زیر مدل ابرداده دوبلین کور را نشان می دهد. هر عنصر زیر جزهایی دارد.

 


 شکل 6- Magazine, June 1997

 
به طور کلی روند بازیابی کاملا به نحوه نمایه سازی اطلاعات وابسته است. هرچه نمایه دقیقتر و منظمتر باشد بازیابی اطلاعات سریعتر و آسانتر است. از طرفی نمایه سازی باید کاربر مدار باشد.بنابراین در سیستمهای نمایه سازی توجه به نیاز کاربران سیستم، زبان، دانش آنها و محیط کاربرد اطلاعات (که تاثیر عمده ای به زبان کاربران دارد) بسیار مهم است. (رزم گیر،1384، ص 221)

 
بازنمود نمایه در وب

نهایتا بحث نمایش نمایه اطلاعات الکترونیکی مطرح می شود. نمایه وب به سه صورت نمایش داده می شود:

1. نمایش تیتر حرف

2. جعبه فورم[28]

3. نمایش سنتی

 
نمایش تیتر حرف

دراین روش یک یا دو ردیف حروف الفبای فارسی یا انگلیسی در صفحه وب نمایش داده می شود.هر حرف یک ابر پیوند  می باشد که با کلیک بر روی آن به فهرستی که مدخلهای آن با همان حرف آغاز شده اند دسترسی پیدا میکنیم هریک از این مدخلها خود یک ابر پیوند هستند و ما را به منبع اصلی اطلاعات متصل می کند.مثال زیر نمونه ای از این نوع نمایش می باشد:


 


گاهی این نوع از نمایش توسعه بیشتری پیدا کرده است. بدین صورت که از طریق کلیک بر روی یک ابر پیوند حرف به
 ابرپیوندهای دوحرفی از همان حرف می رسیم که با کلیک بر روی ابر پیوند مورد نظر به لیستی از مدخلها می رسیم و می توانیم موضوع موردنظر را انتخاب و به متن اصلی برسیم مثالی از این مورد در سایت دایره المعارف بریتانیکا مشهود می باشد

 
 


نمایش جعبه فورم

جعبه فورم کل مدخلهای نمایه را در بر می گیرد. واحد اصلی نمایه مدخل می باشد.از آنجا که تمام مدلهای نمایه در یک ستون از صفحه نمایش کامپیوتر قرار نمی گیرد، برای رسیدن به مدخل مورد نظر باید مدخلها را طومار نمایی کرد. با لغزاندن و کشاندن ماوس بر مربع های کوچک حاشیه فورم، مدخلهای نمایه را بالا و پایین برد تا بالاخره، مدخل مورد نظر به گستره دید فورم برسد.در این صورت با کلیک کردن بر روی مدخل مورد نظر، صفحه متناظر متن بر کنار مستطیل فورم نمایان می گردد. جعبه فرم ممکن است از یک فهرست تک سطحی ، یا یک فهرست سلسله مراتبی چند سطحی تشکیل شده باشد. منظور از فهرست چند سطحی که معمولا در کنار متن نمایش داده می شود مدخلهایی است که با کلیک بر روی آنها زیر مدخل سطح بعدی نمایان می شود و مانند یک ساختار درختی عمل می کند.

 
نمایش سنتی

این نوع نمایش مانند نمایه کتاب است. در این نوع نمایش می توان از ابر پیوندها استفاده کرد. در شیوه سنتی در محیط الکترونیکی، نمایه، ‌‍«دقیقا» همانند کتاب، به صورت دو ستونه و صفحه به صفحه و با سر صفحه و غیره نمایش داده می شود: خواه با ابر پیوند خواه بدون آن. در این شیوه، نمایه، عینا مانند نمایه کتاب، در انتهای صفحه های کتاب قرار داده می شود. اما در مواردی، نمایه الکترونیکی شبیه نمایه سنتی است، ولی جلوی هر مدخل آن، عدد 1 آمده است. یعنی ظاهرا کاب یا متن الکترونیکی شامل یک صفحه است! در این حالت، کاربر باید ماوس را بر روی عدد «1» قرار دهد و کلیک کند، تا متن متناظر آورده شود. (محمدی فر،1381،ص 357)

 
نتیجه
همه موتورهای جستجو از یک نوع روش نمایه سازی استفاده نمی کنند و عدم وجود یک نمایه جهانی با یک زبان و نرم افزار واحد باعث شده است نتایج حاصل از جستجو در یک موتور جستجو با نتایج حاصل از جستجو در موتور جستجوی دیگر متفاوت می باشد لذا هر کاربر اطلاعاتی باید برایی رسیدن به نتیجه مطلوب جستجو بیش از یک موتور جستجو را به کار گیرد. شاید در آینده ای نه چندان دور شاهد ظهور چنین نمایه ای باشیم.

 

پی نوشتها

1.        index

2.       Web indexing

3.      Search engine

4.      Metasearch engine

5.      Matadata

6.      Dublin Core

7.      Accuracy

8.      Onliness

9.       Updating

10.      Relevancy

11.      National Centre for Supercomputer Applications

12.     Stuart Weibel

13.    Title

14.    Creator

15.    Subject

16.    Description

17.    Publisher

18.    Contributor

19.     Date

20.     Type

21.     Format

22.    Identifier

23.   Source

24.   Language

25.   Relation

26.   Coverage

27.   Rights

28.   Form Box

 

منابع
1. داورپناه، محمدرضا،1381، "جستجوی اطلاعات علمی و پژوهشی در منابع چاپی و الکترونیکی؛ شامل حوزه های علوم و فنی مهندسی...". تهران: دبیزش.

2. دیگان، ماریلین؛ تانر، سیمون، 1382."آینده دیجیتالی کتابخانه ها: راهبردهایی برای عصر اطلاعات"، ترجمه عباس گیلوری، تهران: دبیزش، چاپار.

3. رزم گیر، مریم؛ سیف، زهرا،1384،"توسعه خدمات کاربرمدار: چشم انداز کیفی خدمات کتابخانه ها"، مجموعه مقالات هشتمین همایش کتابداران سازمان مدیریت و برنامه ریزی کشور، اصفهان 1-3 دی 1383.

4. سلطانی، پوری؛ راستین، فروردین، 1382، "دانشنامه کتابداری و اطلاع رسانی، فارسی – انگلیسی و انگلیسی – فارسی" . تهران: فرهنگ معاصر.

5. کمیجانی، احمد، " ساختار نمایه‌سازی در موتورهای کاوش وب"،فصلنامه اطلاع رسانی. دوره 17، شماره 3و4
6. لانکاستر، اف ویلفرید، 1379، " نظامهای بازیابی اطلاعات، آزمون و ارزیابی"، ترجمه جعفر مهرداد، شیراز: نوید، 1379.

7. محمدی، سید حسین، 1383، " ابر‌داده: مفاهیم و کار‌برد‌ها".

 

 
8. مختاری نبی، ابراهیم،1382،" سازماندهی منابع اینترنتی: چالش ها و ضرورت ها".

 http://www.irandoc.ac.ir/Data/E_J/vol1/organaizing.htm
9. منتظر،غلامعلی،1381، "موتورهای کاوش اینترنت: درآمدی بر بازیابی بهینه اطلاعات". تهران:کویر.
10. موران، جیمز؛ هال، ویکتوریا؛ ویلر، دانا، (1383)."آموزش
ICDL  به زبان ساده مهارت هفتم: اطلاعات و ارتباطات"، ترجمه علی اکبر متواضع، تهران: موسسه فرهنگی هنری دیباگران.
11. نائینی علی اکبری، اردوان،1380، "مرجع کامل قویترین تکنیکهای جستجو در اینترنت". تهران: ارس یارانه.
12. هیئت مولفان و ویراستاران انتشارات میکروسافت،1382،"فرهنگ تشریحی کامپیوتر میکروسافت 2004"، ترجمه رضا حسنوی، داریوش فرسائی. تهران: دانشیار، پیک علوم.
 

13. DC-4, March 3 - 5, 1997, National Library of Australia, Canberra: The 4th Dublin Core Metadata Workshop Report
14. INDEXING THE WEB: http://www.asindexing.org/site/webndx.shtml
15. Introduction to indexing materials on the Web: http://www.cu.edu/~irm/stds/www_manual/mgmnt/indexing.html
18. Metadata and electronic information: Michael Day: 02-Mar-1999.http://www.ukoln.ac.uk/metadata/presentations/circe/birmingham.html
16. RDF: http://www.webopedia.com/TERM/R/RDF.html
17."Review of Metadata Formats": Rachel Heery, Program, Vol. 30, No. 4, October 1996, pp.345-373. http://www.ukoln.ac.uk/metadata/review.html
18."Review of Teoma": Greg R. Notess, Last updated Apr. 15, 2004: http://www.searchengineshowdown.com/features/teoma/review.html
19."Search Engine Statistics: Relative Size Showdown": Greg R. Notess, http://www.searchengineshowdown.com/stats/size.shtml
20. What is a web index: http://www.ext.nodak.edu/miv/15min/webindex/sld001.htm
21. What Makes Ixquick Special: http://us.ixquick.com/eng/aboutixquick/
22. http://www.iranseo.com/articles/article.php?ID=388
23. http://dublincore.org/documents/dcq-rdf-xml/
24. http://www.google.com/intl/fa/why_use.html

برگرفته از : 

www.irandoc.ac.ir/.../vol6/makvandi_Hosseini.htm

 

 

 


نوشته شده در تاريخ سه‌شنبه ۱۱ تیر ۱۳۸٧ توسط نمایه

نمایه سازی خودکار

  گذشته ، حال ، آینده

  نویسنده : عباس گیلوری عضو هیات علمی مرکز اطلاع رسانی و خدمات  علمی وزارت جهاد کشاورزی

  مقدمه

  پیش از این ، اطلاعات موجود بر روی رسانه هایی چون کتاب ، پایگاه های اطلاعاتی و انواع ریزنمون ها مانند ریزفیلم 1 و ریزبرگه 2 ذخیره شده اند.

  امروزه ، با گسترش و توسعه اطلاعات الکترونیکی از یک سو و رشد سریع  و آنی اطلاعات اینترنتی از سوی دیگر، بر حجم اطلاعات قابل دسترس افزوده شده است . برای دسترس پذیری اطلاعات (چه به صورت ماشین خوان و چه به صورت دستی )، متخصصین اطلاع رسانی ناگزیرند از رایانه و برنامه های رایانه ای بهره گیرند. حجم اطلاعات موجود، تنوع ساختار اطلاعات در قالب هایی چون اصل مقاله ، خلاصه مقالات و چکیده  و ضرورت یکسان سازی قالب آنها از یک طرف و ارائه درخواست های   اطلاعاتی بهره گیران به صورت اصطلاح یا واژه های منفرد ازطرف دیگر باعث شده است تا ایجاد نمایه ها و انطباق درخواست ها با شیوه هایی  دستی بسیار دشوار گردد.

  در طول سی سال گذشته و با تلاش های متخصصین اطلاع رسانی به نظرمی رسد که نمایه سازی خودکار می تواند به عنوان ابزاری برای ساماندهی و در دسترس قراردادن حجم عظیم اطلاعات موجود یا به عبارت بهتر مقابله  با انفجار اطلاعات مطرح گردد. با افزایش هر روزه انتشارات الکترونیکی ،  نمایه سازی و کاوش های تمام متن در بسیاری از برنامه های بازیابی اطلاعات توسعه فراوانی داشته است .)1( به نظر می رسد که در بسیاری از برنامه های بازیابی اطلاعات می توان فرآیندهای الگوریتمی رایانه ای را برای پردازش های اطلاعاتی و به عنوان جایگزینی برای پردازش های فکری بشری بکار گرفت . در فرآیندهایی چون تولید نمایه های خودکار، طبقه بندی مدارک و اصطلاحات ، تدوین راهبردهای کاوش و یا ایجاد ارتباط بین اصطلاحات وابسته می توان از رایانه بهره گرفت . اگرچه تاکنون  از رایانه در اغلب فعالیت های بازیابی همچون استخراج پیام از متن مدارک ، تدوین اصطلاحنامه ها، فهم نیازهای اطلاعاتی بهره گیران از طریق درخواست های آنها و ... استفاده شده است اما تاکنون رایانه نتوانسته است  در هیچ موضوعی به اندازه حوزه نمایه سازی خودکار به صورت مستقل  انجام وظیفه نماید.)2(

 نمایه  در واژه نامه "اصطلاحات نمایه سازی "، نمایه این گونه تعریف شده است :

  "فهرستی از اصطلاحات که به روشی قابل فهم و واضح مرتب شده و  محلی که اطلاعات در آن وجود دارند را نشان می دهد.)3("

  در کتاب "نمایه سازی و چکیده نویسی "، آقای راولی تعریف دیگری از نمایه را ارائه کرده است . او می گوید" :نمایه ، مجموعه سازمان یافته ای از نقاط دسترسی 3 است که بهره گیری از اطلاعات معلوم به مجموعه ای از  اطلاعات ناشناخته و نامعلوم را رهنمون می سازد.)4(" از دو تعریف یادشده فوق ، اولین تعریف ناظر بر مجموعه های کاغذی است و زمانی ارائه شده که هنوز نمایه های ماشینی و پایگاه های اطلاعاتی چندان کاربرد  عام نداشته اند. دومین تعریف با عنایت به ورود رایانه در حوزه کتابداری

  ارائه شده و به نظر می رسد از جامعیت بیشتری برخوردار باشد. بدیهی است که نمایه نقش بسیار مهمی در بازیابی اطلاعات داشته و نمایه ساز که به تحلیل محتوای اطلاعاتی مدارک می پردازد، در ارتباط و انتقال اطلاعات نقش بارزی دارد. ایجاد نمایه از طریق انجام نمایه سازی میسر  است . نمایه سازی را "ثبت و ضبط محتوای اطلاعاتی مدارک با استفاده از  کلیه روش ها و دستورالعمل ها به منظور سازمان دادن اطلاعات و به قصد سهولت بازیابی )5(" تعریف کرده اند.

       امروزه نمایه ها از اصلی ترین اجزا پایگاه های اطلاعاتی به شمار می آیند و به طور گسترده در ایجاد پایگاه اطلاعاتی - چه بر روی رایانه ها و چه به صورت درون خطی و بر روی اینترنت - مورداستفاده قرار می گیرند.

  نمایه ها عموما سه کارکرد عمده را بر عهده دارند:

  O محتوای اطلاعاتی مدارک را فشرده می سازند.

  O به عنوان واسطه ای برای تطبیق و یکسان سازی زبان مدرک و زبان کاوش   بکار می روند

O. به عنوان ابزاری کارا بر شیوه تدوین راهبردهای کاوش در جستجوهای اطلاعاتی نظارت دارند.)6(

  زبان های نمایه سازی

  زبان نمایه سازی ، زبانی است که برای شرح موضوع یا سایر جنبه های   اطلاعات یا مدارک در یک نمایه بکار می رود. درواقع ، زبان های نمایه سازی بر شیوه گزینش یا استخراج کلمات نمایه (چه از درون متن و  چه از طریق واژگان کنترل شده )دلالت دارند. زبان ها نمایه سازی بسیار متفاوتند اما آنها را می توان به سه دسته اصلی تقسیم کرد.

  زبان های نمایه سازی کنترل شده 4

       در این روش ، واژه ها یا اصطلاحاتی به مدرک مورد نمایه منتسب می شوند.

  واژه های انتسابی از مجموعه ای از واژگان کنترل شده گرفته می شوند.

       درواقع ، در نمایه سازی کنترل شده ، واژگان نمایه عینا از درون متن گرفته نمی شود بلکه واژه نویسنده متن با فهرست اصطلاحات مقابله شده و اصطلاح پذیرفته شده انتخاب می شود.

  زبان های نمایه سازی آزاد5

  برخلاف زبان های نمایه سازی کنترل شده ، این زبان ها به راحتی محدود نمی شوند. در این زبان ها، هر واژه ای که برای موضوع مدرک مناسب باشد به عنوان اصطلاح نمایه ای انتخاب می شود. زبان نمایه سازی آزاد در محیطهای نمایه سازی رایانه ای بسیار متداول است .

  نمایه سازی به زبان طبیعی 6

  در این روش ، برای نمایه سازی از زبان خود مدرک کمک گرفته می شود.

  به طور کلی می توان گفت که نمایه سازی به زبان طبیعی نوعی از زبان نمایه سازی آزاد است . نمایه سازی به زبان طبیعی بیشتر با تعیین رایانه ای اصطلاحات سروکار دارد و به زبان عنوان ، چکیده و سایر اجزا متن به عنوان یک رکورد اطلاعاتی وابسته است .)4( در این روش انتخاب اصطلاحات ساده است و به گزینش و تحلیل مدارک نیازی نیست . نکته قابل توجه آنکه هنوز درباره اینکه آیا نمایه سازی به زبان طبیعی می تواند  ما را به بازیابی کارا رهنمون سازد یا خیر بحث وجود دارد.

  نمایه سازی رایانه ای یا ماشینی

       "فرآیند استخراج مجموعه ای از مدخل های نمایه ای که بیانگر موضوع متن هستند توسط رایانه از متن ماشین خوان را نمایه سازی خودکار می نامند.)7(" در پایگاه های اطلاعاتی از رایانه به شیوه های مختلفی برای  نمایه سازی  استفاده می شود. نمایه سازی پایگاه های اطلاعاتی و نمایه های

  ماشینی به روش های زیر ممکن است انجام گیرد:

       .1 استفاده از رایانه برای انجام امور دفتری نمایه سازی مثل ورود اطلاعات در پایگاه های اطلاعاتی ;

       .2 بهره گیری از رایانه برای کنترل کیفیت نمایه های تولیدی . مثل بررسی این مسئله که آیا همه اصطلاحات نمایه در اصطلاحنامه وجود دارند یا خیر؟;

  .3بهره گیری فکری از رایانه مثل استفاده از رایانه . برای مثال استفاده از رایانه برای وزن دهی و انتخاب  اصطلاحات نمایه ;

  .4 نمایه سازی کامل خودکار به کمک رایانه .)8(

  امروزه تولیدکنندگان پایگاه های اطلاعاتی در سطوح مختلف برای نمایه سازی از رایانه بهره می گیرند. درحال حاضر، نمایه سازی خودکار رایانه ای برای نمایه سازی بخشی از پایگاه اطلاعاتی مثل موضوعات  خاص ، نقاط دسترسی یا نوع مدرک مورداستفاده قرار می گیرد. مرکز اطلاع رسانی فن آوری دفاعی 7 برای مدیریت متون در پایگاه اطلاعاتی خود، مرکز FI2 Karlsruhe در نمایه سازی نام های شیمیایی ، مرکز بین المللی اطلاعات علمی و فنی روسیه 8 برای منابع زبانی و Inspec برای

  نمایه سازی فایل های پشتیبان استانداردهای جدید خود از نمایه سازی خودکار بهره گرفته اند.

       نکته ای که در نمایه سازی ماشینی باید یادآور شد آن است که ماشین ها و ابزارهای نمایه سازی فعلی صرفا به منظور نمایه سازی مدارک ابداع شده اند بلکه این ماشین ها اصول برای انجام امور تجاری مانند کارهای آماری و حسابداری های کلان طراحی شده و برای نمایه سازی با اصول ومعیارهای آن منطبق شده اند.)9( به عبارت دیگر،محدودیت های این ماشین ها برای اهداف نمایه سازی عمدتا بر این حقیقت استوارند که آنها به جای طراحی برای نمایه سازی ، با مباحث نمایه سازی منطبق شده اند.

       بنابراین ، امکانات آتی نمایه سازی ماشینی شاید بیشتر از آنی باشد که مخترعین این ابزارها از آن در ذهن دارند.

  نمایه سازی به کمک رایانه 9

  نکته ای که در اینجا باید به آن اشاره داشت اینکه در امر نمایه سازی خودکار باید بین دو اصطلاح نمایه سازی به کمک رایانه و نمایه سازی خودکار10 تفاوت قائل شد. گرچه در بسیاری از متون تخصصی بین این دو اصطلاح تفاوت قائل نشده اند اما باید گفت که در نمایه سازی خودکار پس از تدوین برنامه رایانه ای و تدارک الگوریتم های خاص ، نیروی انسانی در فرآیند تولید نمایه هیچ دخالتی ندارد. اما در نمایه سازی به کمک رایانه ،  نمایه ساز از رایانه برای انجام امور نمایه سازی استفاده می کند.)10( اولین  نمایه های رایانه ای مانند کوئیک و کووک از نوع نمایه سازی به کمک رایانه  بوده اند.

  نمایه سازی خودکار

  با توسعه روزافزون اینترنت و حجم گسترده اطلاعات درون خطی و  ناپیوسته و همچنین افزایش متن های الکترونیکی و نشر سنتی ، دسترسی به مطالب و منابع علمی موردنیاز را دشوار ساخته است . به نظر می رسد که بدون نمایه سازی خودکار به ویژه بر روی اینترنت ، دسترسی به منابع بسیار دشوار باشد" .نمایه سازی خودکار فرآیندی است که در آن مجموعه ای از اصطلاحات که بیانگر موضوع مدرک هستند توسط رایانه استخراج شده یا همه کلمات متن مدرک در یک فایل مغلوب قرار می گیرند.)11(" ابداع  نمایه سازی خودکار که عمومابر بهره گیری و استفاده از اصطلاحات واحد تاکید دارد، با اختراع رایانه های بزرگ هم زمان بود. اولین نمایه سازی خودکار که توسط اچ پی لون 11 انجام گرفت بر بسامد واژه ها در  نمایه سازی متون تاکید داشت . این تحقیقات ادامه یافت و اکنون به روش های نمایه سازی خودکار پیچیده ای انجامیده است که بر استفاده از اصطلاحات واحد12 و استفاده از بخش بیشتری از اطلاعات مانند عبارت  تاکید دارند.)12(

       نکته ای که در نمایه سازی خودکار باید موردتوجه قرار گیرد آن است که هر نوع نمایه سازی خودکار باید دو فرآیند پایه را موردنظر قرار دهد: اول ، باید  به شیوه ای واحدهای متنی را مجزا نماید. این عمل مستلزم فهم زبان  طبیعی است . دوم ، بر اساس واحدهای متنی یک زبان ، کلمات نمایه را گزینش و استخراج کند. باید متذکر شد که به دلیل تنگناهای زبانی در زبان های نمایه سازی موجود، بهره گیری از ابزارهای نمایه سازی مثل اصطلاحنامه یا نظام رده بندی چندان مفید نیست .)11(

  عوامل موثر در نمایه سازی خودکار

       در ایجاد نمایه خودکار باید به عواملی توجه نماییم ، توجه به این عوامل ما را در تهیه نمایه ای کارا کمک خواهد نمود. این عوامل عبارتنداز:

     .1 محدوده رکورد. اولین تصمیم گیری مهم برای تهیه هر نوع نمایه ، گزینش حد و حدود رکوردی است که واحد قابل جستجو را تعریف می کند. طول رکورد می تواند یک کتاب ، فصلی از کتاب ، بخشی از فصل یا حتی یک پارگراف باشد. این تصمیم گیری در بازیابی کارآمد نقشی حیاتی دارد.

  اگر مدرک در حال نمایه سازی مثل مقاله ای از یک مجله است ، بدیهی است که طول رکورد، تمام متن مقاله خواهد بود. اما این شیوه تعریف فیلد معمول در هنگام استفاده در پایگاه های اطلاعاتی ، کاوش های اطلاع رسانی را با دشواری مواجه می سازد. بدیهی است که نباید کل مقاله یا کتاب را به عنوان یک رکورد درنظر گرفت . هر چه طول مدارک در حال نمایه سازی  بزرگتر باشد از دقت نمایه سازی کاسته شده و امر نمایه سازی خودکار نیز  دشوارتر می گردد. بنابراین ، نباید کل مدرک را به عنوان یک رکورد اطلاعاتی  تعریف کرد. همچنین نباید طول رکورد نیز بیش از اندازه کوتاه باشد چرا که  حجم کم متن رکورد، بازیابی ناقص را در پی دارد و ضعف بازیابی به نوبه  خود از ضعف نمایه ناشی می شود.)12( ازاین رو، تعیین یک جمله از متن  به عنوان رکورد چندان مناسب نیست . بنابراین ، در نظر گرفتن یک پارگراف  به عنوان رکورد مناسب به نظر می رسد.

  .2 انتخاب اصطلاحات نمایه

  تعیین حد و حدود یک واژه از دیگر مسائلی است که در نمایه سازی  خودکار باید به آن توجه شود. در نظام های نمایه سازی دستی ، گزینش کلمات برای نمایه به سهولت انجام می شود. اما در نمایه سازی خودکار از آنجا که ماشین از هوشمندی لازم برای انتخاب کلمات برخوردار نیست  بنابراین باید حدود کلمه را تعریف کرد. معمول حدود کلمات نمایه را با استفاده از علائم نقطه گذاری تعریف می کنند. به طور معمول ، فاصله بین  کلمات و علائم دستوری و نقطه گذاری به عنوان مرز کلمات در نظر گرفته می شود. روش های تعیین حد و حدود کلمات در نمایه سازی خودکار، بر  اساس نوع برنامه و میزان پیشرفتگی آنها متفاوت است .

  انواع نمایه سازی خودکار

       کلولند13 اشاره می کند که اصول دو نوع نمایه سازی خودکار وجود دارد.

  نمایه سازی انتسابی 14 و نمایه سازی اشتقاقی .15 بنا به نظر کلولند نمایه سازی خودکار "عبارت است از استخراج ماشینی کلمات از درخواست ها و مدارک و انتساب ماشینی اصطلاحات کنترل شده و

       استخراج ماشینی از متون تمام متن یا بخشی از یک متن .)11( در این تعریف ، نمایه سازی اشتقاقی یک فرآیند ساده انطباق بدون هیچ گونه تحلیل موضوعی است که در آن تمام کلمات مدرک یا درخواست استخراج شده و تنها کلمات ممنوعه از این فهرست خارج می شوند. نمایه سازی انتسابی فرآیند پیچیده ای است که با استفاده از تحلیل های آماری ، کلمات و اصطلاحات به مدرک منتسب می شوند.

       لنکستر نیز نمایه سازی خودکار را به دو دسته تقسیم می کند. گرچه لنکستر و کلولند، هر دو، تقسیم بندی یکسانی را ارائه کرده اند ولی نامگذاری آنها از این دو گروه نمایه سازی خودکار متفاوت است . لنکستر نمایه سازی خودکار را به دو دسته استخراجی 16 و انتسابی 17 تقسیم می کند. در ادامه این  مقاله ، این دو روش مورد بررسی قرار می گیرند.

  نمایه سازی استخراجی

  ساده ترین روش نمایه سازی مقالات در پایگاه های اطلاعاتی ، روش  نمایه سازی استخراجی است که در آن واژه ها برای قرار گرفتن در نمایه ، توسط رایانه از متن مقالات استخراج می شوند. در این روش عموما بسامد تکرار واژه در هر رکورد یا مقاله تعیین شده و کلماتی که بسامد تکرار آنها زیاد است در متن نمایه قرار می گیرند. کلمات پربسامد همراه با تعداد رخداد آنها در کل پایگاه در متن نمایه قرار می گیرند.)8( این روش همچنین می تواند ریشه کلمات را شمارش کرده و کلمات منفرد یا عبارات را

       تشخیص دهد. می توان رایانه را به شیوه ای برنامه ریزی کرد که علاوه بر بسامد تکرار کلمات ، با توجه به معیارهایی چون موقعیت کلمات در متن وپ معیارهای متنی دیگر، کلمات مورد نیاز برای نمایه سازی را به صورت خودکار استخراج نماید.

  انواع نمایه سازی استخراجی

  .1 نمایه سازی با استفاده از فهرست کلمات ممنوعه . در این روش از نمایه شدن کلمات پربسامد مشخصی جلوگیری شده و به صورت خودکار از فهرست کلمات نمایه حذف می شوند. کلماتی مانند: حروف اضافه ، افعال کمکی ، افعال ، حروف تعریف و ... در یک فهرست قرار می گیرند. در هنگام نمایه سازی ، رایانه تمام کلمات متن را استخراج می کند، سپس کلمات ممنوعه را حذف و بقیه کلمات را در یک نظام الفبایی مرتب  می کند.

  تاکنون برای تعیین فهرستی از کلمات ممنوعه تحقیقات فراوانی صورت گرفته است . فرانسیس و کوسرا18 ده کلمه پربسامد را تعیین کردند. آنها همچنین فهرست دیگری که از 425 کلمه ممنوعه تشکیل شده بود را ارائه  دادند. وان رایجزبرگن 19 نیز فهرستی ارائه داد که از 150 کلمه ممنوعه  تشکیل شده بود. فهرست رایجزبرگن در سال 1975 منتشر شد.

       همانطور که اشاره شد در این روش معمول همه کلمات متن به جز کلماتی که در فهرست کلمات ممنوعه قرار دارند در نمایه قرار می گیرند. استفاده از کلمات ممنوعه علاوه بر جلوگیری از ریزش کاذب در بازیابی ، 20 تا25   درصد از حجم نمایه نیز می کاهد.)12(

  روش دیگری نیز برای تهیه فهرست کلمات ممنوعه وجود دارد. در این روش فهرستی از کلمات متن به همراه بسامد تکرار آنها تهیه می شود. پس از تعیین بسامد تمام کلمات متن ، کلمات پربسامد بررسی و مطالعه  می شوند. آن گروه از کلمات پربسامدی که اهمیت اطلاعاتی نداشته باشند به عنوان کلمات ممنوعه در نظر گرفته می شوند. فهرست کلمات ممنوعه ای که موسسه ملی استاندارد و فن آوری 20 برای مجله وال استریت جرنال تهیه کرده نیز با این روش استخراج شده است . فهرست معمول کلمات ممنوعه که معمول در نمایه سازی خودکار به کار می روند در جدول زیر آمده است .

  .2 نمایه سازی بسامدی .21 در این روش از نمایه سازی خودکار، بسامد تکرار کلمات در هر رکورد یا مقاله مورد بررسی قرار می گیرند و براساس بسامد تکرار در فهرست کلمات نمایه قرار می گیرند. پیشینه نمایه سازی

  استخراجی مبتنی بر بسامد تکرار کلمات به سال 1950 بازمی گردد. در این روش نمایه سازی ، دفعات حضور واژه در یک متن شمارش می شود.

  سپس ، واژگان استخراجی با فهرست کلمات ممنوعه مقابله و کلمات  ممنوعه از فهرست نمایه خارج می شوند. سپس واژه ها بر اساس بسامد تکرار خود در نمایه مرتب می شوند.

  علی رغم استفاده از فهرست کلمات ممنوعه ، یکی از بزرگترین معایب  نمایه سازی بسامدی آن است که هنوز شاهد حضور کلماتی در نمایه  هستیم که علی رغم بسامد تکرار بی فایده اند. بعلاوه ، گاهی حضور کلماتی در متون خاص علی رغم کمی تکرار از اهمیت فراوانی برخوردار است .)2(

  مثلا، بسامد تکرار کلماتی چون "کتابخانه " و "اطلاع رسانی " یا "اطلاعات " در متون کتابداری چندان تعیین کننده نیست . اما حضور کلماتی چون  "عایق کاری " و "پنبه نسوز" یا "کف پوش " در متون کتابداری علی رغم کمی تکرار می تواند بااهمیت باشد.

  برای رفع مشکل نمایه های بسامدی ، برای بسامد تکرار واژه حدنصاب قرار می دهند. بنابراین ، کلماتی که بیش از حد نصاب تعیین شده در پایگاه تکرار شده باشند به عنوان کلمات نمایه برگزیده می شوند. حدنصاب بسامد، باتوجه به نوع متنی که کلمه در آن واقع شده می تواند متغییر باشد.

  .3 نمایه سازی استخراجی به روش پسوندیابی 22 یا ریشه یابی .23 در بعضی از سیستم های نمایه سازی استخراجی ، از پسوند یا ریشه کلمات استفاده می شود. در این روش ریشه یا پسوند کلمات جایگزین مجموعه ای از کلمات هم ریشه یا پسوند مشترک می شود. الگوریتم های ریشه یابی  مختلفی چون الگوریتم های استاندارد یا الگوریتم های موضوعی خاص  همچون الگوریتم های پزشکی نیز وجود دارند. الگوریتم S یا استاندارد، ساختار مفرد و جمع کلمات را در هم ادغام می کند. الگوریتم Lovins، فهرستی از 260 پسوند موجود، فهرست عظیمی از موارد استثنا و شماری  از قواعد را در بردارد.همچنین الگوریتم پسوندیابی Porter، 60 پسوند را شامل می شود.)12(

  .4 وزن دهی اطلاعات . استفاده از نظام وزن دهی در نمایه سازی خودکار، عموما برای مجموعه های تمام متن با حجم زیاد بسیار کاربرد داشته و مفید است . گرچه بسیاری از سیستم های نمایه سازی رایانه ای از نظام  وزن دهی اصطلاحات و کلمات متن بهره نمی گیرند، اما به نظر می رسد که این روش برای همه سیستم هایی که بر اساس احتمالات و رتبه دهی به انتخاب کلمات نمایه اقدام می کنند مناسب باشد. در این روش ، کلمات بر اساس محل قرار گرفتن خود در متن (مثل عنوان ، چکیده و )...امتیازدهی  می شوند. حضور کلمات در بخش های مختلف رکورد، امتیازات متفاوتی دارد. معمول حضور کلمه در عنوان مدرک بیشترین امتیاز را به خود اختصاص می دهد. این روش به دلیل کارایی پایین آن در بین بهره گیران مقبولیت چندانی ندارد. کارایی پایین این نظام نمایه سازی به دلایل زیر

  است :

  .1 روشی برای گزینش کلمات مهم از درخواست وجود ندارد. مثل اگر فردی موضوع "وزن دهی اصطلاحات در بازیابی اطلاعات " را به سیستم  وارد کند ممکن است تنها یک مدرک که هر چهار واژه موجود در درخواست را دربر داشته باشد بازیابی نماید. یعنی این سیستم نمی تواندکلمات مهم درخواست (در اینجا "وزن دهی " و "اصطلاحات )" را تشخیص  داده و صرفا مدارک مرتبط با آنها را بازیابی کند.

  .2 روشی برای گزینش کلمات مهم مدرک وجود ندارد. با توجه به مثال  قبل ، در درخواست اطلاعاتی برای موضوع "وزن دهی اصطلاحات در بازیابی اطلاعات " باید مدرکی بازیابی شود که مثل تنها بسامد تکرار واژه  "وزن دهی " در آن بیشتر نباشد بلکه بالاترین بسامد تکرار این اصطلاح در مقابله با بسامد سایر اصطلاحات درخواست در همان مدرک سنجیده  شود.)12(

       .3 بلند بودن یا کوتاه بودن متن را مورد توجه قرار نمی دهد. در یک مدرک  طولانی بدیهی است که ممکن است بسامد تکرار یک واژه بیشتر از مدرکی  باشد که متن آن کوتاه است . بنابراین ممکن است مدرکی بسیار مرتبط  صرفا به دلیل کوتاهی متن آن از رتبه کمتری برخودار باشد. البته با  بهره گیری از روش های آماری بسیار پیچیده در تنظیم نتایج جستجو می توان تا حدود بسیار زیادی بر این مشکلات فائق آمد.

       همانگونه که پیش از این نیز اشاره شد در نظام های رایانه ای بیشتر از روش های نمایه سازی استخراجی استفاده می شود.یکی از عمده ترین  مشکلات این نمایه ها به ویژه هنگام استفاده در پایگاه های اطلاعاتی ، عدم  بازیابی کلمات درخواست به دلیل نبودن آن کلمه در نمایه پایگاه اطلاعاتی

  است . دلیل این امر آن است که بهره گیران معمول یا همه کلمات مترادف با اصطلاح موجود در درخواست را وارد نکرده اند و یا از مترادفات آن بی خبرند. بنابراین ، بسیاری از مدارک مرتبط از دست می روند. برای رفع این معضل معمول طراحان پایگاه های اطلاعاتی توانایی های نمایه ای را با  توانایی نرم افزاری درهم می آمیزند. یکی از روش ها، امکان نمایش نمایه و  انتخاب واژه درخواستی توسط خود بهره گیر است . روش دیگر، استفاده از  نظام بازخورد مرتبط24 است . این روش به بهره گیران اجازه می دهد تا  مدارک مرتبط کمی را برگزینند. سپس از سیستم می خواهند تا با توجه به این مدارک ، مدارک مرتبط بیشتری را بازیابی نمایند.)4( امروزه این روش در اینترنت و پایگاه های اطلاعاتی تمام متن کاربرد فراوانی دارد.

  نمایه سازی انتسابی

  در این روش معمول رایانه برای نمایه سازی از اصطلاحنامه یا کنترل واژگان بهره می گیرد. اصطلاحنامه فهرستی از همه سرعنوان هایی است که ممکن است در نمایه سازی مورد استفاده قرار گیرند. درواقع در نمایه سازی انتسابی برای هر واژه منتسب "پرونده ای 25" از کلمات و عبارات مرتبطی که به نظر می رسد در مدارکی که نیروی انسانی آنها را نمایه کرده اند مکرر بکار رفته تهیه می شود. چون هر اصطلاح در کنترل واژگان دارای پرونده کلمات است ، بنابراین می توان از برنامه ای رایانه ای برای انطباق عبارت های مهم در مدرک با این مجموعه پرونده ها استفاده کرد و درصورت انطباق واژه موجود در مدرک با واژه های موجود در پرونده های کلمات ، اصطلاحی که پرونده به آن مربوط است را منتسب کرد.)2( پرونده کلمات ، کلماتی هستند که با یافتن آنها در متن مدرک ، می توان اصطلاح  مربوط به آن پرونده را به آن مدرک اختصاص داد. مثل برای اصطلاح Child birth، پرونده کلمات باید لغات birth, labor, labour, delivery, baby, born و Childbirth را دربر داشته باشد. علاوه بر پرونده کلمات ، رایانه از "معیار گزینش 26" نیز بهره می گیرد. معیار گزینش دستورالعملی  است که براساس آن مشخص می شود که با چه ترکیب و چه تعداد تکرار از هر واژه ، باید اصطلاح مربوط را به مدرک منتسب کرد. مثل معیار گزینش  باید تعیین کند که اگر کلمه child birth ده بار در مقاله ای تکرار شده باشد آیا باید آن را در نمایه قرار داد یا خیر؟ معیار گزینش مشخص می کند که چه  هنگام و با حضور چه کلماتی و با چند بار تکرار می توان اصطلاح اصلی را در نمایه وارد کرد.

  این روش گرچه در نمایه سازی خودکار پیشرفتی به شمار می آید اما درعمل چندان ساده نیست . اول اینکه معیارهای ماشینی باید بسیار پیشرفته باشند. در این روش انتساب اصطلاح به مدرک بر اساس بسامد تکرار اصطلاح یا اصطلاحات پرونده است . اگر اصطلاح اصلی با بسامد معینی تکرار شده باشد، گزینش آن برای قرار گرفتن در نمایه مناسب خواهد بود اما اگر بسامد کلمات پرونده بیشتر از اصطلاح اصلی باشد، آیا باز هم با همین اطمینان می توان آن را به مدرک اختصاص داد.)8(

       یکی از برنامه های بسیار پیشرفته برای نمایه سازی خودکار از نوع انتسابی  را موسسه Biosis  برای پایگاه اطلاعاتی خود تهیه کرده است . در اینجا بر عناوین مقالات موجود در مجله ها تاکید شده است . کلمات موجود در عنوان مقالات با مجموعه ای نحوی از حدود پانزده هزار اصطلاح زیست شناسی مقابله و مقایسه می شوند. سپس ، این مجموعه اصطلاح به نوبه خود با 600 سرشناسه مفهومی (که موضوعاتی نسبتا اعم هستند) تطبیق داده می شوند. درصورت انطباق ، رایانه یکی از سرشناسه های  مفهومی را به مدرک نسبت می دهد.

  اگرچه در طول سی سال گذشته در زمینه نمایه سازی خودکار انتسابی شاهد پیشرفت های زیادی بوده ایم اما همه این تجربیات با تعدادی  اصطلاحات محدود و در محیطی آزمایشگاهی به نتیجه رسیده و هنوز بدون مداخله انسان کاربرد آنها در محیطهای بزرگتر یا پایگاه های اطلاعاتی عظیم به واقعیت نپیوسته است . درواقع ، هنوز از نمایه سازی انتسابی جز در تولید نمایه های چاپی استفاده نشده است .

  درکل باید گفت که بسیاری از سیستم های نمایه سازی خودکار واقعا خودکار نیستند تا بتوانند جایگزین نیروی انسانی شوند بلکه در جهت کمک به نمایه سازان طراحی می شوند. شاید بهتر آن باشد که این برنامه ها را نیز "نمایه سازی به کمک رایانه " بنامیم .

  تاثیر نمایه سازی و روش های خودکار بر متخصصین اطلاع رسانی

باپیشرفته تر شدن هر چه بیشتر برنامه های رایانه ای و ظهور و ارائه هر چه بیشتر اطلاعات در ساختار الکترونیکی ، در نهایت نمایه سازی به شیوه سنتی کمتر صورت خواهد گرفت . این نقصان و کاهش با افزایش تعداد پایگاه های اطلاعاتی و ازدیاد پروژه های نمایه سازی و چکیده نویسی در کوتاه مدت جبران خواهد شد.)8( باید از نیروی انسانی برای انجام کارهای مهمی که از طریق مطالعه درباره شیوه استفاده و استناد متون حاصل می آید بهره گرفت .

       نمایه سازان بیش از گذشته باید گزینشی عمل کرده و درباره کیفیت متون در دست نمایه سازی و محتوای موضوعی آنها تصمیم گیری نمایند. می توان از مهارت نمایه سازی برای توسعه نظام های رایانه ای و بررسی و آزمایش خروجی رایانه ها بهره گرفت . برای تهیه اصطلاحنامه و آموزش نویسندگان  برای نگارش متن های رایانه ای به شیوه ای که قابل بازیابی باشند می توان  نمایه سازان را به کمک طلبید. نمایه سازانی که در حوزه های موضوعی رایانه ، ویرایش ، کتابداری و اطلاع رسانی و اطلاعات کتابشناختی تجربه  دارند بهتر می توانند از مزایای این فرصت های تازه استفاده نمایند.

  نمایه سازان به متخصصین و سوادآموزان رایانه ای بدل خواهند شد و از این طریق خواهیم توانست شکاف های موجود در راه سامان دهی دانش را شناسایی کرده و به روشی کارآمد این شکاف ها را از میان برداریم . برای دستیابی به این مهم باید دانش رایانه را فراگیریم . نه تنها باید ابزارهای مختلف نمایه سازی رایانه ای را فراگیریم بلکه باید روش سازماندهی و استفاده الکترونیکی آن را نیز بیاموزیم تا بتوانیم به خوبی نیازهای اطلاعاتی  را درک کرده و دین خود را ادا نماییم .

  نمایه سازی خودکار و اینترنت

       در طول 30 سال گذشته ، نمایه سازی خودکار به عنوان پاسخی برای انفجار اطلاعات مطرح شده است . همانگونه که شاهد رشد هر روزه نشر الکترونیکی هستیم نمایه سازی و کاوش منابع تمام متن به استانداردی  بالفعل در بسیاری از برنامه های بازیابی اطلاعات به ویژه در اینترنت بدل شده است . دو مبحث بسیار بحث برانگیزی که امروزه در حوزه فن آوری اطلاع رسانی جریان دارد - یعنی جستجوی وب و مدیریت دانش - در حوزه نمایه سازی تغییراتی را بوجود آورده است . امروزه با نمایه سازی تمام متن ، بازیابی اطلاعات به بازیابی اصل مدارک ارتقا یافته است .

  اینترنت از جنبه های مختلفی همچون حجم منابع ، ناهمگونی و دایره لغات ، واحدهای کاوشی ، راهبرد کاوش و تنوع رسانه های اطلاعاتی مثل ابرمتن ، و چندرسانه ای ، چهره بازیابی اطلاعات را تغییر داده است . حجم نمایه در بین موتورهای کاوش هنوز هم یکی از نکات مهم و اصلی رقابت در بین تولیدکنندگان موتورهای کاوش است گرچه امروزه تهیه بهترین نمایه و نه بزرگترین آن مورد توجه قرار می گیرد. این موضوع باعث شده است تا موتورهای کاوش در نمایه های خود به گزینش سایت ها و صفحات وب روی آورند و بسامد روزآمدسازی سایت ها را افزایش دهند.

  ظهور اینترنت تحولات فراوانی در حوزه نمایه سازی پدید آورده است . اینترنت بر سرعت ، دقت ، هوشمندی ، قدرت مشارکت ، کاربرپسندی ، جهانی بودن ، جامعیت و چندزبانی نمایه ها در موتورهای کاوش افزوده  است .)1( ظهور اینترنت از جنبه های مختلف بر نمایه سازی خودکار تاثیرگذار بوده است . این موارد عبارتند از:

  حجم مجموعه

  حجم اطلاعات موجود بر روی اینترنت و به طور خاص بر روی وب هر روزه در حال افزایش است . بدیهی است هر چه حجم مجموعه افزایش یابد نمایه سازی آن دشوارتر شده و نیازمند استفاده از روش های کامل تر و پیشرفته تری است .

  تفاوت های دایره لغات

       معمول در یک مجموعه یا پایگاه اطلاعاتی یکدستی - چه ازنظر ساختار و چه از نظر موضوعی - وجود دارد. وب برخلاف پایگاه های اطلاعاتی ، تقریبا از هیچ تجانس موضوعی و زبانی برخوردار نیست . علاوه براین ، بهره گیران از اینترنت نیز بسیار متنوع اند. در یک تحقیق مشخص شد که حتمال استفاده یکسان دو فرد از اصطلاحی واحد در اینترنت در حدود20 درصد است .)1( اگرچه برخی از تولیدکنندگان صفحات وب در تلاش بوده اند تا با ایجاد ابرداده ها که نوعی اطلاعات طبقه بندی شده درباره محل اطلاعات است ، ایجاد نمایه های خودکار را تسهیل نمایند اما هنوز استاندارد واحدی برای ایجاد این ابرداده ها وجود ندارد و نه تنها همه تولیدکنندگان وب خود را ملزم به تبعیت از آن نمی دانند بلکه بسیاری از آنها از وجود چنین استانداردهایی بی خبرند.

  راهبردهای کاوش

  با ظهور و همه گیری اینترنت و توسعه کاوش های درون خطی از مداخله و واسطه گری کاوشگران متخصص در بازیابی اطلاعات کاسته شده است . از سوی دیگر، تنوع بهره گیران که هر یک درخواست های اطلاعاتی متنوعی دارند و فقدان آگاهی لازم درباره شیوه کاوش در اینترنت و حتی بی اطلاعی از "راهبرد کاوش "، تولید نمایه ای خودکار و منسجم را دشوار ساخته است .

  رسانه های جدید ارتباطی در اینترنت

       امکانات تازه ای که در وب پدید آمده به گونه ای است که با سیستم های سنتی و اولیه در پایگاه های اطلاعاتی کامل متفاوت است . ایجاد امکانات فرامتنی با توانایی های منحصر به فردی چون "اتصالات "27، خدمات  چندرسانه ای و چندزبانه بودن اطلاعات اینترنت ، بیش از گذشته ایجاد نمایه های خودکار را با دشواری مواجه ساخته است .

منابع

 

  1. Jacqmin, Laurence. "Automatic indexing: how websearching and

   knowledge management hypes have changed the technological

  state of the art". in Online information 98, Proceedings of 22th international

                   information meeting, Learned Information, Oxford, PP>103-107.

  2. Lancaster, F. W. "Indexing and abstracting in theory and

                             practice". Illinois : University of Illinois, 1991.

   3. Buchanan, Brian. "A glossary if indexing terms". London: Clive Bingley,  1976.

   4. Rowley, E.  "Abstracting and indexing". 2nd ed. London: Clive Bingley, 1988.

 .5 میرزاده ، احمد" .نمایه و نمایه سازی ." نشریه فنی مرکز مدارک علمی ،

  دوره دوم ، شماره دوم و سوم ، .1352 ص .29-16 .

 6. Baxendale, Phyllis B. "Autoindexing by automatic processes". Special  libraries, 1965. 56)10(, PP. 715-719.

  .7 یوسفی ، احمد" .اصول و روش های نمایه سازی رایانه ای ." فصلنامه   کتاب ، دوره نهم ، شماره ( 2تابستان .)1377

8. Browne, Glenda. "Automatic indexing and abstracting".

   www.autoindexing\automatic indexing and abstracting.htm

  9. Collison, Robert L. "Indexing and abstracting". London: Ernest Benn,   1972.

 10. Auto-indexing of Keywords. www.autoindexing\autoindexing of  keywords.htm

11. Zheng, Fen. "An ideal model of automatic indexing for patent   systems".

 12. "Challenges in indexing electronic text and images / edited by   Raya Fidel ... ]et al[. Medford: Learned Information, 1994.

یادداشت ها

 1- Microfilm

2- Microfish

 3- Access Point

5- Free Indexing Languages

 6- Natural Language Indexing

 7- Defence Technology Information Center )DTIC(

  8- Russian International Center for Scientific and Technical Information

 9- Computer Aided Indexing

 10- Automatic Indexing

 11- H. P. Luhn

 12- Single Terms

 13- Cleve Land

  14- Assigned Indexing

15- Derived Indexing

  16- Extraction

  17- Assignment

   18- Francis , Kucera

   19- Van Rigsbergen

   20- National Institute of Standards  and Technology )NTST(

  21- Frequency indexing

  22- Suffixing

   23- Stemming

  24- Relevance Feedback

  25- Prodile

   26 - Criteria for inclusion

   27- Links

منبع:  پیام کتابخانه - شماره - 394 زمستان 1379

 

 


نوشته شده در تاريخ یکشنبه ٩ تیر ۱۳۸٧ توسط نمایه


نوشته شده در تاريخ یکشنبه ٩ تیر ۱۳۸٧ توسط نمایه

نیم نگاهی به موسسه فرهنگی و اطلاع رسانی نمایه

موسسه فرهنگی و اطلاع رسانی نمایه زیر نظر نهاد کتابخانه های عمومی کشور در کنار تجربه طولانی، تولید محصولات نرم افزاری نمایه ، نسخه جامع کتابد اری و نسخه آسان ، کاملترین آرشیو د یجیتالی نشریات د ر د ه سال گذشته را منطبق با خواست کاربران ارائه نمود ه است و همواره سعی د ر فراهم نمود ن بهترین و کاملترین محصولات و امکانات برای کاربران خود د اشته است . همچنین بیش از 850 کتابخانه عمومی جهت تامین نیازهای اطلاعاتی پژوهشگران و د انشجویان،با استفاد ه از لوح فشرد ه نمایه به ارائه خد مات و اشاعه اطلاعات تخصصی می پرد ازند که تا پایان سال87 به 1400 کتابخانه خواهد رسید. د ر حال حاضر بسیاری از سازمانها ، موسسات ، نهاد ها و د انشگاههای کشور جزء کاربران نرم افزار نمایه می باشند که د ر اد امه به تعد اد ی از این استفاد ه کنند گان اشاره شد ه است :

*د انشگاه تهران،د انشگاه علامه طباطبایی،د انشگاه فرد وسی مشهد و د ه ها د انشگاه و مرکز علمی د یگر ،   مرکز پژوهشهای مجلس شورای اسلامی ، مرکز پژوهشهای علمی و صنعتی و ...،   شهرد اری تهران و د هها شهر کشور ، صد ا و سیمای جمهوری اسلامی ایران ، ستاد مشترک سپاه پاسد اران انقلاب اسلامی و ...


نوشته شده در تاريخ چهارشنبه ٥ تیر ۱۳۸٧ توسط نمایه

پیرامون نمایه سازی

نمایه ( Index)

معادل نمایه در انگلیسی واژه Index است که از واژه لاتینی Indic به معنی دلالت کردن گرفته شده است. برابر فارسی Index فهرست بوده که گویا معرب واژه پهلوی، پهرست است. کلمه نمایه نیز از مصدر نمودن و نماییدن گرفته شده است.

از نمایه تعاریف مختلف و متنوعی ارائه شده است، اما در مجموع «نمایه به عمل تحلیل مدارک از طریق تشخیص، انتخاب و تخصیص شاخص‌ها، اصطلاحات خاص، یا توصیفگر به محتوای موضوعی مدرک گفته می شود که می تواند موجب بازیابی مدارک معین یا بحشهای خاصی از اطلاعات و یا داده‌ها گردد.

نمایه به دو دسته کلی نمایه توصیفی و نمایه موضوعی تقسیم بندی می شود:

ــ نمایه توصیفی     Descriptive   Index

پرداختن به ویژگیهای اطلاعاتی غیرموضوعی یک مدرک که معمولاً به اطلاعات کتابشناختی موسوم می‌باشند را «نمایه توصیفی» می‌گویند.

ــ نمایه موضوعی       Subject   Index

ساخت و پرداخت زمینه های اطلاعاتی مدرک که بار موضوعی دارد و دسترسی بر مدارک را از طریق موضوع امکان‌پذیر می سازد «نمایه موضوعی» خوانده می شود.

 

2 نمایه سازی (  Indexing)

به ثبت و ضبط محتوای اطلاعاتی مدارک با استفاده از روشهای گوناگون، به منظور سازمان دادن اطلاعات به قصد سهولت بازیابی «نمایه‌سازی» گفته می‌شود.

 

نمایه ساز   (Indexer)

نمایه ساز کسی است که کارش تهیه نمایه از مدارک باشد. نمایه ساز ماهر شخصی است که مدارک را بی‌غرضانه، دقیق، اصولی و با در نظر گرفتن جامعه استفاده‌کنندگان و نیازهای احتمالی آنها تجزیه و تحلیل نماید.

 

هدف نمایه سازی    (Indexing    goal)

هدف نمایه سازی افزایش میزان دسترسی مراجعه کنندگان به مطالب موضوعی مورد جستجو است. از این لحاظ ممکن است که نمایه سازیها بسته به جامعه استفاده کننده و نیازهای اطلاعاتی آنها با هم متفاوت باشند. گزینش مواد از میان مطالب منتشره، توجه به موضوعی خاص، سوگیری زبانی، توجه به مدرک و منبعی خاص و... از جمله عواملی هستند که می توانند بر هدف نمایه سازی تأثیر بگذارند.

 

کارکرد نمایه سازی (Indexing   Function)

نمایه سازی عموماً سه کارکرد عمده دارد:

·          محتوای اطلاعاتی مدارک را فشرده می‌سازد.

·          به عنوان واسطه برای تطبیق و یکسان سازی زبان مدرک و زبان کاوش به کار می‌رود.

·          به عنوان ابزاری کارا، بر شیوه تدوین راهبردی کاوش در جستجوی اطلاعات نظارت دارد.

 

تاریخچه نمایه سازی  ( Indexing  history)

کهن‌ترین پیشینه ای که از نمایه سازماندار در تاریخ سراغ داریم، سیاهه لوحه‌های گلین کتابخانه های اکد و سومر است. اما نخستین گامهای جدی در راه تدوین نمایه در خصوص کتب مقدس دینی و در سده چهاردهم میلادی در چند صومعه صورت گرفت. در مشرق زمین، خاصه در قلمرو تمدن اسلامی کارهایی در زمینه های رده بندی، فهرست نویسی و نمایه سازی انجام گردید. فهرست ابن ندیم یکی از این نمونه هاست.

پس از اختراع چاپ، نخستین نمایه نظام‌مند تدوین شد. «کنراد گسنر» فهرست رده بندی شده‌ای از 2000 کتاب را در سال 1548 منتشر کرد. در قرن هجدهم با پیدایش مفهوم رده بندی، فهرست نویسی و رده بندی یکی از هدفهای مهم علوم گردید. در قرن نوزدهم هم دانش کتابداری و اطلاع رسانی به شکوفایی رسید. رده بندی دهدهی دیویی که در سال 1876 منتشر شد ضمن اینکه مهمترین پیشرفت بشر در تاریخ رده بندی است بیشترین تأثیر را هم بر نمایه سازی گذاشت. در این قرن همچنین انتشار نشریات به سرعت رشد یافت، بنابراین دسترسی به مقالات نیازمند نمایه بود، این امر ابتدا با نمایه نشریات ادواری در آمریکا آغاز گشت.

پس از جنگ جهانی دوم، دامنه تحقیقات و پژوهشها روز به روز گسترده‌تر گردید و این افزایش تدریجی کنترل اطلاعاتی با استفاده از ابزارها و شیوه های قبلی را غیرممکن می‌ساخت. در سال 1961 اولین کتاب تئوریک در زمینه نظام‌های بازیابی اطلاعاتی ارائه شد. انگیزه اصلی تألیف این کتاب از جانب «ویکری» رشد سریع انتشارات و بررسی روشهای نمایه سازی در کتابداری بود. به تدریج بر حجم این تلاش ها افزوده شد تا این که در دهه 1970 تحقیقات گسترده ای به روی بانکهای اطلاعاتی و سیستم های خودکار پیوسته صورت گرفت. در طول دهه 1980 استفاده از نظام های بازیابی اطلاعات در دو جنبه گسترش پیدا کرد. جنبه اول گسترش نظامهای تمام متن بود (تا قبل از این دهه در بازیابی اطلاعات فقط از نمایه ها و چکیده ها استفاده می‌شد).

جنبه دوم گسترش نظامهای پیوسته مورد استفاده غیرمتخصصان بود. در دهه 1990 حجم منابع ذخیره اطلاعات رایانه ای افزایش یافت، تصاویر به همراه اطلاعات ارائه شده و راه نمایش اطلاعات به گونه ای متفاوت تعقیب گردید. تحول مهمی که در این دهه به وقوع پیوست ظهور اینترنت بود. تا قبل از این تحول تعداد ناشران اطلاعاتی بسیار محدود بود ولی در حال حاضر افراد زیادی در سرتاسر جهان اطلاعات مربوط به خود را تولید و دسته بندی می کنند و از طریق صفحات خانگی، آنها را در اختیار دیگران قرار می دهند، امروزه حجم انبوه اطلاعات به خصوص اطلاعات موجود بر روی شبکه جهانی وب موجب ظهور جنبه های جدیدی در بازیابی اطلاعات گردیده است.

 

زبان نمایه سازی  (Indexing  Language)

زبان نمایه سازی در نظام‌های اطلاع رسانی به زبان ساختگی و قراردادی اطلاق می‌شود که برای مقاصد نمایه سازی به ویژه قابلیت بازیابی اطلاعات و مدارک به کار گرفته می شود. به طور کلی زبان نمایه سازی، استانداردی را مهیا می کند که هم نمایه ساز و هم جستجوگر می توانند از آن استفاده کنند.

از طریق زبان نمایه سازی، نمایه ساز و جستجوگر می توانند مفاهیم را به یک صورت به کار برند. از آنجایی که زبانهای نمایه سازی هم در نمایه سازی مدارک و هم در امر جستجوی مدارک به کار می‌روند به زبان های بازیابی نیز معروفند.

نمایه سازی دارای زبان های مختلفی است این زبانها عبارتند از:

·          زبان طبیعی      National   Language

نوعی نمایه سازی است که از زبان مدارک استفاده می شود. در این روش هر اصطلاح یا واژه ای که در مدرک آمده است، می تواند برای نمایه در نظر گرفته شود. خصوصیت بارز نمایه سازی به زبان طبیعی، فقدان یک واژگان کنترل شده است. این خصوصیت باعث تنوع زبان طبیعی در نمایه سازی شده است.

·          زبان آزاد Free  Language    

نمایه سازی به زبان آزاد عبارت است از نمایه سازی که در آن هر واژه ای که بتواند موضوع مدرک را خوب توصیف کند به عنوان اصطلاح نمایه برگزیده می شود. خواه به وسیله پدیدآورنده مدرک به کار رفته باشد و یا به کار نرفته باشد. در این روش محدودیتی برای واژه‌هایی که می تواند در فرایند نمایه سازی به کار رود، وجود ندارد. این روش می تواند توسط انسان و یا رایانه انجام گیرد.

·          زبان کنترل شده (مقید)     Controlled  Language

در این گونه نمایه سازی معمولاً فهرستی مستند، مشخص کننده اطلاعاتی است که ممکن است به موضوعات نسبت داده شود؛ به بیان دیگر در نمایه سازی به زبان کنترل شده، شخص اصطلاحات یا واژه هایی از یک فهرست واژگان را براساس تفسیر ذهنی که از مفاهیم مندرج در مدرک دارد به مدرک اختصاص می دهد.

 

سیستم های نمایه سازی ( Indexing  Systems)

سیستم های نمایه سازی وسایلی هستند که به وسیله آنها از یک زبان نمایه‌ای برای ایجاد نمایه یا سایر ابزارهای تجسسی استفاده می‌شود. بنابراین به مجموعه ای از رویه های مقرر که برای سازماندهی محتوای رکوردها به منظور بازیابی و اشاعه اطلاعات، مورد استفاده قرار می‌گیرد سیستم نمایه سازی گفته می شود. پس همارایی و پیش همارایی دو سیستم اساسی نمایه سازی به شمار می رود.

·          نمایه سازی همارا  Co – Ordinate  Indexing

نمایه سازی همارا به شیوه ای از نمایه سازی گفته می شود که در آن محتوای موضوعی هر مدرک با بیش از یک شناسه یا اصطلاح تعیین و توصیف می شود و رابطه بین اصطلاح‌ها به وسیله جور کردن و ترکیب واژه‌های منفرد معین می‌شود.

·          نمایه سازی پس همارا  Co – Ordinate  Indexing Post

شیوه ای از نمایه سازی که در آن نمایه ساز، سرشناسه ها را از مفاهیم بسیار ساده انتخاب می کند و تعدادی شناسه زیر هر یک اضافه می نماید و نیز تدابیری برای پیوستن آنها به یکدیگر به دست می دهد تا به وسیله آنها جوینده بتواند موضوع مدرک موردنظر خود را بیابد. به عبارت دیگر پس همارایی اشاره به عملی می کند که بعد از روند نمایه سازی انجام می شود و مربوط به همارایی دو یا چند اصطلاح برای ساختن مفهوم موردنظر در مراحل بازیابی است.

·          نمایه سازی پیش همارا  Co – Ordinate  Indexing Per

هرگاه بین دو یا چند جزء به طور تصنعی و ساختگی، پیوند برقرار کنیم به این عمل و نوع آن، نمایه پیش همارا گویند. به عبارت دیگر در نمایه سازی پیش همارا، ترکیب یا همارایی عناصر تشکیل‌دهنده موضوع مورد جستجو در هنگام نمایه سازی و به عبارتی پیش از بازیابی صورت می‌گیرد.

 

انواع نمایه سازی  ( Indexing  Kinds)

روشهای گوناگونی جهت نمایه سازی وجود دارد که در ذیل به اختصار به خصوصیات هر یک از این روشها اشاره می‌گردد:

·          نمایه سازی استخراجی (اشتقاقی)    Extraction  Indexing

در نمایه سازی از طریق استخراج، از واژگان و عباراتی که واقعاً در مدرک وجود دارند برای بیان محتوای موضوعی همان مدرک استفاده می شود. در این نوع نمایه سازی که به آن نمایه سازی «اشتقاقی» نیز می‌گویند، بیان‌های منتقل کننده معنا از متون استخراج شده با تغییرات کمی وارد فایل جستجو می شوند. این تغییرات جزئی عبارتند از: جمع و مفرد کردن، نرمال سازی، جایگزین کردن واژه هایی به جای فعل و از این قبیل تغییرات.

·          نمایه سازی انتسابی (تخصیصی)    Assignment  Indexing

این نوع از نمایه سازی، مستلزم اختصاص اصطلاحات به مدرک از منبعی غیر از خود آن مدرک است. بنابراین اطلاعات می توانند از ذهن نمایه ساز نشأت گرفته باشند. عموماً «نمایه سازی تخصیصی»  مستلزم تلاش برای ارائه محتوای موضوعی با استفاده از اصطلاحاتی است که از نوعی واژگان کنترل شده استخراج می‌شوند.

·          نمایه سازی کنترل شده  Controlled  Indexing

استفاده از واژگان کنترل شده بدین معناست که نمایه سازان محدود به استفاده از توصیفگرهایی هستند که در واژگان مربوط وجود دارد. به عبارت دیگر واژگان کنترل شده شامل توصیفگرهایی است که مجاز شناخته شده اند، به کارگیری واژگان کنترل شده باعث می شود تا از طریق کنترل مترادفات بیانهای زبان طبیعی کاهش یافته و بالطبع قابلیت پیش بینی تا حد زیادی افزایش یابد. به طور کلی نمایه سازان در این روش فقط اصطلاحاتی را به مدرک اختصاص می دهند که در فهرستی که شرکت محل کار برای آنان تهیه کرده وجود داشته باشد.

·          نمایه سازی اجباری (توکیلی یا حکمی)  Mandatory  Indexing

یکی از راههای تکمیل و رفع نقص از نمایه سازی کنترل شده این است که نمایه ساز مجبور است توصیفگرهایی از واژگان زبان نمایه را انتخاب کند که به صورتی اخص و دقیق نشانگر مفاهیم و موضوع مدرک موردنظر هستند. در چنین حالتی جستجوگر، مدارکی با مانعیت (precise) کامل را بازیابی خواهد کرد. تنها در چنین شرایطی است که توصیفگرهای انتخابی نمایه ساز و جستجوگر، با یکدیگر منطبق شده و سازگار هستند و افت اطلاعات نخواهیم داشت. به عبارت دیگر در این نوع نمایه سازی، از نمایه ساز خواسته می شود که در همه حال از «قانون کاتر» تبعیت کند، یعنی مناسب‌ترین و اخص‌ترین توصیفگرها را از واژگان نمایه سازی انتخاب کند.

·          نمایه سازی آزاد  Free  Indexing

در نمایه سازی آزاد، نمایه ساز هر اصطلاحی را که به ذهنش برسد و آن را برای توصیف متن مناسب بداند، استفاده می کند و آن را به متن منتسب می کند. در عمل، نمایه سازی آزاد منتهی به نمایه سازی استخراجی می شود.

·          نمایه سازی سازگار  Consistent  Indexing

در نمایه سازی هنگامی که حاصل کار دو نمایه ساز از کاری یکسان، متفاوت باشد معلوم می‌شود که اشتباهی رخ داده و ناسازگاری وجود دارد. اما واقعیت امر این است که در یک نظام اطلاع‌رسانی، اگر مدرکی واحد توسط چندین نفر و با روشهای مختلف نمایه سازی شوند نباید انتظار داشت که بتوان آن را سازگار نموده و همه را بازیابی کرد.

·          نمایه سازی ترکیبی (مختلط)  Synthetic  Indexing

با نگاهی به انواع روشهای نمایه سازی متوجه می شویم که نمایه سازی آزاد و اجباری، دارای نقاط قوت و ضعفی هستند که اگر درست و به جا با یکدیگر ادغام شوند، بسیار کارآمد و مؤثر خواهند بود. با وجود اینکه نمایه سازی اجباری در مقایسه با دیگر روشها دارای امتیازات بیشتری است ولی به دلیل فقدان اخص سازی و واژگانی از این نظر ناقص است. ولی با ادغام نمایه سازی آزاد که دارای ویژگی اخص سازی واژگانی است، نقاط ضعف هر دو نوع نمایه سازی رفع شده و یک نوع نمایه سازی کارآمد و مؤثر به وجود می‌آید.

·          چشم پوشی از نمایه سازی (نظام های اطلاع رسانی متن کامل)

به دلیل مشکلات و سختی انواع نمایه سازی، اغلب ترجیح می دهند که بدون دخالت انسان متون اصلی را ذخیره کنند. در این صورت انتقال معنایی لغات متن است که مورد جستجو قرار می‌گیرد. چنین نظامهایی ارزان و سریع هستند و با استفاده از روش خواندن ماشینی متون می توان به سادگی به همه اطلاعات دسترسی پیدا کرد.

 

مراحل نمایه سازی (  Indexing Process)

با جمع بندی نظرات مختلف در این خصوص می توان مراحل نمایه سازی را در پنج بخش عنوان نمود:

·          آشنایی و شناخت

اولین قدم در تهیه فهرستی مناسب از توصیفگرهای یک مدرک، آشنایی با محتوای مدرک است. نمایه ساز باید از محتوای مدرک آگاهی داشته باشد. تنها تفاوت نمایه سازی با چکیده‌نویسی این است که نمایه ساز بر خلاف چکیده‌نویس، لزومی ندارد از تمام ریزه کاری‌های مدرک اطلاع‌ پیدا کند. آنچه که دانستن آن برای نمایه ساز واجب است، اطلاع از ساختار محتوایی مدرک و مطالب تازه‌ای است که مدرک در مورد آن خلق شده است.

·          تجزیه و تحلیل

تحلیل دومین مرحله، قبل از انتخاب واژه های موضوعی را تشکیل می دهد. تحلیل انسانی یک مدرک و تصمیم‌گیری پیرامون این که کدام موضوع‌ها از نظر نمایه سازی به قدر کافی با اهمیت می‌باشند، بسیار مشکل است. بعضی از مشخصه های این فرآیند را می توان مشخص کرد. اما به روی هم طی این مرحله تا حدود زیادی به تجربه و قدرت کافی بستگی دارد. هر مدرک یک یا چند موضوع اصلی دارد. واضح است که این موضوع‌ها حتماً باید نمایه شوند، اما نمایه سازی موضوع‌های فرعی مدرک تا حد زیادی بستگی به سیاست واحد نمایه سازی با استفاده ای دارد که در پایان کار از نمایه ها می شود.

باید به این نکته اشاره کرد که اصولاً مفاهیم نمایه می شوند، نه واژه هایی که پدیدآورنده مدرک به وسیله آنها، این مفاهیم را ارائه کرده است، زیرا پدیدآورنده ممکن است زبانی مبهم، تخصصی، عامیانه، سنگین و یا غیر قابل قبول به کار برده باشد.

·          تشخیص اطاعات قابل نمایه شدن

نخستین قاعده، وفادار ماندن به مدرک است. این قاعده ممکن است بدیهی نماید، اما عدم توجه به آن نمایه ساز را در عوض کردن محتوای واقعی مدرک، به دام نمایه کردن اشارت ضمنی، کاربردهای سطحی، موارد پیشنهادی، راهنمایی‌های مربوط به آینده و جز آن می اندازد.

نمایه ساز باید همواره این نکته را مدنظر قرار دهد که اصولاً مفاهیم نمایه می‌شوند، نه واژه‌هایی که مؤلف به وسیله آنها این مفاهیم را ارائه کرده است. نمایه ساز نباید خود را درگیر محض نمایه‌سازی واژه ها کند، بلکه باید ابتدا مفهوم و معنایی را که در بطن واژه ها نهفته است پیدا کند و سپس اصطلاحاتی را که نظام برای آن مفاهیم طرح ریزی کرده است، به عنوان معادل آنها برگزیند.

بنابراین می توان نتیجه گرفت، اقلام اطلاعاتی از نظر ذخیره و بازیابی آن چنان باید از متن مدرک بیرون کشیده شود که نمایه ساز اگر خود را به جای استفاده کننده از آن اطلاعات بگذارد، واقعاً انتظار آن را داشته باشد که مدرک نمایه شده از هر نظر پاسخگوی نیازهای او باشد.

 

·          تبدیل مفاهیم به اصطلاحات نمایه یا ترجمه و انتقال مفاهیم قابل نمایه شدن به اصطلاحات پذیرفته شده

وقتی که تحلیل مقدماتی مدرک تمام شد، نمایه ساز شروع به برگزیدن واژه هایی می کند که باید در نمایه نامه بیاید. این واژه ها در زبان مقید نمایه‌سازی باید از میان واژه های معینی انتخاب شود، بهتر است که واژه ها و مفاهیمی که در نتیجه بررسی و مطالعه مدرک استخراج شده است با اصطلاحنامه‌ای که در همان زمینه است مقایسه گردد.

نمایه ساز ناگزیر از جستجو در اصطلاحنامه است و طبیعی است که باید در جستجوی توصیفگرهایی باشد که بتوانند مفهوم اطلاعات را به خوبی و روشنی القاء کنند. در این جستجو باید اصطلاحات وابسته موجود در هر شناسة اصطلاحنامه مورد بررسی قرار گیرد.

وقتی سیاهه توصیفگرهای گزیده شده کامل گردید، لازم است که نمایه ساز دو یا چند تا از آنها را با هم هماراسته کند تا ببیند مفهومی که از آن حاصل می شود دقیقاً در مدرک هست یا خیر؟ در واقع هدف این است که از بازیابی مدارک بی‌ربط با موضوع، جلوگیری شود. تجربه نشان داده است که هر چه بازیابی تحت همارایی توصیفگرهای اخص انجام شود، ارتباط موضوعی مدارک بازیابی شده بیشتر و دقیق‌تر است.

برای دسترسی به خاص‌ترین توصیفگر مناسب در اصطلاحنامه، نمایه ساز باید همواره خود را عادت دهد به اینکه هنگامی که در مورد گزینش یک توصیفگر تأمل می‌کند، اطلاعات مربوط به آن را که در اصطلاحنامه آمده است به دقت مطالعه کند و اصطلاحات اخص مشترک با آن را بررسی نماید تا شاید یکی از آنها برای مفهوم مورد نظر مناسب‌تر باشد.

 

مقایسه نمایه سازی با چکیده نویسی و فهرست نویسی

چکیده نویسی و فهرست نویسی از راههای دیگر سازماندهی و بازیابی اطلاعات می‌باشند که سهم به سزایی در ارتباطات و جریان اطلاعات دارند. بر این اساس مناسب است که ابتدا آشنایی مختصری با این مفاهیم پیدا نموده و در ادامه ضمن مقایسه نمایه سازی با چکیده نویسی و فهرست‌نویسی از وجوه اشتراک و افتراق میان آنها مطلع گردیم.

 

·          چکیده نویسی    Abstracting

چکیده نویسی شامل یک رشته عملیات زنجیره ای است که طی آن ساختارهای صورت و معنای مدارک تحلیل و سپس با حفظ عمق معنا به صورتی کوتاه تبیین می‌شود.

·          فهرست نویسی   Cataloging

فهرست نویسی در علم کتابداری چنین تعریف می شود: «فهرست نویسی به مجموعه مراحلی گفته می‌شود که طبق روش خاصی مشخصات کتابها را جهت تهیه فهرست و استفاده چه به صورت کتابی و چه در برگه دان ثبت می‌کند».

·          ارتباط بین نمایه سازی ، چکیده نویسی و فهرست نویسی

نمایه سازی، فهرست نویسی و چکیده نویسی، از جمله عوامل اصلی در عرضه اطلاعات به شمار می‌روند. در عصر دسترسی کامپیوتری به متون کامل، باز هم نمی توان ادعا کرد که مرزهای بین نمایه سازی، چکیده نویسی و فهرست نویسی در حال از بین رفتن است. در بیان وجوه اشتراک نمایه سازی با چکیده نویسی و فهرست نویسی باید گفت انتخاب جوهره متن فصل مشترک چکیده‌نویسی و نمایه سازی بوده و تحلیل محتوا وجه اشتراک نمایه سازی با فهرست‌ نویسی می‌باشد.

·          تفاوت نمایه سازی و فهرست نویسی

تحلیل محتوا وجه اشتراک نمایه سازی و فهرست نویسی است با این تفاوت که در فهرست نویسی تنها موضوع اصلی مدرک مدنظر است، اما در نمایه سازی تحلیل محتوا عمیق‌تر از فهرست‌نویسی انجام می شود و موضوعات فرعی مدرک نیز مورد بررسی قرار می‌گیرد.

·          تفاوت نمایه سازی و چکیده نویسی

1-  در  چکیده نویسی جوهره متن باید به صورتی مختصر و واضح عبارت بندی شود در صورتی که در نمایه سازی قابلیت پیش بینی جوهره متن اساس کار است.

2-  در چکیده نویسی چندگانگی میان زبان طبیعی نقش حساسی ندارد و تمامی بیان‌های یک مفهوم به شرطی که برای همگان قابل درک باشد، پذیرفته است.

3-  در چکیده، بیان های تفسیری نه تنها مانعی برای خواننده چکیده به حساب نمی آید بلکه در بعضی موارد اگر بیان تفسیری از وضوح بیشتری برخوردار باشد نسبت به بیان لغوی ارجحیت دارند در صورتی که در نمایه سازی بیانهای تفسیری برای جستجوگر مانع به حساب می‌آیند، زیرا قابلیت پیش بینی را کاهش می دهند.

4-  مجموعه ای از اصطلاحات نمایه ای را به آن نحو که در نمایه به کار می بریم در چکیده نمی توان به کار برد. مثلاً مجموعه توصیفگرهای «آب»، «هوا»، «خنک‌کنندگی» و «تصفیه» که به نحوی خاص ظاهر می شوند را نمی توان در چکیده به کار برد ولی نحوه واژه بندی این توصیفگرها در چکیده به صورتی است که می توان مفاهیم موردنظر را درک کرد.

5-  ابهام زبان نیز در چکیده نویسی مانعی به حساب نمی آید زیرا علاوه بر دسترسی به محتوای متن خواننده با زمینه موضوع نیز از قبل آشناست. در کل می توان گفت چندگانگی و ابهام بیان زبان طبیعی مانعی برای استفاده از چکیده به حساب نمی آید و این درست برعکس حالتی است که در نمایه ها صادق است.

 


نوشته شده در تاريخ چهارشنبه ٥ تیر ۱۳۸٧ توسط نمایه

نمایه و نمایه‌سازی

طبق استاندارد نمایه‌سازی بریتانیا، نمایه سیاهه نظام یافته مدخل‌هایی است که به منظور کمک به استفاده کنندگان در جایابی اطلاعات یک مدرک ساخته می‌شود. در زبان فارسی امروز واژه نمایه توسط فرهنگستان زبان و ادب پارسی معادل واژه انگلیسی "Index" انتخاب شده است. واژه "Index" در اصل از واژه لاتینی "Indicate" به معنای نشان دادن و خاطر نشان کردن مشتق شده است (نوروزی، ۱۳۸۰). به عبارت دیگر نمایه، فهرستی از موضوع‌ها و واژه‌های مهم، اساسی، نام‌ها و دیگر مطالب یک یا چند کتاب، مقاله‌های مجله‌ها یا سایر منابع اطلاعاتی با ارجاع جاینما به منابع یا صفحه‌های آنهاست که این مطالب در آنها واقع شده است. در واقع نمایه خط ارتباطی بین منابع اطلاعاتی و استفاده کننده یا کاربر است. نخستین گام در تعیین موضوع مدرک، شناخت نوع و دامنه مطالب مدرک و تحلیل موضوعی آن توسط نمایه‌ساز است. هدف از تحلیل موضوعی مدرک اصولاً گزینش و تخصیص اصطلاحات موضوعی متناسب با مدارک است که محتوای موضوعی مدرک را بیان نماید. مفاهیم مربوط به هر مدرک معمولاً بین ۱۰ تا ۲۰ واژه یا عبارت را شامل می‌شود که امکان ترتیب آنها در قالب سرعنوان‌های موضوعی همواره به اشکال مواجه بوده است که تنها راه جبران این نقیصه جانشین کردن واژه‌های ترکیبی با تکواژه‌ها است. سرعنوان‌های موضوعی هم به عنوان زبان نمایه سازی عمل می‌کند و هم به عنوان زبان بازیابی برای کاربرانی که قصد دارند منابعی در حوزهای موضوعی خاص بازیابی نمایند.

نمایه‌سازی

طبق استاندارد ایزو ۵۹۶۳، عمل توصیف یا شناسایی محتوای موضوعی یک مدرک را نمایه‌سازی گویند. در واقع، ثبت و ضبط محتوای اطلاعاتی مدارک با استفاده از روشهای گوناگون به منظور سازماندهی اطلاعات به قصد سهولت بازیابی را نمایه‌سازی گویند (نوروزی، ۱۳۸۰). به عبارت دیگر، نمایه‌سازی یعنی تخصیص واژه‌ها یا اصطلاحات به مدارک به منظور توصیف محتوای موضوعی آنها برای بازیابی در مراحل بعد. هدف نمایه‌سازی اصولاً آماده کردن مدرک برای بازیابی است.

مراحل نمایه‌سازی: ۱. تعیین موضوع مدرک ۲. بازنمود مفاهیم مدرک به کمک توصیفگرهای اصطلاحنامه ۳. ثبت و ضبط اطلاعات ۴. بازبینی نهایی (سن ویل، ۲۵۳۶).

با توجه به نوع مدرک و نحوه ترکیب کلیدواژه‌ها، نمایه‌سازی به دسته‌های مختلف تقسیم می‌شود:

نمایه‌سازی کتاب

نمایه کتاب سیاهه نظام یافته‌ای است از واژه‌ها و مفاهیم موضوعی، نامهای اشخاص، عنوان کتابها و مدارک استناد شده، نامهای جغرافیایی و دیگر مطالب مهم یک یا چند کتاب با ارجاع به صفحاتی که محل اطلاعات موردنظر را نشان می‌‌دهند که معمولاً در پایان کتاب قرار می‌گیرد (نوروزی، ۱۳۸۰). اصطلاح نمایه کتاب معادل "Back-of-the-Book (BOB) Index" انتخاب شده است. نمایه راه ورود و دست یابی به اطلاعات و از ساده ترین، کارآمدترین و ضروری‌ترین ابزارهای اطلاعاتی است. تفاوت نمایه با فهرست مندرجات در این است که فهرست مندرجات، طرح و نقشه دلخواه مؤلف از کتاب است که قصد دارد موضوع و محتوای آن را در جالبترین و دقیقترین شیوه معرفی کند، اما نمایه، طرح و نقشه نمایه‌ساز از اطلاعات ارائه شده توسط مؤلف است که مطالب اثر را با بهترین روش نشان می‌‌دهد. فهرست مندرجات بر اساس توالی حضور مطالب متن اصلی مرتب می‌شود حال آن که نمایه کتاب معمولاً بر اساس نظم الفبایی مرتب می‌شود. در واقع، فهرست مندرجات تجلی حرکت اندیشه مؤلف است. کتاب بدون نمایه، همانند شهری بدون راهنماست، گرچه فهرست مندرجات طرح کلی رؤوس مطالب کتاب را ارائه می‌کند، ولی نمی‌تواند اصطلاحات اخصّ را نشان دهد و جایگزین نمایه شود (نوروزی، ۱۳۸۰).

·                     نمایه‌سازی نشریات ادواری

·                     نمایه‌سازی اینترنت و وب

·                     نمایه‌سازی همارا

·                     نمایه‌سازی آزاد

·                     نمایه‌سازی کلیدواژه ای

·                     نمایه‌سازی درون‌بافتی و برون‌بافتی

·                     نمایه‌سازی گردان

 

نمایه‌سازی همآرا

 روش ویژه‌ای در نمایه‌سازی مدارک است که در آن، به هنگام بازیابی در مراحل بعد، از ترکیب یا در واقع از همارایی اصطلاحات از پیش تخصیص یافته استفاده می‌‌شود و عمدتاً بر مبنای نظریه مجموعه‌ها و منطق بول بوجود آمده است.

تاریخچه

افزایش سریع حجم اطلاعات بویژه پس از جنگ جهانی دوم موجب پیدایش یک روش جدید نمایه سازی بنام نمایه سازی همارا شد. در سال ۱۹۵۲ شخصی بنام دکتر مورتیمر تاب (Mortimer Taube) که تصدی مقامی را در مرکز اسناد وزارت دفاع آمریکا بر عهده داشت، روش نمایه سازی همارا را برای بررسی گزارشهای نظامی و مدارک دیگر ابداع کرد.

تاب دریافت که اگر درگرگونی جدیدی در تجزیه و تحلیل مدارک ایجاد کند به بعد تازه‌ای دست می‌‌یابد و آن، جایگزین کردن مفهوم حقیقی هر مدرک در جای قالب موضوعی است که بر مفهوم حقیقی مدرک تحمیل شده است. وی در سیستم خود از تکواژه‌ها یا واژه‌هایی که بیانگر یک مفهوم بودند، استفاده کرد.

فرض بر این است که محتوای مدارک را می‌‌توان در قالب چند مفهوم اصلی ریخت و مفاهیم بدست آمده را به کمک تکواژه‌ها بیان کرد. مدارک رسیده به جای آنکه بر پایه یک فهرست از پیش ساخته و مرکب از سرعنوانهای موضوعی تجزیه و تحلیل شوند یا مفاهیم واقعی مدارک در قالب داده‌های موضوعی از پیش ساخته بیان شود، بر اساس شناخت نمایه‌ساز یا متخصص موضوعی دیگری که مفاهیم مدارک را تجزیه و تحلیل می‌‌کند، استوار می‌‌شود. از این روی نیاز به فهرستهای از پیش ساخته نیست، بلکه قالب‌های مفاهیم به تدریج ساخته می‌‌شوند و زمینه‌ای قرار می‌‌گیرند برای انتخاب و وضع اصطلاحات دیگر.

مطابق این سیستم مدارکی که باید نمایه شود، اول به ترتیب خاصی شماره‌گذاری می‌‌شود و آنگاه مورد بررسی قرار می‌‌گیرد و موضوع آن بطور متوسط با حدود ۷ تا ۱۵ تکواژه توصیف می‌‌شود. سپس زیر هر تکواژه شماره ثبت مدرک قید می‌‌گردد. کسی که بخواهد موضوعی چند واژه‌ای را جستجو نماید باید تمام تکواژه‌های مربوط به موضوعش را پیدا کند و شماره‌های ثبت مدارک را باهم منطبق نماید. مدارکی که شماره آنها زیر تمام تکواژه‌ها ثبت شده باشد، مدارک مربوط به موضوع مورد نظر جوینده می‌‌باشند. بنابراین مرحله انطباق یا همارایی تکواژه‌ها در مرحله جستجو صورت می‌‌گیرد. وجه تسمیه این روش نمایه‌سازی هم ظاهراً در همین خاصیت همارایی است.

پس‌همارا و پیش همارا

نمایه سازی پس همارا شیوه‌ای از نمایه سازی برای منابع و مدارک کتابخانه‌ای است که در آن نمایه ساز سرشناسه‌ها را از مفاهیم بسیار ساده انتخاب می‌‌کند و تعدادی شناسه نیز زیر هر یک اضافه می‌‌نماید و نیز تدابیری برای پیوستن آنها با یکدیگر به دست می‌‌دهد تا به وسیله آنها جوینده بتواند موضوع مرکب مورد نظر خود را بیابد. پیکابو و نمایه‌سازی تک‌واژه‌ای از این نوع است.

نمایه سازی پیش همارا نظامی است که در آن واژه‌ها در زمان نمایه سازی مدرک با هم ترکیب می‌‌شوند و این ترکیب در سر عنوانها نشان داده می‌‌شود. این شیوه در نظام نمایه‌سازی پرسی به کار برده شده است و در کتابشناسی ملی انگلیس از آن استفاده می‌‌کنند.

نظریه مجموعه‌ها

معرفی

نظریه مجموعه‌ها ، سنگ اساسی بنای ریاضیات جدید است. تعریفهای دقیق جمیع مفاهیم ریاضی ، مبتنی بر نظریه مجموعه‌هاست. گذشته از این روشهای استنتاج ریاضی، با استفاده از ترکیبی از استدلالهای منطقی و مجموعه- نظری تنظیم شده‌اند. زبان نظریه مجموعه‌ها ، زبان مشترکی است که ریاضیدانان منطقی در سراسر دنیا با آن صحبت کرده و آن را درک می‌کنند. چنان که اگر کسی بخواهد پیشرفتی در ریاضیات عالی یا کاربردهای عملی آن داشته باشد، باید مفاهیم اساسی و نتایج نظریه مجموعه‌ها و زبانی که در آن بیان شده‌اند، آشنا شود. !تاریخچه نظریه مجموعه‌ها نظریه مجموعه‌ها در اواخر قرن نوزدهم به طور عمده توسط جرج کانتوربنیان گذاشته شد. زمانی که کانتور مفاهیم و استدلالهای جدید و متهورانه خود را منتشر کرد، اهمیت آنها تنها توسط تعداد کمی از ریاضیدانان بزرگ درک شد. اما این نظریه در توسعه بعدی‌اش ، تقریبا در تمام شاخه‌های ریاضیات نفوذ کرد و تاثیری عمیق بر گسترش آنها داشت. بطوری که حتی باعث تغییر نظریه‌های تثبیت شده گردید و ریاضیدانان سعی کردند مفاهیم ریاضی را بر اساس نظریه مجموعه‌ها تعریف کنند به عنوان مثال می‌توان از تعریف اعداد طبیعی توسط پئانو اشاره کرد. همچنین توسعه بعضی از نظامهای ریاضی ، از قبیل توپولوژی، اساساً به ابزار نظریه مجموعه‌ها وابسته است. از اینها مهمتر ، نظریه مجموعه‌ها نیرویی متحد کننده بدست داد که به تمام شاخه‌های ریاضیات مبنای مشترک و مفاهیم آنها ، وضوح و دقتی تازه بخشیده است.

هنگامی که می‌خواهیم با مجموعه‌های آشنا شویم می‌توانیم آنها را به سه صورت مورد بررسی قرار دهیم. مطالعه مجموعه‌ها به کلی و آشنایی عمومی با آنها که هر کس که می‌خواهد وارد علوم پایه را مورد مطالعه قرار دهد باید این آشنایی را کسب کند، مطالعه مجموعه‌ها به طور طبیعی و مطالعه مجموعه‌ها به صورت اصل موضوعی. در نظریه مجموعه‌ها دو واژه طبیعی و اصل موضوعی دو واژه متضاد هم می‌باشند.

نظریه طبیعی مجموعه‌ها

مطالعه مجموعه‌ها به صورتی طبیعی به عنوان نظریه طبیعی مجموعه‌ها یا Naive set theory است و این همان نظریه‌ای است که در آغاز پیدایش نظریه مجموعه‌ها توسط جرج کانتور مطرح گردید. اما در ادامه این نظریه درگیر اشکالات و پارادکس‌هایی همچون پارادکس راسل شد، و به این ترتیب نیاز به یک تغییر در نظریه مجموعه ها احساس شد و به این ترتیب ریاضیدانانی چون ارنست تسرملو سعی کردند نظریه مجموعه‌ها را در قالب یک دستگاه اصل موضوعی ارایه کنند که این به ایجاد نظریه اصل موضوعی مجموعه‌ها یا Axiomatic set theory انجامید.

نظریه اصل موضوعی مجموعه‌ها

در نظریه اصل موضوعی مجموعه ها، مجموعه به عنوان یک مفهوم اولیه و تعریف نشده در نظر گرفته شده و با چند اصل موضوع به برسی خواص مجموعه‌ها پرداخته می‌شود. هدف این نظریه جلوگیری از پارادکس های نظریه مجموعه ها است.

·                     اصول مورد بررسی این نظریه عبارتند از:

o                                اصل موضوع گسترش

o                                اصل موضوع تصریح

o                                اصل موضوع مجموعه تهی

o                                اصل موضوع زوج سازی

o                                اصل موضوع اجتماع

o                                اصل موضوع مجموعه توانی

o                                اصل موضوع انتخاب

o                                اصل موضوع ترتیب

o                                اصل موضوع جایگزینی

 

منابع

·                     آقابخشی، علی."نمایه سازی همارا".تهران:مرکز اطلاعات و مدارک علمی ایران، ۱۳۷۶.ص۶ - ۵.

·                     سلطانی، پوری. راستین، فروردین. "داتشنامه کتابداری و اطلاع رسانی". تهران:فرهنگ معاصر. ص ۴۲۸-۹.

·                     سن ویل، دومینیک (۲۵۳۶). راهنمای نمایه‌سازی مدارک و گسترش اصطلاحنامه توسعه فرهنگی در کشورهای آسیا. عبدالحسین آذرنگ. تهران: مرکز اسناد فرهنگی آسیا.

·                     نوروزی، علیرضا (۱۳۸۰). نمایه‌سازی کتاب. تهران: چاپار.


نوشته شده در تاريخ چهارشنبه ٥ تیر ۱۳۸٧ توسط پرشین بلاگ
بنام خدا

كاربر گرامي

با سلام و احترام

پيوستن شما را به خانواده بزرگ وبلاگنويسان فارسي خوش آمد ميگوييم.
شما ميتوانيد براي آشنايي بيشتر با خدمات سايت به آدرس هاي زير مراجعه كنيد:

http://help.persianblog.ir براي راهنمايي و آموزش
http://news.persianblog.ir اخبار سايت براي اطلاع از
http://fans.persianblog.ir براي همكاري داوطلبانه در وبلاگستان
http://persianblog.ir/ourteam.aspx اسامي و لينك وبلاگ هاي تيم مديران سايت

در صورت بروز هر گونه مشكل در استفاده از خدمات سايت ميتوانيد با پست الكترونيكي :
support[at]persianblog.ir

و در صورت مشاهده تخلف با آدرس الكترونيكي
abuse[at]persianblog.ir
تماس حاصل فرماييد.

همچنين پيشنهاد ميكنيم با عضويت در جامعه مجازي ماي پرديس از خدمات اين سايت ارزشمند استفاده كنيد:
http://mypardis.com


با تشكر

مدير گروه سايتهاي پرشين بلاگ
مهدي بوترابي

http://ariagostar.com
.: Weblog Themes By Pichak :.





تمامی حقوق این وبلاگ محفوظ است | طراحی : پیچک
فال حافظقالب وبلاگقالب وبلاگگالری عکسفاگالری عکس آلامتو